Development and Testing of a Retrieval-Augmented Generation (RAG) Chatbot

Graduate papers

Search graduate papers

Description of the graduate paper

Form of studies	Bachelor
Title of the study programm	Information Technology
Title in original language	Sarunbota izveide un testēšana ar izguves papildinātu ģenerēšanu (RAG)
Title in English	Development and Testing of a Retrieval-Augmented Generation (RAG) Chatbot
Department	Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor	Nadežda Zeņina
Reviewer	Artis Ābolts
Abstract	Bakalaura darbā tiek pētīta izguves papildināta ģenerēšana (RAG) un tās praktiskais pielietojums sarunbota izstrādē, lai mazinātu lielo valodas modeļu (LVM) būtiskākos trūkumus, kā halucinācijas, novecojušas informācijas izmantošana un nepietiekama atbilžu uzticamība. Darba aktualitāti nosaka straujā ģeneratīvā mākslīgā intelekta attīstība un nepieciešamība uzlabot šo sistēmu kvalitāti un uzticamību. Darba mērķis ir praktiski novērtēt izstrādātā RAG arhitektūrā balstītā sarunbota sniegumu atbilstoši definētajiem kritērijiem, lai analizētu tā precizitāti, uzticamību un piemērotību praktiskai izmantošanai. Mērķa sasniegšanai tika izpētīta zinātniskā literatūra par LVM ierobežojumiem, RAG arhitektūru un RAG sistēmu novērtēšanas pieejām, definēti novērtēšanas kritēriji, izstrādāts sarunbota prototips un veikta tā testēšana, analizējot iegūtos rezultātus. Izstrādātajā prototipā ir realizēta ārējās datu kopas ielāde un sadalīšana teksta fragmentos, teksta fragmentu un lietotāja vaicājuma vektorizācija, semantiski līdzīgu fragmentu izguve no FAISS vektoru datubāzes un atbilžu ģenerēšana ar OpenAI GPT-5 mini modeli. RAG sarunbota testēšana tika veikta ar 35 jautājumu testa kopu sešos scenārijos, pārbaudot datu kopas struktūras, faila formāta, segmentēšanas parametru un izgūto teksta fragmentu skaita ietekmi uz izguves un ģenerēšanas posmu. Pētījuma rezultāti uzrāda, ka labākais sniegums tika panākts, datu kopu sadalot PDF failos pa nodaļām, iegūstot vidējo atbildes pareizību 0,914 un vidējo atbildes atbilstību 0,929. Darba apjoms ir 51 lappuse, 8 tabulas, 4 attēli, 3 pielikumi un 37 informācijas avoti.
Keywords	RAG, LVM, RAG NOVĒRTĒJUMS
Keywords in English	RAG, LLM, RAG EVALUATION
Language	lv
Year	2026
Date and time of uploading	26.05.2026 20:38:29