| Abstract |
Bakalaura darbā tiek pētīta izguves papildināta ģenerēšana (RAG) un tās praktiskais pielietojums sarunbota izstrādē, lai mazinātu lielo valodas modeļu (LVM) būtiskākos trūkumus, kā halucinācijas, novecojušas informācijas izmantošana un nepietiekama atbilžu uzticamība. Darba aktualitāti nosaka straujā ģeneratīvā mākslīgā intelekta attīstība un nepieciešamība uzlabot šo sistēmu kvalitāti un uzticamību. Darba mērķis ir praktiski novērtēt izstrādātā RAG arhitektūrā balstītā sarunbota sniegumu atbilstoši definētajiem kritērijiem, lai analizētu tā precizitāti, uzticamību un piemērotību praktiskai izmantošanai. Mērķa sasniegšanai tika izpētīta zinātniskā literatūra par LVM ierobežojumiem, RAG arhitektūru un RAG sistēmu novērtēšanas pieejām, definēti novērtēšanas kritēriji, izstrādāts sarunbota prototips un veikta tā testēšana, analizējot iegūtos rezultātus. Izstrādātajā prototipā ir realizēta ārējās datu kopas ielāde un sadalīšana teksta fragmentos, teksta fragmentu un lietotāja vaicājuma vektorizācija, semantiski līdzīgu fragmentu izguve no FAISS vektoru datubāzes un atbilžu ģenerēšana ar OpenAI GPT-5 mini modeli. RAG sarunbota testēšana tika veikta ar 35 jautājumu testa kopu sešos scenārijos, pārbaudot datu kopas struktūras, faila formāta, segmentēšanas parametru un izgūto teksta fragmentu skaita ietekmi uz izguves un ģenerēšanas posmu. Pētījuma rezultāti uzrāda, ka labākais sniegums tika panākts, datu kopu sadalot PDF failos pa nodaļām, iegūstot vidējo atbildes pareizību 0,914 un vidējo atbildes atbilstību 0,929.
Darba apjoms ir 51 lappuse, 8 tabulas, 4 attēli, 3 pielikumi un 37 informācijas avoti. |