| Form of studies |
Bachelor |
| Title of the study programm |
Computer Systems |
| Title in original language |
Ar izguvi paplašināta teksta ģenerēšana latviešu valodai |
| Title in English |
Retrieval Augmented Generation of Text for Latvian |
| Department |
Faculty Of Computer Science Information Tehnology And Energy |
| Scientific advisor |
Gints Jēkabsons |
| Reviewer |
Kārlis Berkolds |
| Abstract |
Bakalaura darba 1. tips: Moderno risinājumu izpēte.
Viens no lielo valodas modeļu ierobežojumiem ir atbildēšana uz jautājumiem, par kuriem modelis nav apmācīts, t.i. informācija, kas ir nepieciešama veiksmīgai jautājuma atbildei, nav bijusi iekļauta apmācības datu kopā. Ar izguvi paplašināta teksta ģenerēšanas sistēmas šo risina ar lietotāja jautājumam saistošas informācijas izgūšanu no datu kopas, kas tiek padota lielam valodas modelim kopā ar lietotāja jautājumu, lai sniegtu pilnvērtīgu atbildi uz lietotāja jautājumu, izmantojot izgūto informāciju.
Šajā bakalaura darbā tiek apskatīti lielo valodas modeļu pamatprincipi un ar izguvi paplašinātas teksta ģenerēšanas metodoloģija. Tiek eksperimentālā veidā pārbaudīti jēdzientelpu modeļi un teksta segmentēšanas metodes ar latviešu valodas tekstu, lai noteiktu modeļu un metožu precizitāti, apstrādājot tekstu latviešu valodā.
Darba rezultātā tiek noteikti labākie jēdzientelpu modeļu un teksta segmentēšanas metožu pāri, izmantošanai ar izguvi paplašināta teksta ģenerēšanas sistēmām, kurās tiek izmantota latviešu valoda.
Darbs satur 51 lapaspusi, 5 attēlus, 9 tabulas, 4 pielikumus un 74 izmantotos informācijas avotus. |
| Keywords |
DABISKĀS VALODAS APSTRĀDE, AR IZGUVI PAPLAŠINĀTA TEKSTA ĢENERĒŠANA, JĒDZIENTELPU MODEĻI, TEKSTA SEGMENTĒŠANAS METODES |
| Keywords in English |
NATURAL LANGUAGE PROCESSING, RETRIEVAL-AUGMENTED GENERATION, EMBEDDING MODELS, TEXT SEGMENTATION METHODS |
| Language |
lv |
| Year |
2025 |
| Date and time of uploading |
25.05.2025 00:33:31 |