| Studiju veids |
bakalaura akadēmiskās studijas |
| Studiju programmas nosaukums |
Datorsistēmas |
| Nosaukums |
Ar izguvi paplašināta teksta ģenerēšana latviešu valodai |
| Nosaukums angļu valodā |
Retrieval Augmented Generation of Text for Latvian |
| Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
| Darba vadītājs |
Gints Jēkabsons |
| Recenzents |
Kārlis Berkolds |
| Anotācija |
Bakalaura darba 1. tips: Moderno risinājumu izpēte.
Viens no lielo valodas modeļu ierobežojumiem ir atbildēšana uz jautājumiem, par kuriem modelis nav apmācīts, t.i. informācija, kas ir nepieciešama veiksmīgai jautājuma atbildei, nav bijusi iekļauta apmācības datu kopā. Ar izguvi paplašināta teksta ģenerēšanas sistēmas šo risina ar lietotāja jautājumam saistošas informācijas izgūšanu no datu kopas, kas tiek padota lielam valodas modelim kopā ar lietotāja jautājumu, lai sniegtu pilnvērtīgu atbildi uz lietotāja jautājumu, izmantojot izgūto informāciju.
Šajā bakalaura darbā tiek apskatīti lielo valodas modeļu pamatprincipi un ar izguvi paplašinātas teksta ģenerēšanas metodoloģija. Tiek eksperimentālā veidā pārbaudīti jēdzientelpu modeļi un teksta segmentēšanas metodes ar latviešu valodas tekstu, lai noteiktu modeļu un metožu precizitāti, apstrādājot tekstu latviešu valodā.
Darba rezultātā tiek noteikti labākie jēdzientelpu modeļu un teksta segmentēšanas metožu pāri, izmantošanai ar izguvi paplašināta teksta ģenerēšanas sistēmām, kurās tiek izmantota latviešu valoda.
Darbs satur 51 lapaspusi, 5 attēlus, 9 tabulas, 4 pielikumus un 74 izmantotos informācijas avotus. |
| Atslēgas vārdi |
DABISKĀS VALODAS APSTRĀDE, AR IZGUVI PAPLAŠINĀTA TEKSTA ĢENERĒŠANA, JĒDZIENTELPU MODEĻI, TEKSTA SEGMENTĒŠANAS METODES |
| Atslēgas vārdi angļu valodā |
NATURAL LANGUAGE PROCESSING, RETRIEVAL-AUGMENTED GENERATION, EMBEDDING MODELS, TEXT SEGMENTATION METHODS |
| Valoda |
lv |
| Gads |
2025 |
| Darba augšupielādes datums un laiks |
25.05.2025 00:33:31 |