Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Datorsistēmas
Nosaukums Ar izguvi paplašināta teksta ģenerēšana latviešu valodai
Nosaukums angļu valodā Retrieval Augmented Generation of Text for Latvian
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Gints Jēkabsons
Recenzents Kārlis Berkolds
Anotācija Bakalaura darba 1. tips: Moderno risinājumu izpēte. Viens no lielo valodas modeļu ierobežojumiem ir atbildēšana uz jautājumiem, par kuriem modelis nav apmācīts, t.i. informācija, kas ir nepieciešama veiksmīgai jautājuma atbildei, nav bijusi iekļauta apmācības datu kopā. Ar izguvi paplašināta teksta ģenerēšanas sistēmas šo risina ar lietotāja jautājumam saistošas informācijas izgūšanu no datu kopas, kas tiek padota lielam valodas modelim kopā ar lietotāja jautājumu, lai sniegtu pilnvērtīgu atbildi uz lietotāja jautājumu, izmantojot izgūto informāciju. Šajā bakalaura darbā tiek apskatīti lielo valodas modeļu pamatprincipi un ar izguvi paplašinātas teksta ģenerēšanas metodoloģija. Tiek eksperimentālā veidā pārbaudīti jēdzientelpu modeļi un teksta segmentēšanas metodes ar latviešu valodas tekstu, lai noteiktu modeļu un metožu precizitāti, apstrādājot tekstu latviešu valodā. Darba rezultātā tiek noteikti labākie jēdzientelpu modeļu un teksta segmentēšanas metožu pāri, izmantošanai ar izguvi paplašināta teksta ģenerēšanas sistēmām, kurās tiek izmantota latviešu valoda. Darbs satur 51 lapaspusi, 5 attēlus, 9 tabulas, 4 pielikumus un 74 izmantotos informācijas avotus.
Atslēgas vārdi DABISKĀS VALODAS APSTRĀDE, AR IZGUVI PAPLAŠINĀTA TEKSTA ĢENERĒŠANA, JĒDZIENTELPU MODEĻI, TEKSTA SEGMENTĒŠANAS METODES
Atslēgas vārdi angļu valodā NATURAL LANGUAGE PROCESSING, RETRIEVAL-AUGMENTED GENERATION, EMBEDDING MODELS, TEXT SEGMENTATION METHODS
Valoda lv
Gads 2025
Darba augšupielādes datums un laiks 25.05.2025 00:33:31