Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Computer Systems
Title in original language Ar izguvi paplašināta teksta ģenerēšana latviešu valodai
Title in English Retrieval Augmented Generation of Text for Latvian
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Gints Jēkabsons
Reviewer Kārlis Berkolds
Abstract Bakalaura darba 1. tips: Moderno risinājumu izpēte. Viens no lielo valodas modeļu ierobežojumiem ir atbildēšana uz jautājumiem, par kuriem modelis nav apmācīts, t.i. informācija, kas ir nepieciešama veiksmīgai jautājuma atbildei, nav bijusi iekļauta apmācības datu kopā. Ar izguvi paplašināta teksta ģenerēšanas sistēmas šo risina ar lietotāja jautājumam saistošas informācijas izgūšanu no datu kopas, kas tiek padota lielam valodas modelim kopā ar lietotāja jautājumu, lai sniegtu pilnvērtīgu atbildi uz lietotāja jautājumu, izmantojot izgūto informāciju. Šajā bakalaura darbā tiek apskatīti lielo valodas modeļu pamatprincipi un ar izguvi paplašinātas teksta ģenerēšanas metodoloģija. Tiek eksperimentālā veidā pārbaudīti jēdzientelpu modeļi un teksta segmentēšanas metodes ar latviešu valodas tekstu, lai noteiktu modeļu un metožu precizitāti, apstrādājot tekstu latviešu valodā. Darba rezultātā tiek noteikti labākie jēdzientelpu modeļu un teksta segmentēšanas metožu pāri, izmantošanai ar izguvi paplašināta teksta ģenerēšanas sistēmām, kurās tiek izmantota latviešu valoda. Darbs satur 51 lapaspusi, 5 attēlus, 9 tabulas, 4 pielikumus un 74 izmantotos informācijas avotus.
Keywords DABISKĀS VALODAS APSTRĀDE, AR IZGUVI PAPLAŠINĀTA TEKSTA ĢENERĒŠANA, JĒDZIENTELPU MODEĻI, TEKSTA SEGMENTĒŠANAS METODES
Keywords in English NATURAL LANGUAGE PROCESSING, RETRIEVAL-AUGMENTED GENERATION, EMBEDDING MODELS, TEXT SEGMENTATION METHODS
Language lv
Year 2025
Date and time of uploading 25.05.2025 00:33:31