Lielo valodas modeļu izmantošana atbildēšanai uz jautājumiem par doto tekstu latviešu valodā

Noslēguma darbu reģistrs

Noslēguma darbu meklēšana

Studiju darba apraksts

Studiju veids	bakalaura akadēmiskās studijas
Studiju programmas nosaukums	Datorsistēmas
Nosaukums	Lielo valodas modeļu izmantošana atbildēšanai uz jautājumiem par doto tekstu latviešu valodā
Nosaukums angļu valodā	Using Large Language Models to Answer Questions about Given Text Written in Latvian
Struktūrvienība	33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs	Gints Jēkabsons
Recenzents	Rūdolfs Rumba
Anotācija	Šis darbs ir par lielo valodas modeļu izpēti un to izmantošanas iespējām dabiskās valodas apstrādē. Mūsdienu digitālajā laikmetā lielie valodas modeļi ir kļuvuši par svarīgu tehnoloģiju, ko izmanto gan automātiskai teksta analīzei, gan personalizētām mācību sistēmām, tulkošanas rīkiem un citai uzdevumu izpildei. Teorētiskajā daļā detalizēti analizēta lielo valodas modeļu darbība, īpašu uzmanību pievēršot transformatoru arhitektūras pamatprincipiem – pašuzmanības mehānismam, daudzgalvu uzmanībai un pozicionālajai kodēšanai. Tāpat tiek aplūkota valodas modeļu apmācības metodoloģija, ietverot priekšapmācību, precizējošo apmācību un ar to saistītos izaicinājumus, piemēram, katastrofisko aizmirstību un datu kvalitātes nozīmi. Praktiskajā daļā tika izstrādāta pielāgota datu kopa, kurā iekļauti latviešu valodā rakstīti teksti un tiem atbilstoši jautājumi. Tika testētas dažādas uzvedņu veidošanas metodes un jautājumu veidi. Darbs parāda, ka lielie valodas modeļi, lai arī spējīgi ģenerēt atbildes, sastopas ar grūtībām, apstrādājot tekstus latviešu valodā. Eksperimentu rezultāti liecina, ka modeļu sniegums būtiski atkarīgs no jautājuma formulējuma un konteksta skaidrības. Daži modeļi spēj labi atbildēt uz vienkāršiem faktu jautājumiem, bet vājāk interpretē sarežģītākus vai netiešus jautājumus. Praktiskajā daļā veikto testu laikā tika noskaidrots, ka uzvedņu pielāgošana un teksta strukturēšana ir nozīmīgi faktori, kas ietekmē rezultātu kvalitāti. Darbā iegūtās atziņas sniedz praktiskas vadlīnijas turpmākai lielo valodas modeļu izmantošanai jautājumu atbildēšanas uzdevumos latviešu valodā un palīdz labāk izprast šo modeļu darbības īpatnības mazāk resursu valodās.
Atslēgas vārdi	Lielie valodas modeļi, atbildēšana uz jautājumiem, transformatora arhitektūra, GPT-4o, Claude 3.7 Sonnet, DeepSeek-V3, Gemini 2.0 Flash.
Atslēgas vārdi angļu valodā	Large language models, question answering, transformer architecture, GPT-4o, Claude 3.7 Sonnet, DeepSeek-V3, Gemini 2.0 Flash.
Valoda	lv
Gads	2025
Darba augšupielādes datums un laiks	25.05.2025 16:26:52