| Studiju veids |
bakalaura akadēmiskās studijas |
| Studiju programmas nosaukums |
Datorsistēmas |
| Nosaukums |
Lielo valodas modeļu izmantošana atbildēšanai uz jautājumiem par doto tekstu latviešu valodā |
| Nosaukums angļu valodā |
Using Large Language Models to Answer Questions about Given Text Written in Latvian |
| Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
| Darba vadītājs |
Gints Jēkabsons |
| Recenzents |
Rūdolfs Rumba |
| Anotācija |
Šis darbs ir par lielo valodas modeļu izpēti un to izmantošanas iespējām dabiskās valodas apstrādē. Mūsdienu digitālajā laikmetā lielie valodas modeļi ir kļuvuši par svarīgu tehnoloģiju, ko izmanto gan automātiskai teksta analīzei, gan personalizētām mācību sistēmām, tulkošanas rīkiem un citai uzdevumu izpildei. Teorētiskajā daļā detalizēti analizēta lielo valodas modeļu darbība, īpašu uzmanību pievēršot transformatoru arhitektūras pamatprincipiem – pašuzmanības mehānismam, daudzgalvu uzmanībai un pozicionālajai kodēšanai. Tāpat tiek aplūkota valodas modeļu apmācības metodoloģija, ietverot priekšapmācību, precizējošo apmācību un ar to saistītos izaicinājumus, piemēram, katastrofisko aizmirstību un datu kvalitātes nozīmi. Praktiskajā daļā tika izstrādāta pielāgota datu kopa, kurā iekļauti latviešu valodā rakstīti teksti un tiem atbilstoši jautājumi. Tika testētas dažādas uzvedņu veidošanas metodes un jautājumu veidi. Darbs parāda, ka lielie valodas modeļi, lai arī spējīgi ģenerēt atbildes, sastopas ar grūtībām, apstrādājot tekstus latviešu valodā. Eksperimentu rezultāti liecina, ka modeļu sniegums būtiski atkarīgs no jautājuma formulējuma un konteksta skaidrības. Daži modeļi spēj labi atbildēt uz vienkāršiem faktu jautājumiem, bet vājāk interpretē sarežģītākus vai netiešus jautājumus. Praktiskajā daļā veikto testu laikā tika noskaidrots, ka uzvedņu pielāgošana un teksta strukturēšana ir nozīmīgi faktori, kas ietekmē rezultātu kvalitāti. Darbā iegūtās atziņas sniedz praktiskas vadlīnijas turpmākai lielo valodas modeļu izmantošanai jautājumu atbildēšanas uzdevumos latviešu valodā un palīdz labāk izprast šo modeļu darbības īpatnības mazāk resursu valodās. |
| Atslēgas vārdi |
Lielie valodas modeļi, atbildēšana uz jautājumiem, transformatora arhitektūra, GPT-4o, Claude 3.7 Sonnet, DeepSeek-V3, Gemini 2.0 Flash. |
| Atslēgas vārdi angļu valodā |
Large language models, question answering, transformer architecture, GPT-4o, Claude 3.7 Sonnet, DeepSeek-V3, Gemini 2.0 Flash. |
| Valoda |
lv |
| Gads |
2025 |
| Darba augšupielādes datums un laiks |
25.05.2025 16:26:52 |