| Form of studies |
Bachelor |
| Title of the study programm |
Computer Systems |
| Title in original language |
Lielo valodas modeļu izmantošana atbildēšanai uz jautājumiem par doto tekstu latviešu valodā |
| Title in English |
Using Large Language Models to Answer Questions about Given Text Written in Latvian |
| Department |
Faculty Of Computer Science Information Tehnology And Energy |
| Scientific advisor |
Gints Jēkabsons |
| Reviewer |
Rūdolfs Rumba |
| Abstract |
Šis darbs ir par lielo valodas modeļu izpēti un to izmantošanas iespējām dabiskās valodas apstrādē. Mūsdienu digitālajā laikmetā lielie valodas modeļi ir kļuvuši par svarīgu tehnoloģiju, ko izmanto gan automātiskai teksta analīzei, gan personalizētām mācību sistēmām, tulkošanas rīkiem un citai uzdevumu izpildei. Teorētiskajā daļā detalizēti analizēta lielo valodas modeļu darbība, īpašu uzmanību pievēršot transformatoru arhitektūras pamatprincipiem – pašuzmanības mehānismam, daudzgalvu uzmanībai un pozicionālajai kodēšanai. Tāpat tiek aplūkota valodas modeļu apmācības metodoloģija, ietverot priekšapmācību, precizējošo apmācību un ar to saistītos izaicinājumus, piemēram, katastrofisko aizmirstību un datu kvalitātes nozīmi. Praktiskajā daļā tika izstrādāta pielāgota datu kopa, kurā iekļauti latviešu valodā rakstīti teksti un tiem atbilstoši jautājumi. Tika testētas dažādas uzvedņu veidošanas metodes un jautājumu veidi. Darbs parāda, ka lielie valodas modeļi, lai arī spējīgi ģenerēt atbildes, sastopas ar grūtībām, apstrādājot tekstus latviešu valodā. Eksperimentu rezultāti liecina, ka modeļu sniegums būtiski atkarīgs no jautājuma formulējuma un konteksta skaidrības. Daži modeļi spēj labi atbildēt uz vienkāršiem faktu jautājumiem, bet vājāk interpretē sarežģītākus vai netiešus jautājumus. Praktiskajā daļā veikto testu laikā tika noskaidrots, ka uzvedņu pielāgošana un teksta strukturēšana ir nozīmīgi faktori, kas ietekmē rezultātu kvalitāti. Darbā iegūtās atziņas sniedz praktiskas vadlīnijas turpmākai lielo valodas modeļu izmantošanai jautājumu atbildēšanas uzdevumos latviešu valodā un palīdz labāk izprast šo modeļu darbības īpatnības mazāk resursu valodās. |
| Keywords |
Lielie valodas modeļi, atbildēšana uz jautājumiem, transformatora arhitektūra, GPT-4o, Claude 3.7 Sonnet, DeepSeek-V3, Gemini 2.0 Flash. |
| Keywords in English |
Large language models, question answering, transformer architecture, GPT-4o, Claude 3.7 Sonnet, DeepSeek-V3, Gemini 2.0 Flash. |
| Language |
lv |
| Year |
2025 |
| Date and time of uploading |
25.05.2025 16:26:52 |