| Studiju veids |
maģistra akadēmiskās studijas |
| Studiju programmas nosaukums |
Intelektuālas robotizētas sistēmas |
| Nosaukums |
Lielo valodas modeļu lēmumu pieņemšanas spēju uzlabošana, izmantojot iteratīvas vaicājumu mutācijas un novērtējuma funkciju |
| Nosaukums angļu valodā |
Improving Decision Making Capabilities of Large Language Models Using Iterative Prompt Mutations and Reward Function |
| Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
| Darba vadītājs |
Ēvalds Urtāns |
| Recenzents |
Ilze Birzniece |
| Anotācija |
Arvien vairāk ir redzams pieaugums pētījumos, kas saistīti ar lielo valodas modeļu (LLM) spēju uzlabošanu neizmantojot papildus apmācību, bet izmantojot kādas uzvedņu veidošanas stratēģijas. Šīs stratēģijas ļauj modeļiem labāk pielāgoties dažādiem uzdevumiem, bet, lai arī pareizā uzvedņu atrašana sniedz labākus rezultātus, tas var būt laikietilpīgs process. Iespējams efektīvāk būtu izmantot mutācijas metodes vai no modeļa neatkarīgas atbildes novērtēšanas metodes.
Darbā tika izstrādātas mutācijas un valodas modeļa atbildes novērtēšanas metodes uz trim matemātikas un loģikas uzdevumu datu kopām, un tika veikta to salīdzināšana ar eksistējošām citu pētījumu metodēm. Tika izmantotas piecas novērtējuma metodes un divas mutācijas metodes – statiskā, kas sākotnēji mutē uzdevuma uzvedni, kura paliek nemainīga visā datu kopas iterācijā, un dinamiskā mutācija, kur sākuma uzvedne tiek mainīta pie katra jautājuma. Katrai mutācijas metodei ir divas apakš metodes. Statiskajai mutācijai apakš metodes ir vienas atbildes metode, kur tika izvērtētas dažādas uzvedņu ievades iespējas un valodas modeļa izvades opcijas, un N atbilžu metode, kur katra atbilde tika atsevišķi vērtēta ar kādu no vērtēšanas metodēm. Dinamiskajai mutācijai apakš metodes ir mutācija pēc atbildes, kas veica mutāciju līdz tika sasniegta pareizā atbilde, un mutācija pēc vērtējuma, kas pie katra jautājuma ieguva vairākas atbildes uz vienu jautājumu un izvērtēja tās ar novērtēšanas metodēm.
Tika noskaidrots, ka visas izveidotās metodes sniedza labākus rezultātus par jau eksistējošām metodēm. Statiskā mutācija ar vairāku atbilžu skaitu un to novērtēšanu sniedza 93.68% MMLU STEM datu kopai. Datu kopām TheoremaQA un MMLU STEM nākamā labākā metode bija dinamiskās mutācijas vairāku atbilžu metode (92.63% un 57.2%), bet AQuA-RAT statiskā vienas atbildes metode (87.8%). Vislabāko vērtētāja rezultātu sniedza cits valodas modelis kā vērtētājs, bet arī atlīdzības modeļu rezultāti no tā daudz neatšķīrās (0.4% - 3.2%). Vienas atbildes statiskajā mutācijā vislabāko rezultātu uzrādīja strukturētā izvade ar domu ķēdi.
Darba pamattekstā ir 76 lappuses, 17 attēli, 33 tabulas, 13 pielikumi un 49 izmantotie literatūras avoti. |
| Atslēgas vārdi |
LIELIE VALODAS MODEĻI, ATBILDES NOVĒRTĒJUMA FUNKCIJAS, UZVEDŅU MUTĀCIJA, LOĢIKAS UZDEVUMI |
| Atslēgas vārdi angļu valodā |
LARGE LANGUAGE MODELS, RESPONSE EVALUATION FUNCTIONS, PROMPT MUTATION, LOGIC TASKS |
| Valoda |
lv |
| Gads |
2025 |
| Darba augšupielādes datums un laiks |
26.05.2025 21:14:40 |