Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Lielo valodas modeļu (LLM) uzticamības novērtējums ar specializētiem testēšanas rīkiem
Nosaukums angļu valodā Reliability Assessment of Large Language Models (LLMs) Using Specialized Testing Tools
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Nadežda Zeņina
Recenzents Artis Ābolts
Anotācija Mūsdienās arvien biežāk dažādiem nolūkiem gan ikdienā, gan informācijas tehnoloģiju risinājumos tiek izmantoti lielo valodas modeļi (LVM), kuru nozare arvien straujāk attīstās, tādējādi aktualizējot jautājumu par šo modeļu uzticamību. Bakalaura darba mērķis ir izpētīt iepriekšminēto modeļu uzticamības problēmu, kā arī analizēt un izvērtēt testēšanas rīku, kas paredzēti to novērtēšanai un pielietojamību.Izstrādātā darba ietvaros tika analizēti LVM darbības pamatprincipi, kā arī uzticamības jēdziens šajā kontekstā. Tāpat tika aplūkotas modeļu testēšanā izmantotās pieejas un metodes, padziļināti pētot testēšanas rīku ietvarus (angļu val. frameworks), kas izveidoti uzvedības un sniegto atbilžu kvalitātes novērtēšanai, vienlaikus izvērtējot to funkcionalitāti, ierobežojumus un priekšrocības. Darba praktiskajā daļā tika veikta lielo valodas modeļu testēšana ar rīku ietvariem, precīzāk, Promptfoo, DeepEval, LangTest un Garak, kur iegūtie rezultāti parādīja, ka neviens modelis nav dominējošs visās uzticamības metrikās, no kā izriet darba noslēguma secinājums: ka uzticamība ir visaptverošs jēdziens, kura objektīvākai izvērtēšanai nepieciešama sistemātiska, atkārtojama un plaši apvienota testēšanas pieeja. Darbs satur: 68 lappuses, 15 attēlus, 20 tabulas, 7 pielikumus un 94 izmantotos informācijas avotus.
Atslēgas vārdi LIELIE VALODAS MODEĻI, TESTĒŠANA, UZTICAMĪBA
Atslēgas vārdi angļu valodā LARGE LANGUAGE MODELS, TESTING, RELIABILITY
Valoda lv
Gads 2026
Darba augšupielādes datums un laiks 09.06.2026 12:30:32