Lielo valodas modeļu (LLM) uzticamības novērtējums ar specializētiem testēšanas rīkiem

Noslēguma darbu reģistrs

Noslēguma darbu meklēšana

Studiju darba apraksts

Studiju veids	bakalaura akadēmiskās studijas
Studiju programmas nosaukums	Informācijas tehnoloģija
Nosaukums	Lielo valodas modeļu (LLM) uzticamības novērtējums ar specializētiem testēšanas rīkiem
Nosaukums angļu valodā	Reliability Assessment of Large Language Models (LLMs) Using Specialized Testing Tools
Struktūrvienība	33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs	Nadežda Zeņina
Recenzents	Artis Ābolts
Anotācija	Mūsdienās arvien biežāk dažādiem nolūkiem gan ikdienā, gan informācijas tehnoloģiju risinājumos tiek izmantoti lielo valodas modeļi (LVM), kuru nozare arvien straujāk attīstās, tādējādi aktualizējot jautājumu par šo modeļu uzticamību. Bakalaura darba mērķis ir izpētīt iepriekšminēto modeļu uzticamības problēmu, kā arī analizēt un izvērtēt testēšanas rīku, kas paredzēti to novērtēšanai un pielietojamību.Izstrādātā darba ietvaros tika analizēti LVM darbības pamatprincipi, kā arī uzticamības jēdziens šajā kontekstā. Tāpat tika aplūkotas modeļu testēšanā izmantotās pieejas un metodes, padziļināti pētot testēšanas rīku ietvarus (angļu val. frameworks), kas izveidoti uzvedības un sniegto atbilžu kvalitātes novērtēšanai, vienlaikus izvērtējot to funkcionalitāti, ierobežojumus un priekšrocības. Darba praktiskajā daļā tika veikta lielo valodas modeļu testēšana ar rīku ietvariem, precīzāk, Promptfoo, DeepEval, LangTest un Garak, kur iegūtie rezultāti parādīja, ka neviens modelis nav dominējošs visās uzticamības metrikās, no kā izriet darba noslēguma secinājums: ka uzticamība ir visaptverošs jēdziens, kura objektīvākai izvērtēšanai nepieciešama sistemātiska, atkārtojama un plaši apvienota testēšanas pieeja. Darbs satur: 68 lappuses, 15 attēlus, 20 tabulas, 7 pielikumus un 94 izmantotos informācijas avotus.
Atslēgas vārdi	LIELIE VALODAS MODEĻI, TESTĒŠANA, UZTICAMĪBA
Atslēgas vārdi angļu valodā	LARGE LANGUAGE MODELS, TESTING, RELIABILITY
Valoda	lv
Gads	2026
Darba augšupielādes datums un laiks	09.06.2026 12:30:32