Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Viltus ziņu klasificēšanas modeļu salīdzinājums un izskaidrojamības izvērtējums
Nosaukums angļu valodā Comparison of Fake News Classification Models and Assessment of Explainability
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Alla Anohina-Naumeca
Recenzents Armands Baranovskis
Anotācija Darbā apskatīta teksta viltus ziņu klasificēšanas problēma digitālajā vidē, kas mūsdienās kļūst arvien aktuālāka sakarā ar straujo informācijas izplatību un tās ietekmi uz sabiedrības lēmumu pieņemšanu. Turklāt šīs problēmas izpēte izraisa grūtības, jo tai piemīt daudzpusīga analīze semantiskās, kontekstuālās, lingvistiskās, sintaktiskās un sentimentālās teksta nozīmes dēļ. Darbā tiek aplūkota dažādu ML metožu pielietošana viltus ziņu klasificēšanā, īpašu uzmanību pievēršot ne tikai modeļu veiktspējai, bet arī to izskaidrojamībai un tās novērtēšanai, izmantojot SHAP, LIME un enkuru metodi. Darba mērķis ir salīdzināt dažādas ML metodes teksta viltus ziņu klasificēšanai, izvērtējot gan to veiktspēju, gan izskaidrojamību, lai noteiktu praktiski piemērotāko risinājumu mazo un vidējo uzņēmumu kontekstā. Darbā apskatīta teksta klasifikācijas teorija un līdzšinējie risinājumi viltus ziņu noteikšanas kontekstā, uz kuru pamata tika izstrādātas un pamatotas hibrīdas klasifikācijas modeļu arhitektūras. Pirmajā modelī ir izmantota transformatoros balstīta BERT teksta skaitliskā atspoguļošana kopā ar LSVC klasifikatoru. Savukārt otrajā modelī ir izmantota varbūtībā balstīta FastText vārdlietojuma kartēšana kopā ar CNN un LSTM neironu tīklu klasifikatoru. Modeļu rezultātu analīzei tika izmantotas divas strukturāli atšķirīgas datu kopas – LIAR, kas sastāv no īsiem izteikumiem, un WELFake, kas ietver pilna apjoma ziņu rakstus. Modeļu un izskaidrojamības algoritmu novērtēšanas rezultātu salīdzināšanai tika izmantots Vilkoksona zīmju rangu tests, lai noteiktu statistiskas atšķirības starp tiem. Ņemot vērā izmantoto modeļu zemāko sarežģītību, LIAR datu kopas kontekstā tika novēroti zemāki rezultāti, savukārt WELFake datu kopā - augstāki vai līdzvērtīgi līdzšinēji sasniegtiem. Modeļu izskaidrojamība NLP jomā joprojām ir nepietiekami attīstīta, jo esošās metodes nepilnīgi ņem vērā teksta kontekstu. Bakalaura darbs sastāv no 73 lapaspusēm, 22 attēliem, 15 tabulām, 7 pielikumiem. Darba izstrādes laikā tika izmantoti 137 informācijas avoti. Pielikumos atrodas 1 attēls, 26 tabulas un 3 koda fragmenti.
Atslēgas vārdi VILTUS ZIŅAS, MAŠĪNMĀCĪŠANĀS, NEIRONU TĪKLI, LĒMUMA IZSKAIDROJAMĪBA, IZSKAIDROJAMĪBAS NOVĒRTĒJUMS
Atslēgas vārdi angļu valodā FAKE NEWS, MACHINE LEARNING, NEURAL NETWORKS, DECISION EXPLANATIONS, EVALUATION OF EXPLANATION
Valoda lv
Gads 2026
Darba augšupielādes datums un laiks 24.05.2026 17:52:09