Viltus ziņu klasificēšanas modeļu salīdzinājums un izskaidrojamības izvērtējums

Noslēguma darbu reģistrs

Noslēguma darbu meklēšana

Studiju darba apraksts

Studiju veids	bakalaura akadēmiskās studijas
Studiju programmas nosaukums	Informācijas tehnoloģija
Nosaukums	Viltus ziņu klasificēšanas modeļu salīdzinājums un izskaidrojamības izvērtējums
Nosaukums angļu valodā	Comparison of Fake News Classification Models and Assessment of Explainability
Struktūrvienība	33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs	Alla Anohina-Naumeca
Recenzents	Armands Baranovskis
Anotācija	Darbā apskatīta teksta viltus ziņu klasificēšanas problēma digitālajā vidē, kas mūsdienās kļūst arvien aktuālāka sakarā ar straujo informācijas izplatību un tās ietekmi uz sabiedrības lēmumu pieņemšanu. Turklāt šīs problēmas izpēte izraisa grūtības, jo tai piemīt daudzpusīga analīze semantiskās, kontekstuālās, lingvistiskās, sintaktiskās un sentimentālās teksta nozīmes dēļ. Darbā tiek aplūkota dažādu ML metožu pielietošana viltus ziņu klasificēšanā, īpašu uzmanību pievēršot ne tikai modeļu veiktspējai, bet arī to izskaidrojamībai un tās novērtēšanai, izmantojot SHAP, LIME un enkuru metodi. Darba mērķis ir salīdzināt dažādas ML metodes teksta viltus ziņu klasificēšanai, izvērtējot gan to veiktspēju, gan izskaidrojamību, lai noteiktu praktiski piemērotāko risinājumu mazo un vidējo uzņēmumu kontekstā. Darbā apskatīta teksta klasifikācijas teorija un līdzšinējie risinājumi viltus ziņu noteikšanas kontekstā, uz kuru pamata tika izstrādātas un pamatotas hibrīdas klasifikācijas modeļu arhitektūras. Pirmajā modelī ir izmantota transformatoros balstīta BERT teksta skaitliskā atspoguļošana kopā ar LSVC klasifikatoru. Savukārt otrajā modelī ir izmantota varbūtībā balstīta FastText vārdlietojuma kartēšana kopā ar CNN un LSTM neironu tīklu klasifikatoru. Modeļu rezultātu analīzei tika izmantotas divas strukturāli atšķirīgas datu kopas – LIAR, kas sastāv no īsiem izteikumiem, un WELFake, kas ietver pilna apjoma ziņu rakstus. Modeļu un izskaidrojamības algoritmu novērtēšanas rezultātu salīdzināšanai tika izmantots Vilkoksona zīmju rangu tests, lai noteiktu statistiskas atšķirības starp tiem. Ņemot vērā izmantoto modeļu zemāko sarežģītību, LIAR datu kopas kontekstā tika novēroti zemāki rezultāti, savukārt WELFake datu kopā - augstāki vai līdzvērtīgi līdzšinēji sasniegtiem. Modeļu izskaidrojamība NLP jomā joprojām ir nepietiekami attīstīta, jo esošās metodes nepilnīgi ņem vērā teksta kontekstu. Bakalaura darbs sastāv no 73 lapaspusēm, 22 attēliem, 15 tabulām, 7 pielikumiem. Darba izstrādes laikā tika izmantoti 137 informācijas avoti. Pielikumos atrodas 1 attēls, 26 tabulas un 3 koda fragmenti.
Atslēgas vārdi	VILTUS ZIŅAS, MAŠĪNMĀCĪŠANĀS, NEIRONU TĪKLI, LĒMUMA IZSKAIDROJAMĪBA, IZSKAIDROJAMĪBAS NOVĒRTĒJUMS
Atslēgas vārdi angļu valodā	FAKE NEWS, MACHINE LEARNING, NEURAL NETWORKS, DECISION EXPLANATIONS, EVALUATION OF EXPLANATION
Valoda	lv
Gads	2026
Darba augšupielādes datums un laiks	24.05.2026 17:52:09