Comparison of Fake News Classification Models and Assessment of Explainability

Graduate papers

Search graduate papers

Description of the graduate paper

Form of studies	Bachelor
Title of the study programm	Information Technology
Title in original language	Viltus ziņu klasificēšanas modeļu salīdzinājums un izskaidrojamības izvērtējums
Title in English	Comparison of Fake News Classification Models and Assessment of Explainability
Department	Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor	Alla Anohina-Naumeca
Reviewer	Armands Baranovskis
Abstract	Darbā apskatīta teksta viltus ziņu klasificēšanas problēma digitālajā vidē, kas mūsdienās kļūst arvien aktuālāka sakarā ar straujo informācijas izplatību un tās ietekmi uz sabiedrības lēmumu pieņemšanu. Turklāt šīs problēmas izpēte izraisa grūtības, jo tai piemīt daudzpusīga analīze semantiskās, kontekstuālās, lingvistiskās, sintaktiskās un sentimentālās teksta nozīmes dēļ. Darbā tiek aplūkota dažādu ML metožu pielietošana viltus ziņu klasificēšanā, īpašu uzmanību pievēršot ne tikai modeļu veiktspējai, bet arī to izskaidrojamībai un tās novērtēšanai, izmantojot SHAP, LIME un enkuru metodi. Darba mērķis ir salīdzināt dažādas ML metodes teksta viltus ziņu klasificēšanai, izvērtējot gan to veiktspēju, gan izskaidrojamību, lai noteiktu praktiski piemērotāko risinājumu mazo un vidējo uzņēmumu kontekstā. Darbā apskatīta teksta klasifikācijas teorija un līdzšinējie risinājumi viltus ziņu noteikšanas kontekstā, uz kuru pamata tika izstrādātas un pamatotas hibrīdas klasifikācijas modeļu arhitektūras. Pirmajā modelī ir izmantota transformatoros balstīta BERT teksta skaitliskā atspoguļošana kopā ar LSVC klasifikatoru. Savukārt otrajā modelī ir izmantota varbūtībā balstīta FastText vārdlietojuma kartēšana kopā ar CNN un LSTM neironu tīklu klasifikatoru. Modeļu rezultātu analīzei tika izmantotas divas strukturāli atšķirīgas datu kopas – LIAR, kas sastāv no īsiem izteikumiem, un WELFake, kas ietver pilna apjoma ziņu rakstus. Modeļu un izskaidrojamības algoritmu novērtēšanas rezultātu salīdzināšanai tika izmantots Vilkoksona zīmju rangu tests, lai noteiktu statistiskas atšķirības starp tiem. Ņemot vērā izmantoto modeļu zemāko sarežģītību, LIAR datu kopas kontekstā tika novēroti zemāki rezultāti, savukārt WELFake datu kopā - augstāki vai līdzvērtīgi līdzšinēji sasniegtiem. Modeļu izskaidrojamība NLP jomā joprojām ir nepietiekami attīstīta, jo esošās metodes nepilnīgi ņem vērā teksta kontekstu. Bakalaura darbs sastāv no 73 lapaspusēm, 22 attēliem, 15 tabulām, 7 pielikumiem. Darba izstrādes laikā tika izmantoti 137 informācijas avoti. Pielikumos atrodas 1 attēls, 26 tabulas un 3 koda fragmenti.
Keywords	VILTUS ZIŅAS, MAŠĪNMĀCĪŠANĀS, NEIRONU TĪKLI, LĒMUMA IZSKAIDROJAMĪBA, IZSKAIDROJAMĪBAS NOVĒRTĒJUMS
Keywords in English	FAKE NEWS, MACHINE LEARNING, NEURAL NETWORKS, DECISION EXPLANATIONS, EVALUATION OF EXPLANATION
Language	lv
Year	2026
Date and time of uploading	24.05.2026 17:52:09