Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Information Technology
Title in original language Viltus ziņu klasificēšanas modeļu salīdzinājums un izskaidrojamības izvērtējums
Title in English Comparison of Fake News Classification Models and Assessment of Explainability
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Alla Anohina-Naumeca
Reviewer Armands Baranovskis
Abstract Darbā apskatīta teksta viltus ziņu klasificēšanas problēma digitālajā vidē, kas mūsdienās kļūst arvien aktuālāka sakarā ar straujo informācijas izplatību un tās ietekmi uz sabiedrības lēmumu pieņemšanu. Turklāt šīs problēmas izpēte izraisa grūtības, jo tai piemīt daudzpusīga analīze semantiskās, kontekstuālās, lingvistiskās, sintaktiskās un sentimentālās teksta nozīmes dēļ. Darbā tiek aplūkota dažādu ML metožu pielietošana viltus ziņu klasificēšanā, īpašu uzmanību pievēršot ne tikai modeļu veiktspējai, bet arī to izskaidrojamībai un tās novērtēšanai, izmantojot SHAP, LIME un enkuru metodi. Darba mērķis ir salīdzināt dažādas ML metodes teksta viltus ziņu klasificēšanai, izvērtējot gan to veiktspēju, gan izskaidrojamību, lai noteiktu praktiski piemērotāko risinājumu mazo un vidējo uzņēmumu kontekstā. Darbā apskatīta teksta klasifikācijas teorija un līdzšinējie risinājumi viltus ziņu noteikšanas kontekstā, uz kuru pamata tika izstrādātas un pamatotas hibrīdas klasifikācijas modeļu arhitektūras. Pirmajā modelī ir izmantota transformatoros balstīta BERT teksta skaitliskā atspoguļošana kopā ar LSVC klasifikatoru. Savukārt otrajā modelī ir izmantota varbūtībā balstīta FastText vārdlietojuma kartēšana kopā ar CNN un LSTM neironu tīklu klasifikatoru. Modeļu rezultātu analīzei tika izmantotas divas strukturāli atšķirīgas datu kopas – LIAR, kas sastāv no īsiem izteikumiem, un WELFake, kas ietver pilna apjoma ziņu rakstus. Modeļu un izskaidrojamības algoritmu novērtēšanas rezultātu salīdzināšanai tika izmantots Vilkoksona zīmju rangu tests, lai noteiktu statistiskas atšķirības starp tiem. Ņemot vērā izmantoto modeļu zemāko sarežģītību, LIAR datu kopas kontekstā tika novēroti zemāki rezultāti, savukārt WELFake datu kopā - augstāki vai līdzvērtīgi līdzšinēji sasniegtiem. Modeļu izskaidrojamība NLP jomā joprojām ir nepietiekami attīstīta, jo esošās metodes nepilnīgi ņem vērā teksta kontekstu. Bakalaura darbs sastāv no 73 lapaspusēm, 22 attēliem, 15 tabulām, 7 pielikumiem. Darba izstrādes laikā tika izmantoti 137 informācijas avoti. Pielikumos atrodas 1 attēls, 26 tabulas un 3 koda fragmenti.
Keywords VILTUS ZIŅAS, MAŠĪNMĀCĪŠANĀS, NEIRONU TĪKLI, LĒMUMA IZSKAIDROJAMĪBA, IZSKAIDROJAMĪBAS NOVĒRTĒJUMS
Keywords in English FAKE NEWS, MACHINE LEARNING, NEURAL NETWORKS, DECISION EXPLANATIONS, EVALUATION OF EXPLANATION
Language lv
Year 2026
Date and time of uploading 24.05.2026 17:52:09