Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Information Technology
Title in original language "Twitter" tekstu noskaņojuma analīze politisko partiju atbalsta prognozēšanai
Title in English Using Sentiment Analysis of Twitter Data to Predict Political Party Approval Rate
Department 12100 Institute of Information Technology
Scientific advisor Inese Poļaka
Reviewer Jurijs Čižovs
Abstract Bakalaura darba mērķis ir izvērtēt mašīnmācīšanās modeļu izmantošanas efektivitāti latviešu valodas “Twitter” publikāciju sentimentu klasifikācijai, salīdzinot iegūtos politisko partiju noskaņojuma vērtējumus ar reālās pasaules politisko partiju reitingiem. Ir izpētīts, kā dažādas priekšapstrādes metodes ietekmē divu BERT bāzes mašīnmācīšanās modeļu LVBERT un mBERT apmācības efektivitāti sentimentu klasifikācijas uzdevumā. Šajā procesā tika noteikts, ka LVBERT sasniedz labākos akurātuma rezultātus apmācības procesā, kurus vēl vairāk uzlaboja manuāla modeļa vārdnīcas papildināšana ar emocijzīmēm un iepriekš nezināmiem vārdiem. Sasniegtie apmācības akurātuma rezultāti norāda, ka pagaidām BERT bāzes modeļi nav spējīgi latviešu valodas tekstus apstrādāt tik pat kvalitatīvi, kā pielīdzināmi mašīnmācīšanās modeļi uzstādījuši ar citu valodu tekstiem. Tomēr rezultāti ir pietiekami labi, lai varētu izstrādāt vienkāršus sentimentu analīzes rīkus. Apmācītais LVBERT modelis tika izmantots, lai iegūtu Latvijas politisko partiju noskaņojuma vērtējumu reitingu, kas tālāk tika salīdzināts ar reālo partiju popularitātes reitingu. Salīdzinājuma rezultātā tika aprēķināti korelācijas koeficienti katrai apskatītajai partijai 2017. un 2018. gada laikā. Vairāk kā pusei no aplūkotajām partijām tika atklāta vidēja vai spēcīga korelācija, t.i. korelācijas koeficienta absolūtā vērtība bija starp 0.5 un 1. Dažādie korelācijas koeficienti daļēji skaidrojami ar konkrēto partiju un “Twitter” vides demogrāfiju atšķirībām.
Keywords noskaņojuma analīze, BERT, Twitter, popularitātes reitingi, latviešu valodas apstrāde
Keywords in English sentiment analysis, BERT, Twitter, popularity rating, latvian language processing
Language lv
Year 2023
Date and time of uploading 06.06.2023 10:43:57