Form of studies |
Bachelor |
Title of the study programm |
Information Technology |
Title in original language |
"Twitter" tekstu noskaņojuma analīze politisko partiju atbalsta prognozēšanai |
Title in English |
Using Sentiment Analysis of Twitter Data to Predict Political Party Approval Rate |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Inese Poļaka |
Reviewer |
Jurijs Čižovs |
Abstract |
Bakalaura darba mērķis ir izvērtēt mašīnmācīšanās modeļu izmantošanas
efektivitāti latviešu valodas “Twitter” publikāciju sentimentu klasifikācijai, salīdzinot
iegūtos politisko partiju noskaņojuma vērtējumus ar reālās pasaules politisko partiju
reitingiem. Ir izpētīts, kā dažādas priekšapstrādes metodes ietekmē divu BERT bāzes
mašīnmācīšanās modeļu LVBERT un mBERT apmācības efektivitāti sentimentu
klasifikācijas uzdevumā. Šajā procesā tika noteikts, ka LVBERT sasniedz labākos
akurātuma rezultātus apmācības procesā, kurus vēl vairāk uzlaboja manuāla modeļa
vārdnīcas papildināšana ar emocijzīmēm un iepriekš nezināmiem vārdiem.
Sasniegtie apmācības akurātuma rezultāti norāda, ka pagaidām BERT bāzes
modeļi nav spējīgi latviešu valodas tekstus apstrādāt tik pat kvalitatīvi, kā pielīdzināmi
mašīnmācīšanās modeļi uzstādījuši ar citu valodu tekstiem. Tomēr rezultāti ir
pietiekami labi, lai varētu izstrādāt vienkāršus sentimentu analīzes rīkus.
Apmācītais LVBERT modelis tika izmantots, lai iegūtu Latvijas politisko
partiju noskaņojuma vērtējumu reitingu, kas tālāk tika salīdzināts ar reālo partiju
popularitātes reitingu. Salīdzinājuma rezultātā tika aprēķināti korelācijas koeficienti
katrai apskatītajai partijai 2017. un 2018. gada laikā. Vairāk kā pusei no aplūkotajām
partijām tika atklāta vidēja vai spēcīga korelācija, t.i. korelācijas koeficienta absolūtā
vērtība bija starp 0.5 un 1. Dažādie korelācijas koeficienti daļēji skaidrojami ar
konkrēto partiju un “Twitter” vides demogrāfiju atšķirībām. |
Keywords |
noskaņojuma analīze, BERT, Twitter, popularitātes reitingi, latviešu valodas apstrāde |
Keywords in English |
sentiment analysis, BERT, Twitter, popularity rating, latvian language processing |
Language |
lv |
Year |
2023 |
Date and time of uploading |
06.06.2023 10:43:57 |