Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
"Twitter" tekstu noskaņojuma analīze politisko partiju atbalsta prognozēšanai |
Nosaukums angļu valodā |
Using Sentiment Analysis of Twitter Data to Predict Political Party Approval Rate |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Inese Poļaka |
Recenzents |
Jurijs Čižovs |
Anotācija |
Bakalaura darba mērķis ir izvērtēt mašīnmācīšanās modeļu izmantošanas
efektivitāti latviešu valodas “Twitter” publikāciju sentimentu klasifikācijai, salīdzinot
iegūtos politisko partiju noskaņojuma vērtējumus ar reālās pasaules politisko partiju
reitingiem. Ir izpētīts, kā dažādas priekšapstrādes metodes ietekmē divu BERT bāzes
mašīnmācīšanās modeļu LVBERT un mBERT apmācības efektivitāti sentimentu
klasifikācijas uzdevumā. Šajā procesā tika noteikts, ka LVBERT sasniedz labākos
akurātuma rezultātus apmācības procesā, kurus vēl vairāk uzlaboja manuāla modeļa
vārdnīcas papildināšana ar emocijzīmēm un iepriekš nezināmiem vārdiem.
Sasniegtie apmācības akurātuma rezultāti norāda, ka pagaidām BERT bāzes
modeļi nav spējīgi latviešu valodas tekstus apstrādāt tik pat kvalitatīvi, kā pielīdzināmi
mašīnmācīšanās modeļi uzstādījuši ar citu valodu tekstiem. Tomēr rezultāti ir
pietiekami labi, lai varētu izstrādāt vienkāršus sentimentu analīzes rīkus.
Apmācītais LVBERT modelis tika izmantots, lai iegūtu Latvijas politisko
partiju noskaņojuma vērtējumu reitingu, kas tālāk tika salīdzināts ar reālo partiju
popularitātes reitingu. Salīdzinājuma rezultātā tika aprēķināti korelācijas koeficienti
katrai apskatītajai partijai 2017. un 2018. gada laikā. Vairāk kā pusei no aplūkotajām
partijām tika atklāta vidēja vai spēcīga korelācija, t.i. korelācijas koeficienta absolūtā
vērtība bija starp 0.5 un 1. Dažādie korelācijas koeficienti daļēji skaidrojami ar
konkrēto partiju un “Twitter” vides demogrāfiju atšķirībām. |
Atslēgas vārdi |
noskaņojuma analīze, BERT, Twitter, popularitātes reitingi, latviešu valodas apstrāde |
Atslēgas vārdi angļu valodā |
sentiment analysis, BERT, Twitter, popularity rating, latvian language processing |
Valoda |
lv |
Gads |
2023 |
Darba augšupielādes datums un laiks |
06.06.2023 10:43:57 |