Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums "Twitter" tekstu noskaņojuma analīze politisko partiju atbalsta prognozēšanai
Nosaukums angļu valodā Using Sentiment Analysis of Twitter Data to Predict Political Party Approval Rate
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Inese Poļaka
Recenzents Jurijs Čižovs
Anotācija Bakalaura darba mērķis ir izvērtēt mašīnmācīšanās modeļu izmantošanas efektivitāti latviešu valodas “Twitter” publikāciju sentimentu klasifikācijai, salīdzinot iegūtos politisko partiju noskaņojuma vērtējumus ar reālās pasaules politisko partiju reitingiem. Ir izpētīts, kā dažādas priekšapstrādes metodes ietekmē divu BERT bāzes mašīnmācīšanās modeļu LVBERT un mBERT apmācības efektivitāti sentimentu klasifikācijas uzdevumā. Šajā procesā tika noteikts, ka LVBERT sasniedz labākos akurātuma rezultātus apmācības procesā, kurus vēl vairāk uzlaboja manuāla modeļa vārdnīcas papildināšana ar emocijzīmēm un iepriekš nezināmiem vārdiem. Sasniegtie apmācības akurātuma rezultāti norāda, ka pagaidām BERT bāzes modeļi nav spējīgi latviešu valodas tekstus apstrādāt tik pat kvalitatīvi, kā pielīdzināmi mašīnmācīšanās modeļi uzstādījuši ar citu valodu tekstiem. Tomēr rezultāti ir pietiekami labi, lai varētu izstrādāt vienkāršus sentimentu analīzes rīkus. Apmācītais LVBERT modelis tika izmantots, lai iegūtu Latvijas politisko partiju noskaņojuma vērtējumu reitingu, kas tālāk tika salīdzināts ar reālo partiju popularitātes reitingu. Salīdzinājuma rezultātā tika aprēķināti korelācijas koeficienti katrai apskatītajai partijai 2017. un 2018. gada laikā. Vairāk kā pusei no aplūkotajām partijām tika atklāta vidēja vai spēcīga korelācija, t.i. korelācijas koeficienta absolūtā vērtība bija starp 0.5 un 1. Dažādie korelācijas koeficienti daļēji skaidrojami ar konkrēto partiju un “Twitter” vides demogrāfiju atšķirībām.
Atslēgas vārdi noskaņojuma analīze, BERT, Twitter, popularitātes reitingi, latviešu valodas apstrāde
Atslēgas vārdi angļu valodā sentiment analysis, BERT, Twitter, popularity rating, latvian language processing
Valoda lv
Gads 2023
Darba augšupielādes datums un laiks 06.06.2023 10:43:57