Studiju veids |
maģistra akadēmiskās studijas |
Studiju programmas nosaukums |
Datorsistēmas |
Nosaukums |
Emocionālās ekspresijas noteikšana sīkziņās latviešu valodā |
Nosaukums angļu valodā |
Sentiment Analysis in Latvian Tweets |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Gints Jēkabsons |
Recenzents |
Ilze Birzniece, Dr.sc.ing., LDI vadošais pētnieks |
Anotācija |
Noskaņojuma analīze ir pētījumu virziens, kas, pielietojot dažādas dabīgās valodas apstrādes metodes, pēta un analizē cilvēku viedokļus un subjektīvos izteikumus, lai noteiktu vērtējumus, attieksmes un emocijas pret kādu notikumu vai objektu pasaulē. Noskaņojuma analīze tiek lietota, lai atklātu agresīvu viedokļu paušanu tīmeklī, sabiedrības viedokļa pētīšanai dažādu reklāmas un politisko kampaņu ietvaros.
Maģistra darba gaitā tika veikts pētījums par iespējām pielietot noskaņojuma analīzes metodes latviešu valodā rakstītu sīkziņu klasificēšanai. Latviešu valoda atšķirībā no angļu valodas, kurā ir veikta lielākā daļa pētījumu noskaņojuma analīzes jomā, ir morfoloģiski bagāta valoda un nepieciešamas teksta apstrādes metodes, kas šo īpatnību ņem vērā. Darba gaitā tika izpētītas līdz šim pielietotās metodes, izmantotie datu avoti un iegūtie rezultāti.
Tika identificētas dažādas teksta apstrādes metodes, kuru lietderīgums tika novērtēts izmantojot standartizētu datu kopu un novērtēšanas metodes. Pēc dažādu teksta apstrādes metožu novērtēšanas tika izstrādāta priekšapstrādes metožu secība, kuru izmantojot, tika apstrādāti apmācības dati un izveidots modelis. Izveidotais modelis tika pārbaudīts izmantojot šķērsvalidēšanas metodi.
Darba pamattekstā ir 48 lappuses, 16 attēli, 20 tabulas, 47 nosaukumu informācijas avoti un 0 pielikumi, taču izejas kods un izmantotie dati ir izlikti Github - https://github.com/RinaldsViksna/sikzinu_analize. |
Atslēgas vārdi |
Sīkziņas, Noskaņojuma analīze |
Atslēgas vārdi angļu valodā |
Tweets, Sentiment analysis |
Valoda |
lv |
Gads |
2018 |
Darba augšupielādes datums un laiks |
21.05.2018 23:50:13 |