Form of studies |
Master |
Title of the study programm |
Computer Systems |
Title in original language |
Emocionālās ekspresijas noteikšana sīkziņās latviešu valodā |
Title in English |
Sentiment Analysis in Latvian Tweets |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Gints Jēkabsons |
Reviewer |
Ilze Birzniece, Dr.sc.ing., LDI vadošais pētnieks |
Abstract |
Noskaņojuma analīze ir pētījumu virziens, kas, pielietojot dažādas dabīgās valodas apstrādes metodes, pēta un analizē cilvēku viedokļus un subjektīvos izteikumus, lai noteiktu vērtējumus, attieksmes un emocijas pret kādu notikumu vai objektu pasaulē. Noskaņojuma analīze tiek lietota, lai atklātu agresīvu viedokļu paušanu tīmeklī, sabiedrības viedokļa pētīšanai dažādu reklāmas un politisko kampaņu ietvaros.
Maģistra darba gaitā tika veikts pētījums par iespējām pielietot noskaņojuma analīzes metodes latviešu valodā rakstītu sīkziņu klasificēšanai. Latviešu valoda atšķirībā no angļu valodas, kurā ir veikta lielākā daļa pētījumu noskaņojuma analīzes jomā, ir morfoloģiski bagāta valoda un nepieciešamas teksta apstrādes metodes, kas šo īpatnību ņem vērā. Darba gaitā tika izpētītas līdz šim pielietotās metodes, izmantotie datu avoti un iegūtie rezultāti.
Tika identificētas dažādas teksta apstrādes metodes, kuru lietderīgums tika novērtēts izmantojot standartizētu datu kopu un novērtēšanas metodes. Pēc dažādu teksta apstrādes metožu novērtēšanas tika izstrādāta priekšapstrādes metožu secība, kuru izmantojot, tika apstrādāti apmācības dati un izveidots modelis. Izveidotais modelis tika pārbaudīts izmantojot šķērsvalidēšanas metodi.
Darba pamattekstā ir 48 lappuses, 16 attēli, 20 tabulas, 47 nosaukumu informācijas avoti un 0 pielikumi, taču izejas kods un izmantotie dati ir izlikti Github - https://github.com/RinaldsViksna/sikzinu_analize. |
Keywords |
Sīkziņas, Noskaņojuma analīze |
Keywords in English |
Tweets, Sentiment analysis |
Language |
lv |
Year |
2018 |
Date and time of uploading |
21.05.2018 23:50:13 |