Form of studies |
Master |
Title of the study programm |
Digital Humanities |
Title in original language |
Analīzes rīka izveide naida runas identificēšanai sociālajos tīklos |
Title in English |
Development of an Analysis Tool for Identifying Hate Speech on Social Networks |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Agris Ņikitenko |
Reviewer |
Larisa Iļinska |
Abstract |
Maģistra darba “Analīzes rīka izveide naida runas identificēšanai sociālajos tīklos” mērķis ir izpētīt aktuālās metodes un izstrādāt risinājumu, lai dabiskās valodas apstrādes izpētes laukā realizētu noskaņojuma analīzi attiecībā uz naida runas detekciju, īpašu vērību pievēršot komentāra tipa publikācijām latviešu valodā, kas tipiski tiek rakstīti sociālajos tīklos. Maģistra darba tēmas aktualitāti nosaka pēdējos gados izteikti novērojamā latviešu valodas interneta vides polarizācija, kas vērojama viltus ziņu un t.s. troļļu, kā arī aktuālu sabiedrību pretēji polarizējošu tematu (piemēram, Covid-19 vīrusa pandēmija un Krievijas militārā agresija Ukrainā) iespaidā. Globālie notikumi rosina konfrontējošu viedokļu grupu aktivizēšanos. Autors maģistra darbā pēta un salīdzina naida runas definīciju, noskaņojuma analīzes veidus un paņēmienus, kā arī saistītos tehniskos procesus un gatavus nozares risinājumus. Darba praktiskajā daļā ir sagatavota marķēta datu kopa, kā arī veiktas darbības, lai izstrādātu mašīnapmācīšanas modeli. Izveidotais mašīnapmācīšanās modelis tiek novērtēts gadījumu izpētēs ar sociālā tīkla Twitter ierakstiem; tiek interpretēti rezultāti un sniegti secinājumi par pētījuma objekta veiktspēju un uzlabošanas iespējām.
Maģistra darbs satur 86 lappuses, 19 attēlus, 22 tabulas, 64 informācijas avotus un 6 pielikumus. Darba ietvaros saistītais izstrādātais kods un ieejas, kā arī izejas dati ir augšupielādēti GitHub vietnē. |
Keywords |
noskaņojuma analīze, naida runa, mašīnapmācīšanās, teksta klasifikācija |
Keywords in English |
sentiment analysis, hate speech, machine learning, text classification |
Language |
eng |
Year |
2022 |
Date and time of uploading |
24.05.2022 22:13:29 |