Graduate papers
  
Description of the graduate paper
Form of studies Master
Title of the study programm Digital Humanities
Title in original language Analīzes rīka izveide naida runas identificēšanai sociālajos tīklos
Title in English Development of an Analysis Tool for Identifying Hate Speech on Social Networks
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Agris Ņikitenko
Reviewer Larisa Iļinska
Abstract Maģistra darba “Analīzes rīka izveide naida runas identificēšanai sociālajos tīklos” mērķis ir izpētīt aktuālās metodes un izstrādāt risinājumu, lai dabiskās valodas apstrādes izpētes laukā realizētu noskaņojuma analīzi attiecībā uz naida runas detekciju, īpašu vērību pievēršot komentāra tipa publikācijām latviešu valodā, kas tipiski tiek rakstīti sociālajos tīklos. Maģistra darba tēmas aktualitāti nosaka pēdējos gados izteikti novērojamā latviešu valodas interneta vides polarizācija, kas vērojama viltus ziņu un t.s. troļļu, kā arī aktuālu sabiedrību pretēji polarizējošu tematu (piemēram, Covid-19 vīrusa pandēmija un Krievijas militārā agresija Ukrainā) iespaidā. Globālie notikumi rosina konfrontējošu viedokļu grupu aktivizēšanos. Autors maģistra darbā pēta un salīdzina naida runas definīciju, noskaņojuma analīzes veidus un paņēmienus, kā arī saistītos tehniskos procesus un gatavus nozares risinājumus. Darba praktiskajā daļā ir sagatavota marķēta datu kopa, kā arī veiktas darbības, lai izstrādātu mašīnapmācīšanas modeli. Izveidotais mašīnapmācīšanās modelis tiek novērtēts gadījumu izpētēs ar sociālā tīkla Twitter ierakstiem; tiek interpretēti rezultāti un sniegti secinājumi par pētījuma objekta veiktspēju un uzlabošanas iespējām. Maģistra darbs satur 86 lappuses, 19 attēlus, 22 tabulas, 64 informācijas avotus un 6 pielikumus. Darba ietvaros saistītais izstrādātais kods un ieejas, kā arī izejas dati ir augšupielādēti GitHub vietnē.
Keywords noskaņojuma analīze, naida runa, mašīnapmācīšanās, teksta klasifikācija
Keywords in English sentiment analysis, hate speech, machine learning, text classification
Language eng
Year 2022
Date and time of uploading 24.05.2022 22:13:29