Form of studies |
Bachelor |
Title of the study programm |
Computer Systems |
Title in original language |
Python dabiskās valodas apstrādes bibliotēku precizitātes salīdzinājums. |
Title in English |
Python Natural Language Processing Libraries Accuracy Comparison. |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Aleksejs Jurenoks |
Reviewer |
Ilze Birzniece |
Abstract |
Dabiskās valodas apstrāde (NLP) ir mākslīgā intelekta un skaitļošanas lingvistikas pamatsfēra, kas nodarbojas ar teksta datu apjomu apstrādi un analīzi. Teksta dati ir strauji pieauguši dažādās jomās, tādējādi radot pieaugošu pieprasījumu pēc efektīvām un precīzām NLP bibliotēkām. NLP bibliotēku funkcionalitātei ir ļoti svarīgs pielietojums, sākot no veselības aprūpes līdz sociālo mediju analīzei. Tomēr pieaugošās datu kopu un valodu kontekstu atšķirības rada problēmas, lai panāktu NLP bibliotēku secīgu veiktspēju. Kamēr šo uzdevumu veikšanai ir izstrādātas daudzas šādas bibliotēkas, esošie pētījumi bieži vērsti uz atsevišķiem NLP uzdevumiem, un tiem trūkst visaptveroša savstarpēja salīdzinājuma.
Šis bakalaura darbs novērš šo problēmu, nodrošinot NLP bibliotēku sistemātisku salīdzinājumu, proti, NLTK, CoreNLP un TextBlob. Bakalaura darbā tiek pētīta šo bibliotēku efektivitāte un lietderība, veicot paplašinātus eksperimentus ar vispārējas nozīmes datu kopām un specifisko gadījumu datu kopām.
Šī bakalaura darba rezultāti dod vērtīgu informāciju par katras bibliotēkas stiprajām un vājajām pusēm, kas sniedz praktiķiem un pētniekiem pietiekamu pamatu, lai pieņemtu atbilstošus lēmumus par viņu NLP lietojumprogrammām. Uzsverot salīdzinošās analīzes un pielāgošanās spējas nozīmi, bakalaura darbs veicina NLP jomas un tās pielietojuma jomas attīstību dažādos reālās pasaules scenārijos. |
Keywords |
Atslēgvārdi: Dabiskās valodas apstrāde, NLTK, CoreNLP, TextBlob, noskaņojuma analīze |
Keywords in English |
Keywords: Natural Language Processing, NLTK, CoreNLP, TextBlob, Sentiment Analysis |
Language |
eng |
Year |
2025 |
Date and time of uploading |
02.01.2025 18:58:14 |