Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Datorsistēmas
Nosaukums Python dabiskās valodas apstrādes bibliotēku precizitātes salīdzinājums.
Nosaukums angļu valodā Python Natural Language Processing Libraries Accuracy Comparison.
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Aleksejs Jurenoks
Recenzents Ilze Birzniece
Anotācija Dabiskās valodas apstrāde (NLP) ir mākslīgā intelekta un skaitļošanas lingvistikas pamatsfēra, kas nodarbojas ar teksta datu apjomu apstrādi un analīzi. Teksta dati ir strauji pieauguši dažādās jomās, tādējādi radot pieaugošu pieprasījumu pēc efektīvām un precīzām NLP bibliotēkām. NLP bibliotēku funkcionalitātei ir ļoti svarīgs pielietojums, sākot no veselības aprūpes līdz sociālo mediju analīzei. Tomēr pieaugošās datu kopu un valodu kontekstu atšķirības rada problēmas, lai panāktu NLP bibliotēku secīgu veiktspēju. Kamēr šo uzdevumu veikšanai ir izstrādātas daudzas šādas bibliotēkas, esošie pētījumi bieži vērsti uz atsevišķiem NLP uzdevumiem, un tiem trūkst visaptveroša savstarpēja salīdzinājuma. Šis bakalaura darbs novērš šo problēmu, nodrošinot NLP bibliotēku sistemātisku salīdzinājumu, proti, NLTK, CoreNLP un TextBlob. Bakalaura darbā tiek pētīta šo bibliotēku efektivitāte un lietderība, veicot paplašinātus eksperimentus ar vispārējas nozīmes datu kopām un specifisko gadījumu datu kopām. Šī bakalaura darba rezultāti dod vērtīgu informāciju par katras bibliotēkas stiprajām un vājajām pusēm, kas sniedz praktiķiem un pētniekiem pietiekamu pamatu, lai pieņemtu atbilstošus lēmumus par viņu NLP lietojumprogrammām. Uzsverot salīdzinošās analīzes un pielāgošanās spējas nozīmi, bakalaura darbs veicina NLP jomas un tās pielietojuma jomas attīstību dažādos reālās pasaules scenārijos.
Atslēgas vārdi Atslēgvārdi: Dabiskās valodas apstrāde, NLTK, CoreNLP, TextBlob, noskaņojuma analīze
Atslēgas vārdi angļu valodā Keywords: Natural Language Processing, NLTK, CoreNLP, TextBlob, Sentiment Analysis
Valoda eng
Gads 2025
Darba augšupielādes datums un laiks 02.01.2025 18:58:14