Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Datorsistēmas
Nosaukums Nltk un Spacy valodu apstrādes bibliotēku salīdzinājums
Nosaukums angļu valodā Comparison of Nltk and Spacy natural language processing libraries
Struktūrvienība 12300 Lietišķo datorsistēmu institūts
Darba vadītājs Valdis Saulespurēns
Recenzents Vita Šakele
Anotācija Veids 1: Mu ̄sdien ̄ıgu risin ̄ajumu izp ̄ete Pēdējos gados ir palielinājies mākslīgā intelekta (AI) un mašīnmācīšanās (ML) lietojums IT domēns. Python ir kļuvusi par populāru programmēšanas valodu datu zinātnē, datu analītikā un mašīnmācīšanās jomā tostarp dabiskās valodas apstrādē tās vienkāršības, paplašināmība un raksturīgās lasāmības dēļ. Patlaban ir pieejami daudzi NLP rīku lai veiktu uzdevumus, kas saistīti ar valodas apstrādi. Lietotājam nav jāizstrādā pilnīgi jauns rīks, lai veiktu NLP pamatuzdevumus, piemēram, tokenizāciju, lemmatizāciju, POS iezīmēšana kā arī Nosaukto Entitāšu noteikšanu. Šis bakalaura darbs salīdzina divas visizplatītākās NLP bibliotēkas (NLTK un spaCy). Tas sniedz pārskatu par to, kuru rīku piemērotāk izmantot izvēlētās funkcionalitātes ātruma ziņā. Darbs arī parāda šādas funkcionalitātes ieviešanu Python abās bibliotēkās. Turklāt autors secināja, ka Spacy lielākajā daļā scenāriju darbojas veiksmīgāk ātruma ziņā, salīdzinot ar NLTK. Papildus šajā pētījumā analizēta Tamilu valodas atbalsta pieejamība abās šajās bibliotēkās, kas paver ceļu turpmākiem pētījumiem. Bakalaura darbs satur 83 pp, 26 attēlus, 03 pielikumus, 14 tabulas un 67 atsauces.
Atslēgas vārdi NATURAL LANGUAGE PROCESSING, NLTK, SPACY,NER
Atslēgas vārdi angļu valodā NATURAL LANGUAGE PROCESSING, NLTK, SPACY,NER
Valoda eng
Gads 2022
Darba augšupielādes datums un laiks 25.05.2022 13:11:05