Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Datorsistēmas |
Nosaukums |
Nltk un Spacy valodu apstrādes bibliotēku salīdzinājums |
Nosaukums angļu valodā |
Comparison of Nltk and Spacy natural language processing libraries |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Valdis Saulespurēns |
Recenzents |
Vita Šakele |
Anotācija |
Veids 1: Mu ̄sdien ̄ıgu risin ̄ajumu izp ̄ete
Pēdējos gados ir palielinājies mākslīgā intelekta (AI) un mašīnmācīšanās (ML) lietojums IT domēns. Python ir kļuvusi par populāru programmēšanas valodu datu zinātnē, datu analītikā un mašīnmācīšanās jomā tostarp dabiskās valodas apstrādē tās vienkāršības, paplašināmība un raksturīgās lasāmības dēļ. Patlaban ir pieejami daudzi NLP rīku lai veiktu uzdevumus, kas saistīti ar valodas apstrādi. Lietotājam nav jāizstrādā pilnīgi jauns rīks, lai veiktu NLP pamatuzdevumus, piemēram, tokenizāciju, lemmatizāciju, POS iezīmēšana kā arī Nosaukto Entitāšu noteikšanu. Šis bakalaura darbs salīdzina divas visizplatītākās NLP bibliotēkas (NLTK un spaCy). Tas sniedz pārskatu par to, kuru rīku piemērotāk izmantot izvēlētās funkcionalitātes ātruma ziņā. Darbs arī parāda šādas funkcionalitātes ieviešanu Python abās bibliotēkās. Turklāt autors secināja, ka Spacy lielākajā daļā scenāriju darbojas veiksmīgāk ātruma ziņā, salīdzinot ar NLTK. Papildus šajā pētījumā analizēta Tamilu valodas atbalsta pieejamība abās šajās bibliotēkās, kas paver ceļu turpmākiem pētījumiem.
Bakalaura darbs satur 83 pp, 26 attēlus, 03 pielikumus, 14 tabulas un 67 atsauces. |
Atslēgas vārdi |
NATURAL LANGUAGE PROCESSING, NLTK, SPACY,NER |
Atslēgas vārdi angļu valodā |
NATURAL LANGUAGE PROCESSING, NLTK, SPACY,NER |
Valoda |
eng |
Gads |
2022 |
Darba augšupielādes datums un laiks |
25.05.2022 13:11:05 |