Form of studies |
Bachelor |
Title of the study programm |
Computer Systems |
Title in original language |
Nltk un Spacy valodu apstrādes bibliotēku salīdzinājums |
Title in English |
Comparison of Nltk and Spacy natural language processing libraries |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Valdis Saulespurēns |
Reviewer |
Vita Šakele |
Abstract |
Veids 1: Mu ̄sdien ̄ıgu risin ̄ajumu izp ̄ete
Pēdējos gados ir palielinājies mākslīgā intelekta (AI) un mašīnmācīšanās (ML) lietojums IT domēns. Python ir kļuvusi par populāru programmēšanas valodu datu zinātnē, datu analītikā un mašīnmācīšanās jomā tostarp dabiskās valodas apstrādē tās vienkāršības, paplašināmība un raksturīgās lasāmības dēļ. Patlaban ir pieejami daudzi NLP rīku lai veiktu uzdevumus, kas saistīti ar valodas apstrādi. Lietotājam nav jāizstrādā pilnīgi jauns rīks, lai veiktu NLP pamatuzdevumus, piemēram, tokenizāciju, lemmatizāciju, POS iezīmēšana kā arī Nosaukto Entitāšu noteikšanu. Šis bakalaura darbs salīdzina divas visizplatītākās NLP bibliotēkas (NLTK un spaCy). Tas sniedz pārskatu par to, kuru rīku piemērotāk izmantot izvēlētās funkcionalitātes ātruma ziņā. Darbs arī parāda šādas funkcionalitātes ieviešanu Python abās bibliotēkās. Turklāt autors secināja, ka Spacy lielākajā daļā scenāriju darbojas veiksmīgāk ātruma ziņā, salīdzinot ar NLTK. Papildus šajā pētījumā analizēta Tamilu valodas atbalsta pieejamība abās šajās bibliotēkās, kas paver ceļu turpmākiem pētījumiem.
Bakalaura darbs satur 83 pp, 26 attēlus, 03 pielikumus, 14 tabulas un 67 atsauces. |
Keywords |
NATURAL LANGUAGE PROCESSING, NLTK, SPACY,NER |
Keywords in English |
NATURAL LANGUAGE PROCESSING, NLTK, SPACY,NER |
Language |
eng |
Year |
2022 |
Date and time of uploading |
25.05.2022 13:11:05 |