Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Computer Systems
Title in original language Nltk un Spacy valodu apstrādes bibliotēku salīdzinājums
Title in English Comparison of Nltk and Spacy natural language processing libraries
Department 12300 Institute of Applied Computer Systems
Scientific advisor Valdis Saulespurēns
Reviewer Vita Šakele
Abstract Veids 1: Mu ̄sdien ̄ıgu risin ̄ajumu izp ̄ete Pēdējos gados ir palielinājies mākslīgā intelekta (AI) un mašīnmācīšanās (ML) lietojums IT domēns. Python ir kļuvusi par populāru programmēšanas valodu datu zinātnē, datu analītikā un mašīnmācīšanās jomā tostarp dabiskās valodas apstrādē tās vienkāršības, paplašināmība un raksturīgās lasāmības dēļ. Patlaban ir pieejami daudzi NLP rīku lai veiktu uzdevumus, kas saistīti ar valodas apstrādi. Lietotājam nav jāizstrādā pilnīgi jauns rīks, lai veiktu NLP pamatuzdevumus, piemēram, tokenizāciju, lemmatizāciju, POS iezīmēšana kā arī Nosaukto Entitāšu noteikšanu. Šis bakalaura darbs salīdzina divas visizplatītākās NLP bibliotēkas (NLTK un spaCy). Tas sniedz pārskatu par to, kuru rīku piemērotāk izmantot izvēlētās funkcionalitātes ātruma ziņā. Darbs arī parāda šādas funkcionalitātes ieviešanu Python abās bibliotēkās. Turklāt autors secināja, ka Spacy lielākajā daļā scenāriju darbojas veiksmīgāk ātruma ziņā, salīdzinot ar NLTK. Papildus šajā pētījumā analizēta Tamilu valodas atbalsta pieejamība abās šajās bibliotēkās, kas paver ceļu turpmākiem pētījumiem. Bakalaura darbs satur 83 pp, 26 attēlus, 03 pielikumus, 14 tabulas un 67 atsauces.
Keywords NATURAL LANGUAGE PROCESSING, NLTK, SPACY,NER
Keywords in English NATURAL LANGUAGE PROCESSING, NLTK, SPACY,NER
Language eng
Year 2022
Date and time of uploading 25.05.2022 13:11:05