Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Computer Systems
Title in original language Statistiskā celmošana latviešu valodai
Title in English Statistical Stemming for the Latvian Language
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Gints Jēkabsons
Reviewer Kristaps Bērziņš
Abstract Informācijas izguves jomā ir pieejami daudzi algoritmi vārdu celmošanai, taču katram no tiem ir savi ierobežojumi un priekšrocības. Bakalaura darba mērķis ir novērtēt un izpētīt statistiskos celmošanas algoritmus latviešu valodai, identificējot to efektivitāti, pielietojuma priekšrocības un ierobežojumus, kā arī to praktisko izmantojamību teksta apstrādes un informācijas izguves sistēmās. Darbā apskatīti populārākie un latviešu valodai piemērotākie statistiskie celmotāji – N-grammu, GRAS un YASS algoritmi, un to darbība novērtēta dokumentu izguves uzdevumā. Iegūtie rezultāti parāda, ka N-grammu algoritms ir visatbilstošākais statistiskais celmotājs, dokumentu izguves uzdevumos latviešu valodā.
Keywords Celmošana, celmošanas algoritmi, informācijas izguve, teksta apstrāde.
Keywords in English Stemming, stemming algorithms, information retrieval, text processing.
Language lv
Year 2025
Date and time of uploading 27.05.2025 15:29:51