Statistiskā celmošana latviešu valodai

Noslēguma darbu reģistrs

Studiju darba apraksts

Studiju veids	bakalaura akadēmiskās studijas
Studiju programmas nosaukums	Datorsistēmas
Nosaukums	Statistiskā celmošana latviešu valodai
Nosaukums angļu valodā	Statistical Stemming for the Latvian Language
Struktūrvienība	33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs	Gints Jēkabsons
Recenzents	Kristaps Bērziņš
Anotācija	Informācijas izguves jomā ir pieejami daudzi algoritmi vārdu celmošanai, taču katram no tiem ir savi ierobežojumi un priekšrocības. Bakalaura darba mērķis ir novērtēt un izpētīt statistiskos celmošanas algoritmus latviešu valodai, identificējot to efektivitāti, pielietojuma priekšrocības un ierobežojumus, kā arī to praktisko izmantojamību teksta apstrādes un informācijas izguves sistēmās. Darbā apskatīti populārākie un latviešu valodai piemērotākie statistiskie celmotāji – N-grammu, GRAS un YASS algoritmi, un to darbība novērtēta dokumentu izguves uzdevumā. Iegūtie rezultāti parāda, ka N-grammu algoritms ir visatbilstošākais statistiskais celmotājs, dokumentu izguves uzdevumos latviešu valodā.
Atslēgas vārdi	Celmošana, celmošanas algoritmi, informācijas izguve, teksta apstrāde.
Atslēgas vārdi angļu valodā	Stemming, stemming algorithms, information retrieval, text processing.
Valoda	lv
Gads	2025
Darba augšupielādes datums un laiks	27.05.2025 15:29:51