Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Datorsistēmas
Nosaukums Statistiskā celmošana latviešu valodai
Nosaukums angļu valodā Statistical Stemming for the Latvian Language
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Gints Jēkabsons
Recenzents Kristaps Bērziņš
Anotācija Informācijas izguves jomā ir pieejami daudzi algoritmi vārdu celmošanai, taču katram no tiem ir savi ierobežojumi un priekšrocības. Bakalaura darba mērķis ir novērtēt un izpētīt statistiskos celmošanas algoritmus latviešu valodai, identificējot to efektivitāti, pielietojuma priekšrocības un ierobežojumus, kā arī to praktisko izmantojamību teksta apstrādes un informācijas izguves sistēmās. Darbā apskatīti populārākie un latviešu valodai piemērotākie statistiskie celmotāji – N-grammu, GRAS un YASS algoritmi, un to darbība novērtēta dokumentu izguves uzdevumā. Iegūtie rezultāti parāda, ka N-grammu algoritms ir visatbilstošākais statistiskais celmotājs, dokumentu izguves uzdevumos latviešu valodā.
Atslēgas vārdi Celmošana, celmošanas algoritmi, informācijas izguve, teksta apstrāde.
Atslēgas vārdi angļu valodā Stemming, stemming algorithms, information retrieval, text processing.
Valoda lv
Gads 2025
Darba augšupielādes datums un laiks 27.05.2025 15:29:51