| Studiju veids |
bakalaura akadēmiskās studijas |
| Studiju programmas nosaukums |
Datorsistēmas |
| Nosaukums |
Statistiskā celmošana latviešu valodai |
| Nosaukums angļu valodā |
Statistical Stemming for the Latvian Language |
| Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
| Darba vadītājs |
Gints Jēkabsons |
| Recenzents |
Kristaps Bērziņš |
| Anotācija |
Informācijas izguves jomā ir pieejami daudzi algoritmi vārdu celmošanai, taču katram no tiem ir savi ierobežojumi un priekšrocības. Bakalaura darba mērķis ir novērtēt un izpētīt statistiskos celmošanas algoritmus latviešu valodai, identificējot to efektivitāti, pielietojuma priekšrocības un ierobežojumus, kā arī to praktisko izmantojamību teksta apstrādes un informācijas izguves sistēmās. Darbā apskatīti populārākie un latviešu valodai piemērotākie statistiskie celmotāji – N-grammu, GRAS un YASS algoritmi, un to darbība novērtēta dokumentu izguves uzdevumā. Iegūtie rezultāti parāda, ka N-grammu algoritms ir visatbilstošākais statistiskais celmotājs, dokumentu izguves uzdevumos latviešu valodā. |
| Atslēgas vārdi |
Celmošana, celmošanas algoritmi, informācijas izguve, teksta apstrāde. |
| Atslēgas vārdi angļu valodā |
Stemming, stemming algorithms, information retrieval, text processing. |
| Valoda |
lv |
| Gads |
2025 |
| Darba augšupielādes datums un laiks |
27.05.2025 15:29:51 |