| Form of studies |
Bachelor |
| Title of the study programm |
Computer Systems |
| Title in original language |
Statistiskā celmošana latviešu valodai |
| Title in English |
Statistical Stemming for the Latvian Language |
| Department |
Faculty Of Computer Science Information Tehnology And Energy |
| Scientific advisor |
Gints Jēkabsons |
| Reviewer |
Kristaps Bērziņš |
| Abstract |
Informācijas izguves jomā ir pieejami daudzi algoritmi vārdu celmošanai, taču katram no tiem ir savi ierobežojumi un priekšrocības. Bakalaura darba mērķis ir novērtēt un izpētīt statistiskos celmošanas algoritmus latviešu valodai, identificējot to efektivitāti, pielietojuma priekšrocības un ierobežojumus, kā arī to praktisko izmantojamību teksta apstrādes un informācijas izguves sistēmās. Darbā apskatīti populārākie un latviešu valodai piemērotākie statistiskie celmotāji – N-grammu, GRAS un YASS algoritmi, un to darbība novērtēta dokumentu izguves uzdevumā. Iegūtie rezultāti parāda, ka N-grammu algoritms ir visatbilstošākais statistiskais celmotājs, dokumentu izguves uzdevumos latviešu valodā. |
| Keywords |
Celmošana, celmošanas algoritmi, informācijas izguve, teksta apstrāde. |
| Keywords in English |
Stemming, stemming algorithms, information retrieval, text processing. |
| Language |
lv |
| Year |
2025 |
| Date and time of uploading |
27.05.2025 15:29:51 |