Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Markova ķēžu izmantošanas iespēju izpēte autora stila identifikācijai |
Nosaukums angļu valodā |
The Investigation of Possible Application of Markov Chains as a Tool for Authorship Style Identification |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Mg. sc. ing. Pāvels Osipovs |
Recenzents |
Mg. sc. ing. Egmonts Treiguts |
Anotācija |
Mērķis ir izpētīt Markova ķēdes pielietojuma iespējas autora stila modeļa konstruēšanas uzdevumā. Kā galvenā mērķa sasniegšanas metode ir eksperimentu veikšana, izmantojot patstāvīgi izstrādātu programmatūras kompleksu. Pamata process eksperimentu veikšanā ir autora stilā radīto modeļu krusteniskais salīdzinājums ar citu autoru tekstiem, un šo autoru stilu atbilstības līmeņa aprēķināšana.
Eksperimenti veikti ar dažādiem teksta priekšapstrādes variantiem, kā arī ar dažādām izmantoto algoritmu iekšējo parametru vērtībām.
Rezultātā atklājās iespēja atpazīt autora stilu, izmantojot varbūtības vai biežuma metrikas. Ir noteikts, ka mazie vārdi un pieturzīmes, praktiski, neietekmē atpazīšanas gala rezultātu. Locījumu normalizēšana var palielināt nezināmu autoru atpazīstamību, taču tas trūkums ir neprecīza galotņu un piedēkļu atpazīstamība, kas noved pie nepareizas vārda formas. Izmantojamā algoritma iekšējo parametru maiņa neietekmē atpazīšanas gala rezultātu.
Darba apjoms 50 lpp., 7 tabulas, 25 attēli un 7 pielikumi. |
Atslēgas vārdi |
Autora stila identifikācija, Markova ķēdes, Grafu salīdzināšana, Autora stila metrika |
Atslēgas vārdi angļu valodā |
Authorship style identification, Markov chains, Graph comparison, Authorship style metrics |
Valoda |
lv |
Gads |
2014 |
Darba augšupielādes datums un laiks |
10.06.2014 11:59:40 |