Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Automātisko raksta kopsavilkumu veidošanas sistēmu izpēte un analīze |
Nosaukums angļu valodā |
Research and Analysis of Automatic Article Summarization Systems |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Dr. sc. ing. Sergejs Paršutins |
Recenzents |
Mg. sc. ing. Egmonts Treiguts |
Anotācija |
Mūsdienu pasaulē aizvien grūtāk kļūst atrast sev nepieciešamo informāciju, jo eksponenciāli pieaug internetā pieejamo rakstu apjoms. Šo problēmu var risināt, izmantojot automātiskas raksta kopsavilkumu veidošanas sistēmas, kas ļauj no jebkura raksta izveidot kopsavilkumu.
Darba gaitā tika izveidota sistēma latviešu valodas rakstu kopsavilkumu veidošanai. Izveidotā sistēma tika novērtēta ar ROUGE programmas palīdzību. Sistēma tika salīdzināta ar sistēmām: AutoSummarize, Swesum un Open Text Summarizer. Papildus šīm trim sistēmām tika izmantots kopsavilkums no raksta pirmajiem teikumiem un gadījuma izvelētiem teikumiem.
Uz izveidotās sistēmas piemēra tika izpētīti automātisko raksta kopsavilkumu veidošanas algoritmi un metodes. Sistēmu novērtēšanas procesā tika secināts, ka latviešu valodai pielāgotas sistēmas uzrāda labākus vidējos rezultātus, nekā valodas neatkarīgās sistēmas.
Darba apjoms - 63. lpp., 10 tabulas, 31 attēli un 4 pielikumi. |
Atslēgas vārdi |
Kopsavilkumu veidošana, TextRank algoritms, ROUGE programma |
Atslēgas vārdi angļu valodā |
Summarizing, TextRank algorithm, ROUGE program |
Valoda |
lv |
Gads |
2015 |
Darba augšupielādes datums un laiks |
28.05.2015 11:30:38 |