Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Datorsistēmas |
Nosaukums |
Klasterizēšanas algoritmi zinātnisku rakstu kategorizēšanai |
Nosaukums angļu valodā |
Clustering Algorithms for Categorization of Scientific Papers |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Gints Jēkabsons |
Recenzents |
Docents Gundars Alksnis |
Anotācija |
Šajā bakalaura darbā tiek apskatīti grupēšanas/klasterizācijas, dokumentu grupēšanas, mašīnmācīšanās jēdzieni, kā arī grupēšanas algoritmi un iespējas tos izmantot, lai grupētu / organizētu zinātnisko darbu komplektu. Tajā ir strukturēta informācija par iepriekšminēto tēmu teoriju, kā arī grupēšanas/klasterizācijas algoritmu salīdzinājums un pielietojums. Visas uzkrātās zināšanas tiek izmantotas programmatūras izstrādei, kas var automātiski grupēt dokumentus, kā arī ieteikt, kurai kopai jāpiešķir jauns dokuments. Izpētīti vairāki grupēšanas/klasterizācijas algoritmi, un tikai divi no tiem tiek izmantoti, lai praktiski strādātu un eksperimentētu. Eksperimenta posmā abi algoritmi tiek vērtēti pēc efektivitātes un tā, cik dokuments ir labi piešķirts. Pēc tam šo novērtējumu izmanto, lai izlemtu, kurš no algoritmiem darbojas vislabāk, lai izveidotu iepriekšminēto programmatūru. Šī programmatūra atgādinās dokumentu rekomendējošās sistēmas prototipu, kas darbu ar dokumentiem cilvēkiem padarīs daudz vieglāku, nekā tas parasti ir, tas ir, nepieciešamība tos manuāli organizēt, kad mums tam īsti nav laika.
Maģistra darbs satur 49 lappuses, 16 attēlus, 5 tabulas, un 42 literatūras avotus. |
Atslēgas vārdi |
Klasteru analīze, dokumentu grupēšana, klasterizācijas algoritmi. |
Atslēgas vārdi angļu valodā |
Cluster analysis, document clustering, clustering algorithms. |
Valoda |
eng |
Gads |
2020 |
Darba augšupielādes datums un laiks |
05.06.2020 14:23:38 |