Abstract |
Šajā bakalaura darbā tiek apskatīti grupēšanas/klasterizācijas, dokumentu grupēšanas, mašīnmācīšanās jēdzieni, kā arī grupēšanas algoritmi un iespējas tos izmantot, lai grupētu / organizētu zinātnisko darbu komplektu. Tajā ir strukturēta informācija par iepriekšminēto tēmu teoriju, kā arī grupēšanas/klasterizācijas algoritmu salīdzinājums un pielietojums. Visas uzkrātās zināšanas tiek izmantotas programmatūras izstrādei, kas var automātiski grupēt dokumentus, kā arī ieteikt, kurai kopai jāpiešķir jauns dokuments. Izpētīti vairāki grupēšanas/klasterizācijas algoritmi, un tikai divi no tiem tiek izmantoti, lai praktiski strādātu un eksperimentētu. Eksperimenta posmā abi algoritmi tiek vērtēti pēc efektivitātes un tā, cik dokuments ir labi piešķirts. Pēc tam šo novērtējumu izmanto, lai izlemtu, kurš no algoritmiem darbojas vislabāk, lai izveidotu iepriekšminēto programmatūru. Šī programmatūra atgādinās dokumentu rekomendējošās sistēmas prototipu, kas darbu ar dokumentiem cilvēkiem padarīs daudz vieglāku, nekā tas parasti ir, tas ir, nepieciešamība tos manuāli organizēt, kad mums tam īsti nav laika.
Maģistra darbs satur 49 lappuses, 16 attēlus, 5 tabulas, un 42 literatūras avotus. |