Anotācija |
Darba mērķis ir izpētīt dažādas programmatūras un veikt to salīdzināšanu, lietojumu datizraces problēmu risināšanā. Atbilstoši izvirzītajiem uzdevumiem darbā ir veikta lietojamo datu kopu pirmapstrādes aprakstīšana, praktiskā uzdevuma izvirzīšana un atrisināšana, kā arī lietotāja ceļveža izveide, aprakstot iespējas un ierobežojumus.
Darba aktualitāti pierāda pieaugošais datizraces metodoloģijas lietojumu skaits biznesa procesos datizraces problēmu risināšanā. Reālas dzīves situācijas reti, kad ir iespējams aprakstīt ar vienkāršu modeļu palīdzību, līdz ar to saprātīgākais risinājums ir speciālas datizraces programmatūras izmantošana. Turklāt pat ja ir iespējams izveidot piemēru bez programmatūras palīdzības, tad jebkuru izmaiņu veikšana ir nepieņemami laikietilpīga. Darbā tiek aprakstītas un izmantotas 7 datizraces programmatūras – RapidMiner, Weka, KNIME, Orange, R, Rattle un KEEL.
Darbs sastāv no 3 nodaļām – teorētiskās daļas, praktiskās daļas un salīdzinājuma, lietotāja ceļveža. Teorētiskajā daļā ir aprakstīti datizraces apraksts un izpētītas datizraces metožu iedalījums. Tāpat aprakstīti klasifikāciju un klasterizāciju veidi.
Otrajā daļā nedaudz aprakstītas izvērtējamās un salīdzināmās programmatūras. Savukārt eksperimentālajā daļā ir veikta praktiskā uzdevuma izvirzīšana un atrisināšana, ņemtas 4 vispārzināmas datu kopas un ar programmatūru un to algoritmu palīdzību aprēķināta precizitāte atbilstoši teorētiskajā daļā aprakstītajām metodēm, iegūstot priekšstatu gan par rīka iespējām, gan trūkumiem, gan arī iespējamiem ierobežojumiem tā praktiskajā lietošanā. Lietotāja ceļvedī tiek izpētīta visu datizraces rīku funkcionalitāte un lietojumi. Darba nobeigumā tiek izdarīti secinājumi par rīku lietojamību datizracē. |