Studiju veids |
maģistra akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Induktīvo klasifikācijas koku un ģenētiskās programmēšanas risinājumu salīdzinājums |
Nosaukums angļu valodā |
Comparison of Inductive Classification Trees and Genetic Programming Performance in Classification Tasks |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Dr. habil. sc. comp. Arkādijs Borisovs |
Recenzents |
Dr. sc. ing. Sigita Misiņa |
Anotācija |
Darbā tiek veikts klasifikācijas uzdevums izmantojot klasifikācijas koku indukcijas un ģenētiskās programmēšanas pieejas. Ģenētiskā programmēšana ir interesanta ar to, ka balstās uz Darvina evolūcijas pamatprincipiem, kas tiek ieviesti datorzinātnē.
Klasifikācijai tiek izmantota 2005.gada konkursa Data Mining Cup izsludinātā datu kopa. Lai varētu veikt klasificēšanu, datu kopa tiek pirmapstrādāta. Pirmapstrādes rezultātā datu kopa samazina savus izmērus un, lai nezaudētu daļu informācijas, kas varētu būt noderīga klasificēšanai, datu kopa tiek sadalīta divās daļās.
Katrai klasifikācijas pieejai tiek izmantots cits datu ieguves rīks: ģenētiskajai programmēšanai - rīks Discipulus, savukārt klasifikācijas koku indukcijai Orange Canvas. Tiek veikti vairāki eksperimenti ar izmantotajiem klasifikatoriem. Katrs eksperiments sastāv no vairākiem mēģinājumiem. Katra mēģinājuma laikā tiek mainīti klasifikatora uzstādījumi, piemēram, koka dziļums, populācijas izmērs, ģenētisko operatoru izmantošanas varbūtība un citi, lai iegūtu katrai datu kopai piemērotāko klasifikatoru un tā uzstādījumus. Klasifikatora precizitāte tiek noteikta izmantojot informāciju, ko sniedz neskaidrību matrica. Iegūtie klasifikācijas rezultāti tiek salīdzināti, kā arī tiek mēģināts rast skaidrojumu, kādēļ tika iegūti šādi rezultāti. |
Atslēgas vārdi |
klasificēšana, klasifikācijas koku indukcija, ģenētiskā programmēšana, datu pirmapstrāde |
Atslēgas vārdi angļu valodā |
classification, the classification tree induction, genetic programming, data pre-processing |
Valoda |
lv |
Gads |
2012 |
Darba augšupielādes datums un laiks |
30.05.2012 13:00:24 |