Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Klasifikācijas koku veidošana ar CART algoritmu |
Nosaukums angļu valodā |
Cart Algorithm Based Classification Tree Construction |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Mg. sc. ing. Sergejs Paršutins |
Recenzents |
Dr. sc. ing. Jurijs Korņijenko |
Anotācija |
Bakalaura darbā tika pētīti klasifikācijas koki, to veidošanas principi un klasifikācijas koku veidi, sīki analizējot klasifikācijas koku konstruēšanas algoritma CART veidošanas principus.
Darba tēmas aktualitāte ir risku samazināšana, pieņemot lēmumus, kas saistīti ar internetveikala pasūtītāju nolūkiem apmaksāt pasūtījumus, tādējādi novēršot finansiālus zaudējumus. Darba teorētiskā nozīme ir CART algoritma pielietojums klasifikācijas uzdevumu risināšanā. Darbā ir izpētīts un detalizēti aprakstīti algoritma veidošanas principi, labākās šķēluma veidošanas metodes, koka nogriešanas process, algoritma pārbaudes metodes.
Darbā izmantotas datu pirmsapstrādes metodes, klasifikācijas un validācijas metodes. Izpētītas šķēlumu novērtējuma funkcijas- Gini, uz entropijas samazināšanu balstīta metode, Twoing. Salīdzinot vairākus šķēluma sadalījuma likumus tika noteikts visefektīvākais, kas dod vislabāko rezultātu. Klasifikācijas veiktspēja ir vērtēta ar 5-kārtīgu šķērsvalidāciju. Apmācības nolūkos tika manuāli konstruēts CART algoritms datu kopai, saturošai 2 atribūtus un 50 ierakstus, kā arī noteikts visefektīvākais koka izmērs, izmantojot koka nošķelšanas metodi. Plašāk tika pētītas programmatūras Orange Canvas sniegtās iespējas klasifikācijas uzdevumu risināšanā. Konstruējot klasifikācijas algoritmu tika salīdzināti CART algoritma, C4.5 un Naivā Baijesa klasifikatora rezultāti un noteikts precīzākais klasifikators šim klasifikācijas uzdevumam.
Uzdevumu risināšanai tika izmantota programmatūra Orange Canvas. Darba izstrādāšanas gaitā tika izmantotas Microsoft Excel vidē veidotas procedūras, lai nodrošinātu datu pirmsapstrādes procesu. |
Atslēgas vārdi |
CART algoritms, klasifikācija, klasifikācijas koki, datu ieguve, |
Atslēgas vārdi angļu valodā |
CART algorythm, classification, classification trees, data mining |
Valoda |
lv |
Gads |
2011 |
Darba augšupielādes datums un laiks |
21.06.2011 15:11:01 |