Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Klasifikācijas koku veidošana ar CART algoritmu
Nosaukums angļu valodā Cart Algorithm Based Classification Tree Construction
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Mg. sc. ing. Sergejs Paršutins
Recenzents Dr. sc. ing. Jurijs Korņijenko
Anotācija Bakalaura darbā tika pētīti klasifikācijas koki, to veidošanas principi un klasifikācijas koku veidi, sīki analizējot klasifikācijas koku konstruēšanas algoritma CART veidošanas principus. Darba tēmas aktualitāte ir risku samazināšana, pieņemot lēmumus, kas saistīti ar internetveikala pasūtītāju nolūkiem apmaksāt pasūtījumus, tādējādi novēršot finansiālus zaudējumus. Darba teorētiskā nozīme ir CART algoritma pielietojums klasifikācijas uzdevumu risināšanā. Darbā ir izpētīts un detalizēti aprakstīti algoritma veidošanas principi, labākās šķēluma veidošanas metodes, koka nogriešanas process, algoritma pārbaudes metodes. Darbā izmantotas datu pirmsapstrādes metodes, klasifikācijas un validācijas metodes. Izpētītas šķēlumu novērtējuma funkcijas- Gini, uz entropijas samazināšanu balstīta metode, Twoing. Salīdzinot vairākus šķēluma sadalījuma likumus tika noteikts visefektīvākais, kas dod vislabāko rezultātu. Klasifikācijas veiktspēja ir vērtēta ar 5-kārtīgu šķērsvalidāciju. Apmācības nolūkos tika manuāli konstruēts CART algoritms datu kopai, saturošai 2 atribūtus un 50 ierakstus, kā arī noteikts visefektīvākais koka izmērs, izmantojot koka nošķelšanas metodi. Plašāk tika pētītas programmatūras Orange Canvas sniegtās iespējas klasifikācijas uzdevumu risināšanā. Konstruējot klasifikācijas algoritmu tika salīdzināti CART algoritma, C4.5 un Naivā Baijesa klasifikatora rezultāti un noteikts precīzākais klasifikators šim klasifikācijas uzdevumam. Uzdevumu risināšanai tika izmantota programmatūra Orange Canvas. Darba izstrādāšanas gaitā tika izmantotas Microsoft Excel vidē veidotas procedūras, lai nodrošinātu datu pirmsapstrādes procesu.
Atslēgas vārdi CART algoritms, klasifikācija, klasifikācijas koki, datu ieguve,
Atslēgas vārdi angļu valodā CART algorythm, classification, classification trees, data mining
Valoda lv
Gads 2011
Darba augšupielādes datums un laiks 21.06.2011 15:11:01