Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Information Technology
Title in original language Klasifikācijas koku veidošana ar CART algoritmu
Title in English Cart Algorithm Based Classification Tree Construction
Department 12100 Institute of Information Technology
Scientific advisor Mg. sc. ing. Sergejs Paršutins
Reviewer Dr. sc. ing. Jurijs Korņijenko
Abstract Bakalaura darbā tika pētīti klasifikācijas koki, to veidošanas principi un klasifikācijas koku veidi, sīki analizējot klasifikācijas koku konstruēšanas algoritma CART veidošanas principus. Darba tēmas aktualitāte ir risku samazināšana, pieņemot lēmumus, kas saistīti ar internetveikala pasūtītāju nolūkiem apmaksāt pasūtījumus, tādējādi novēršot finansiālus zaudējumus. Darba teorētiskā nozīme ir CART algoritma pielietojums klasifikācijas uzdevumu risināšanā. Darbā ir izpētīts un detalizēti aprakstīti algoritma veidošanas principi, labākās šķēluma veidošanas metodes, koka nogriešanas process, algoritma pārbaudes metodes. Darbā izmantotas datu pirmsapstrādes metodes, klasifikācijas un validācijas metodes. Izpētītas šķēlumu novērtējuma funkcijas- Gini, uz entropijas samazināšanu balstīta metode, Twoing. Salīdzinot vairākus šķēluma sadalījuma likumus tika noteikts visefektīvākais, kas dod vislabāko rezultātu. Klasifikācijas veiktspēja ir vērtēta ar 5-kārtīgu šķērsvalidāciju. Apmācības nolūkos tika manuāli konstruēts CART algoritms datu kopai, saturošai 2 atribūtus un 50 ierakstus, kā arī noteikts visefektīvākais koka izmērs, izmantojot koka nošķelšanas metodi. Plašāk tika pētītas programmatūras Orange Canvas sniegtās iespējas klasifikācijas uzdevumu risināšanā. Konstruējot klasifikācijas algoritmu tika salīdzināti CART algoritma, C4.5 un Naivā Baijesa klasifikatora rezultāti un noteikts precīzākais klasifikators šim klasifikācijas uzdevumam. Uzdevumu risināšanai tika izmantota programmatūra Orange Canvas. Darba izstrādāšanas gaitā tika izmantotas Microsoft Excel vidē veidotas procedūras, lai nodrošinātu datu pirmsapstrādes procesu.
Keywords CART algoritms, klasifikācija, klasifikācijas koki, datu ieguve,
Keywords in English CART algorythm, classification, classification trees, data mining
Language lv
Year 2011
Date and time of uploading 21.06.2011 15:11:01