Form of studies |
Bachelor |
Title of the study programm |
Information Technology |
Title in original language |
Klasifikācijas koku veidošana ar CART algoritmu |
Title in English |
Cart Algorithm Based Classification Tree Construction |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Mg. sc. ing. Sergejs Paršutins |
Reviewer |
Dr. sc. ing. Jurijs Korņijenko |
Abstract |
Bakalaura darbā tika pētīti klasifikācijas koki, to veidošanas principi un klasifikācijas koku veidi, sīki analizējot klasifikācijas koku konstruēšanas algoritma CART veidošanas principus.
Darba tēmas aktualitāte ir risku samazināšana, pieņemot lēmumus, kas saistīti ar internetveikala pasūtītāju nolūkiem apmaksāt pasūtījumus, tādējādi novēršot finansiālus zaudējumus. Darba teorētiskā nozīme ir CART algoritma pielietojums klasifikācijas uzdevumu risināšanā. Darbā ir izpētīts un detalizēti aprakstīti algoritma veidošanas principi, labākās šķēluma veidošanas metodes, koka nogriešanas process, algoritma pārbaudes metodes.
Darbā izmantotas datu pirmsapstrādes metodes, klasifikācijas un validācijas metodes. Izpētītas šķēlumu novērtējuma funkcijas- Gini, uz entropijas samazināšanu balstīta metode, Twoing. Salīdzinot vairākus šķēluma sadalījuma likumus tika noteikts visefektīvākais, kas dod vislabāko rezultātu. Klasifikācijas veiktspēja ir vērtēta ar 5-kārtīgu šķērsvalidāciju. Apmācības nolūkos tika manuāli konstruēts CART algoritms datu kopai, saturošai 2 atribūtus un 50 ierakstus, kā arī noteikts visefektīvākais koka izmērs, izmantojot koka nošķelšanas metodi. Plašāk tika pētītas programmatūras Orange Canvas sniegtās iespējas klasifikācijas uzdevumu risināšanā. Konstruējot klasifikācijas algoritmu tika salīdzināti CART algoritma, C4.5 un Naivā Baijesa klasifikatora rezultāti un noteikts precīzākais klasifikators šim klasifikācijas uzdevumam.
Uzdevumu risināšanai tika izmantota programmatūra Orange Canvas. Darba izstrādāšanas gaitā tika izmantotas Microsoft Excel vidē veidotas procedūras, lai nodrošinātu datu pirmsapstrādes procesu. |
Keywords |
CART algoritms, klasifikācija, klasifikācijas koki, datu ieguve, |
Keywords in English |
CART algorythm, classification, classification trees, data mining |
Language |
lv |
Year |
2011 |
Date and time of uploading |
21.06.2011 15:11:01 |