Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Information Technology
Title in original language Datizracē balstīta cukura diabētu ietekmējošo faktoru analīze
Title in English Data Mining Based Analysis of Factors Influencing Diabetes Mellitus
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Arnis Kiršners
Reviewer Mg. sc. ing. Olga Jepifanova
Abstract Diabēts, ja to neārstē pareizi un savlaicīgi, var izraisīt ļoti nopietnas komplikācijas. Tas padara diabētu par vienu no galvenajām prioritātēm medicīnas zinātnes pētījumos, kas savukārt rada milzīgu datu apjomu. Darba mērķis ir noteikt cukura diabēta faktorus, kas ietekmē atkārtotu pacientu stacionēšanu. Lai sasniegtu izvirzīto mērķi tiek analizēta zinātniskā literatūra un apzināta datu kopa, kurai tiek izpildīta datu pirmapstrāde. Veikts analizējamo atribūtu ietekmes novērtējums. Izpildīta datu klasifikācija, kur rezultāti tiek interpretēti ar pārpratuma matricu, veikta rezultātu analīze un sniegtas rekomendācijas. Dati tiek klasificēti programatūrā Weka ar trim klasifikācijas algoritmiem: K-tuvāko kaimiņu, C4.5 un Naivais Baijesa. Darbā tiek izmantotas divas datu kopas, kur eksperimentāli “Pima Indians Diabetes” datu kopai tiek noteikts, ka piemērotākais klasifikācijas algoritms ir Naivais Baijesa, kura klasifikatora precizitāte - 73%, jutīgums - 63% un specifiskums - 78%, kā arī pārējo algoritmu precizitāte ir aptuveni 70%. “Diabetes 130-US hospitals for years 1999-2008” datu kopai tie noteikts, ka piemērotākais klasifikācijas algoritms ir C4.5, kura klasifikatora precizitāte - 63%, jutīgums - 63% un specifiskums - 59%. Otrās datu kopas klasifikācijas algoritmi nesniedz apmierinošus rezultātus, tiek secināts, ka lasifikācijas veiktspējas rādītāji liecina, ka izmantotajā datu kopā nav izteiktu sakarību starp atribūtu vērtībām un klases iezīmi.
Keywords Datizrace, Klasifikācija, Weka, K-tuvāko kaimiņu, C4.5, Navais Baijesa
Keywords in English Data mining, clasification, Weka, K-nearest neighbour, C4.5, Naive Bayes
Language lv
Year 2021
Date and time of uploading 05.06.2021 21:08:56