Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Datizracē balstīta cukura diabētu ietekmējošo faktoru analīze
Nosaukums angļu valodā Data Mining Based Analysis of Factors Influencing Diabetes Mellitus
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Arnis Kiršners
Recenzents Mg. sc. ing. Olga Jepifanova
Anotācija Diabēts, ja to neārstē pareizi un savlaicīgi, var izraisīt ļoti nopietnas komplikācijas. Tas padara diabētu par vienu no galvenajām prioritātēm medicīnas zinātnes pētījumos, kas savukārt rada milzīgu datu apjomu. Darba mērķis ir noteikt cukura diabēta faktorus, kas ietekmē atkārtotu pacientu stacionēšanu. Lai sasniegtu izvirzīto mērķi tiek analizēta zinātniskā literatūra un apzināta datu kopa, kurai tiek izpildīta datu pirmapstrāde. Veikts analizējamo atribūtu ietekmes novērtējums. Izpildīta datu klasifikācija, kur rezultāti tiek interpretēti ar pārpratuma matricu, veikta rezultātu analīze un sniegtas rekomendācijas. Dati tiek klasificēti programatūrā Weka ar trim klasifikācijas algoritmiem: K-tuvāko kaimiņu, C4.5 un Naivais Baijesa. Darbā tiek izmantotas divas datu kopas, kur eksperimentāli “Pima Indians Diabetes” datu kopai tiek noteikts, ka piemērotākais klasifikācijas algoritms ir Naivais Baijesa, kura klasifikatora precizitāte - 73%, jutīgums - 63% un specifiskums - 78%, kā arī pārējo algoritmu precizitāte ir aptuveni 70%. “Diabetes 130-US hospitals for years 1999-2008” datu kopai tie noteikts, ka piemērotākais klasifikācijas algoritms ir C4.5, kura klasifikatora precizitāte - 63%, jutīgums - 63% un specifiskums - 59%. Otrās datu kopas klasifikācijas algoritmi nesniedz apmierinošus rezultātus, tiek secināts, ka lasifikācijas veiktspējas rādītāji liecina, ka izmantotajā datu kopā nav izteiktu sakarību starp atribūtu vērtībām un klases iezīmi.
Atslēgas vārdi Datizrace, Klasifikācija, Weka, K-tuvāko kaimiņu, C4.5, Navais Baijesa
Atslēgas vārdi angļu valodā Data mining, clasification, Weka, K-nearest neighbour, C4.5, Naive Bayes
Valoda lv
Gads 2021
Darba augšupielādes datums un laiks 05.06.2021 21:08:56