Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Datizracē balstīta cukura diabētu ietekmējošo faktoru analīze |
Nosaukums angļu valodā |
Data Mining Based Analysis of Factors Influencing Diabetes Mellitus |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Arnis Kiršners |
Recenzents |
Mg. sc. ing. Olga Jepifanova |
Anotācija |
Diabēts, ja to neārstē pareizi un savlaicīgi, var izraisīt ļoti nopietnas komplikācijas. Tas padara diabētu par vienu no galvenajām prioritātēm medicīnas zinātnes pētījumos, kas savukārt rada milzīgu datu apjomu.
Darba mērķis ir noteikt cukura diabēta faktorus, kas ietekmē atkārtotu pacientu stacionēšanu. Lai sasniegtu izvirzīto mērķi tiek analizēta zinātniskā literatūra un apzināta datu kopa, kurai tiek izpildīta datu pirmapstrāde. Veikts analizējamo atribūtu ietekmes novērtējums. Izpildīta datu klasifikācija, kur rezultāti tiek interpretēti ar pārpratuma matricu, veikta rezultātu analīze un sniegtas rekomendācijas. Dati tiek klasificēti programatūrā Weka ar trim klasifikācijas algoritmiem: K-tuvāko kaimiņu, C4.5 un Naivais Baijesa.
Darbā tiek izmantotas divas datu kopas, kur eksperimentāli “Pima Indians Diabetes”
datu kopai tiek noteikts, ka piemērotākais klasifikācijas algoritms ir Naivais Baijesa, kura klasifikatora precizitāte - 73%, jutīgums - 63% un specifiskums - 78%, kā arī pārējo algoritmu precizitāte ir aptuveni 70%. “Diabetes 130-US hospitals for years 1999-2008” datu kopai tie noteikts, ka piemērotākais klasifikācijas algoritms ir C4.5, kura klasifikatora precizitāte - 63%, jutīgums - 63% un specifiskums - 59%. Otrās datu kopas klasifikācijas algoritmi nesniedz apmierinošus rezultātus, tiek secināts, ka lasifikācijas veiktspējas rādītāji liecina, ka izmantotajā datu kopā nav izteiktu sakarību starp atribūtu vērtībām un klases iezīmi. |
Atslēgas vārdi |
Datizrace, Klasifikācija, Weka, K-tuvāko kaimiņu, C4.5, Navais Baijesa |
Atslēgas vārdi angļu valodā |
Data mining, clasification, Weka, K-nearest neighbour, C4.5, Naive Bayes |
Valoda |
lv |
Gads |
2021 |
Darba augšupielādes datums un laiks |
05.06.2021 21:08:56 |