Form of studies |
Bachelor |
Title of the study programm |
Information Technology |
Title in original language |
Datizracē balstīta cukura diabētu ietekmējošo faktoru analīze |
Title in English |
Data Mining Based Analysis of Factors Influencing Diabetes Mellitus |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Arnis Kiršners |
Reviewer |
Mg. sc. ing. Olga Jepifanova |
Abstract |
Diabēts, ja to neārstē pareizi un savlaicīgi, var izraisīt ļoti nopietnas komplikācijas. Tas padara diabētu par vienu no galvenajām prioritātēm medicīnas zinātnes pētījumos, kas savukārt rada milzīgu datu apjomu.
Darba mērķis ir noteikt cukura diabēta faktorus, kas ietekmē atkārtotu pacientu stacionēšanu. Lai sasniegtu izvirzīto mērķi tiek analizēta zinātniskā literatūra un apzināta datu kopa, kurai tiek izpildīta datu pirmapstrāde. Veikts analizējamo atribūtu ietekmes novērtējums. Izpildīta datu klasifikācija, kur rezultāti tiek interpretēti ar pārpratuma matricu, veikta rezultātu analīze un sniegtas rekomendācijas. Dati tiek klasificēti programatūrā Weka ar trim klasifikācijas algoritmiem: K-tuvāko kaimiņu, C4.5 un Naivais Baijesa.
Darbā tiek izmantotas divas datu kopas, kur eksperimentāli “Pima Indians Diabetes”
datu kopai tiek noteikts, ka piemērotākais klasifikācijas algoritms ir Naivais Baijesa, kura klasifikatora precizitāte - 73%, jutīgums - 63% un specifiskums - 78%, kā arī pārējo algoritmu precizitāte ir aptuveni 70%. “Diabetes 130-US hospitals for years 1999-2008” datu kopai tie noteikts, ka piemērotākais klasifikācijas algoritms ir C4.5, kura klasifikatora precizitāte - 63%, jutīgums - 63% un specifiskums - 59%. Otrās datu kopas klasifikācijas algoritmi nesniedz apmierinošus rezultātus, tiek secināts, ka lasifikācijas veiktspējas rādītāji liecina, ka izmantotajā datu kopā nav izteiktu sakarību starp atribūtu vērtībām un klases iezīmi. |
Keywords |
Datizrace, Klasifikācija, Weka, K-tuvāko kaimiņu, C4.5, Navais Baijesa |
Keywords in English |
Data mining, clasification, Weka, K-nearest neighbour, C4.5, Naive Bayes |
Language |
lv |
Year |
2021 |
Date and time of uploading |
05.06.2021 21:08:56 |