Form of studies |
Bachelor |
Title of the study programm |
Information Technology |
Title in original language |
Klašu formalizācija un klasifikatoru novērtēšana medicīniskās diagnostikas uzdevumā |
Title in English |
Class Formalization and Classifier Evaluation in the Task of Medical Diagnostics |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Dr. sc. ing. Inese Poļaka |
Reviewer |
Dr. sc. ing. Sigita Misiņa |
Abstract |
Kuņģa pirmsvēža un citu slimību diagnostikas seroloģiskās metodes šobrīd nav gana precīzas. Lai uzlabotu to precizitāti, nepieciešams formalizēt slimības izpausmes robežas, kuras izmantot testos (jeb klasēm klasifikācijas uzdevumā), un testu izmantotos faktorus un robežvērtības.
Uzdevumā tika izmantoti pacientu dati no kuņģa vēža pētījumiem, kuros ir analizētas dažādu pacientu asins seruma testu vērtības. Pētījumā salīdzināšanai ir izmantoti trīs ražotāju testi, kas veic mērījumus par kuņģa izdalīto enzīmu līmeni asins serumā.
Darbā tika veikta klašu formalizācija, izmantojot klasterizācijas metodes, kas izrādījās neveiksmīga. Novērtēt dabiski pastāvošas grupas datos ar klasterizācijas algoritmiem nebija iespējams, jo datiem ir sarežģīta struktūra, ko var izskaidrot ar cilvēku bioloģiskajām īpašībām. Tāpēc dati tika apskatīti pēc katra atribūta atsevišķi un vizuāli tika noteikts griezuma punkts. Par griezuma punktu klašu iedalījumam tika izvēlēts tas, kurš visbiežāk parādījās starp visu atribūtu vizualizācijām.
Šīs klases tika izmantotas klasifikatoru izveidē un novērtēšanā, kā arī metožu salīdzinošajā analīzē. Klasifikācijas uzdevumā pamatā tika izmantoti 6 dažādi klasifikatori, bet tiem tika mainīti parametri un uzdevumam tika izmantoti 19 dažādi klasifikatori. Augstākā novērotā klasifikatora precizitāte bija 70.57% SMO klasifikācijas algoritmam ar Puk kodolu. Rezultātu salīdzināšanai tika izmantotas ROC līknes.
Darba apjoms - 45 lpp., 29 tabulas, 11 attēli un 1 pielikums. |
Keywords |
datu ieguve, datizrace, diagnostika, klasifikācija, klasterizācija, algoritms, datu kopa, ROC, MP, NB, C4.5, ID3, CART, SMO, |
Keywords in English |
data mining, diagnostic, classification, clustering, algorithm, dataset, ROC, MP, NB, C4.5, JRip, CART, SMO |
Language |
lv |
Year |
2015 |
Date and time of uploading |
08.06.2015 10:56:53 |