Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Information Technology
Title in original language Klašu formalizācija un klasifikatoru novērtēšana medicīniskās diagnostikas uzdevumā
Title in English Class Formalization and Classifier Evaluation in the Task of Medical Diagnostics
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Dr. sc. ing. Inese Poļaka
Reviewer Dr. sc. ing. Sigita Misiņa
Abstract Kuņģa pirmsvēža un citu slimību diagnostikas seroloģiskās metodes šobrīd nav gana precīzas. Lai uzlabotu to precizitāti, nepieciešams formalizēt slimības izpausmes robežas, kuras izmantot testos (jeb klasēm klasifikācijas uzdevumā), un testu izmantotos faktorus un robežvērtības. Uzdevumā tika izmantoti pacientu dati no kuņģa vēža pētījumiem, kuros ir analizētas dažādu pacientu asins seruma testu vērtības. Pētījumā salīdzināšanai ir izmantoti trīs ražotāju testi, kas veic mērījumus par kuņģa izdalīto enzīmu līmeni asins serumā. Darbā tika veikta klašu formalizācija, izmantojot klasterizācijas metodes, kas izrādījās neveiksmīga. Novērtēt dabiski pastāvošas grupas datos ar klasterizācijas algoritmiem nebija iespējams, jo datiem ir sarežģīta struktūra, ko var izskaidrot ar cilvēku bioloģiskajām īpašībām. Tāpēc dati tika apskatīti pēc katra atribūta atsevišķi un vizuāli tika noteikts griezuma punkts. Par griezuma punktu klašu iedalījumam tika izvēlēts tas, kurš visbiežāk parādījās starp visu atribūtu vizualizācijām. Šīs klases tika izmantotas klasifikatoru izveidē un novērtēšanā, kā arī metožu salīdzinošajā analīzē. Klasifikācijas uzdevumā pamatā tika izmantoti 6 dažādi klasifikatori, bet tiem tika mainīti parametri un uzdevumam tika izmantoti 19 dažādi klasifikatori. Augstākā novērotā klasifikatora precizitāte bija 70.57% SMO klasifikācijas algoritmam ar Puk kodolu. Rezultātu salīdzināšanai tika izmantotas ROC līknes. Darba apjoms - 45 lpp., 29 tabulas, 11 attēli un 1 pielikums.
Keywords datu ieguve, datizrace, diagnostika, klasifikācija, klasterizācija, algoritms, datu kopa, ROC, MP, NB, C4.5, ID3, CART, SMO,
Keywords in English data mining, diagnostic, classification, clustering, algorithm, dataset, ROC, MP, NB, C4.5, JRip, CART, SMO
Language lv
Year 2015
Date and time of uploading 08.06.2015 10:56:53