Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Klašu formalizācija un klasifikatoru novērtēšana medicīniskās diagnostikas uzdevumā
Nosaukums angļu valodā Class Formalization and Classifier Evaluation in the Task of Medical Diagnostics
Struktūrvienība 12100 Informācijas tehnoloģijas institūts
Darba vadītājs Dr. sc. ing. Inese Poļaka
Recenzents Dr. sc. ing. Sigita Misiņa
Anotācija Kuņģa pirmsvēža un citu slimību diagnostikas seroloģiskās metodes šobrīd nav gana precīzas. Lai uzlabotu to precizitāti, nepieciešams formalizēt slimības izpausmes robežas, kuras izmantot testos (jeb klasēm klasifikācijas uzdevumā), un testu izmantotos faktorus un robežvērtības. Uzdevumā tika izmantoti pacientu dati no kuņģa vēža pētījumiem, kuros ir analizētas dažādu pacientu asins seruma testu vērtības. Pētījumā salīdzināšanai ir izmantoti trīs ražotāju testi, kas veic mērījumus par kuņģa izdalīto enzīmu līmeni asins serumā. Darbā tika veikta klašu formalizācija, izmantojot klasterizācijas metodes, kas izrādījās neveiksmīga. Novērtēt dabiski pastāvošas grupas datos ar klasterizācijas algoritmiem nebija iespējams, jo datiem ir sarežģīta struktūra, ko var izskaidrot ar cilvēku bioloģiskajām īpašībām. Tāpēc dati tika apskatīti pēc katra atribūta atsevišķi un vizuāli tika noteikts griezuma punkts. Par griezuma punktu klašu iedalījumam tika izvēlēts tas, kurš visbiežāk parādījās starp visu atribūtu vizualizācijām. Šīs klases tika izmantotas klasifikatoru izveidē un novērtēšanā, kā arī metožu salīdzinošajā analīzē. Klasifikācijas uzdevumā pamatā tika izmantoti 6 dažādi klasifikatori, bet tiem tika mainīti parametri un uzdevumam tika izmantoti 19 dažādi klasifikatori. Augstākā novērotā klasifikatora precizitāte bija 70.57% SMO klasifikācijas algoritmam ar Puk kodolu. Rezultātu salīdzināšanai tika izmantotas ROC līknes. Darba apjoms - 45 lpp., 29 tabulas, 11 attēli un 1 pielikums.
Atslēgas vārdi datu ieguve, datizrace, diagnostika, klasifikācija, klasterizācija, algoritms, datu kopa, ROC, MP, NB, C4.5, ID3, CART, SMO,
Atslēgas vārdi angļu valodā data mining, diagnostic, classification, clustering, algorithm, dataset, ROC, MP, NB, C4.5, JRip, CART, SMO
Valoda lv
Gads 2015
Darba augšupielādes datums un laiks 08.06.2015 10:56:53