Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Information Technology
Title in original language Datu ieguves metožu izmantošana kuņģa slimību diagnostikas uzlabošanā
Title in English Using Data Mining Methods to Improve Gastric Disease Diagnostics
Author Krišjānis Pinka
Department 12100 Institute of Information Technology
Scientific advisor Dr. sc. ing. Inese Poļaka
Reviewer Mg. sc. ing. Egmonts Treiguts
Abstract Lai gan daudzu kuņģa slimību diagnosticēšanai ir identificēti attiecīgie biomarķieri un uz to pamata izstrādāti diagnostiskie testi, to precizitāte ir zema, pielietojot Latvijas pacientiem. Ir svarīgi noskaidrot to pielietošanas iespējas un parametrus Latvijas iedzīvotājiem. Darba mērķis ir pielietojot datu ieguves metodes, noteikt precīzāko kuņģa slimību testu un tā parametrus. Darbā tika izmantoti reāli pacientu analīžu un aptaujas rezultātu dati. Tika veikta datu bāzes pirmapstrāde, dzēšot liekos atribūtus un ierakstus ar trūkstošiem datiem. Pirmapstrādes procesa rezultātā 60% datu tika dzēsti. Datu kopa tika sadalīta četrās eksperimentu grupās – vispārīgā datu grupa, vīriešu datu grupa, sieviešu datu grupa un smēķētāju datu grupa. Katra eksperimentu grupa saturēja vairākas apakškopas. Dati tika klasificēti ar trijām dažādām metodēm - C4.5 algoritmu, daudzslāņu perceptronu un izmantojot testu standarta vērtības. Klasifikācijai tika izmantota WEKA 3.6 programma. Rezultāti uzrādīja, ka C4.5 algoritmu efektīvāk izmantot apstrādājot vispārīgos, sieviešu un smēķētāju datus. Vispārīgajai datu kopai precīzākā bija apakškopa Eiken_0-1, sieviešu datu kopai precīzākā bija apakškopa Eiken_sievietes_0-1, bet smēķētāju datu kopai precīzākā bija apakškopa Best_smēķētāji. Vīriešu datu kopai efektīvāk izmantot daudzslāņu perceptronu, kur precīzākos rezultātus uzrādīja apakškopa BEST – vīrieši_0-1.
Keywords Datu ieguve
Keywords in English Data mining
Language lv
Year 2015
Date and time of uploading 04.06.2015 10:25:47