Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Datu ieguves metožu izmantošana kuņģa slimību diagnostikas uzlabošanā
Nosaukums angļu valodā Using Data Mining Methods to Improve Gastric Disease Diagnostics
Struktūrvienība 12100 Informācijas tehnoloģijas institūts
Darba vadītājs Dr. sc. ing. Inese Poļaka
Recenzents Mg. sc. ing. Egmonts Treiguts
Anotācija Lai gan daudzu kuņģa slimību diagnosticēšanai ir identificēti attiecīgie biomarķieri un uz to pamata izstrādāti diagnostiskie testi, to precizitāte ir zema, pielietojot Latvijas pacientiem. Ir svarīgi noskaidrot to pielietošanas iespējas un parametrus Latvijas iedzīvotājiem. Darba mērķis ir pielietojot datu ieguves metodes, noteikt precīzāko kuņģa slimību testu un tā parametrus. Darbā tika izmantoti reāli pacientu analīžu un aptaujas rezultātu dati. Tika veikta datu bāzes pirmapstrāde, dzēšot liekos atribūtus un ierakstus ar trūkstošiem datiem. Pirmapstrādes procesa rezultātā 60% datu tika dzēsti. Datu kopa tika sadalīta četrās eksperimentu grupās – vispārīgā datu grupa, vīriešu datu grupa, sieviešu datu grupa un smēķētāju datu grupa. Katra eksperimentu grupa saturēja vairākas apakškopas. Dati tika klasificēti ar trijām dažādām metodēm - C4.5 algoritmu, daudzslāņu perceptronu un izmantojot testu standarta vērtības. Klasifikācijai tika izmantota WEKA 3.6 programma. Rezultāti uzrādīja, ka C4.5 algoritmu efektīvāk izmantot apstrādājot vispārīgos, sieviešu un smēķētāju datus. Vispārīgajai datu kopai precīzākā bija apakškopa Eiken_0-1, sieviešu datu kopai precīzākā bija apakškopa Eiken_sievietes_0-1, bet smēķētāju datu kopai precīzākā bija apakškopa Best_smēķētāji. Vīriešu datu kopai efektīvāk izmantot daudzslāņu perceptronu, kur precīzākos rezultātus uzrādīja apakškopa BEST – vīrieši_0-1.
Atslēgas vārdi Datu ieguve
Atslēgas vārdi angļu valodā Data mining
Valoda lv
Gads 2015
Darba augšupielādes datums un laiks 04.06.2015 10:25:47