Form of studies |
Bachelor |
Title of the study programm |
Information Technology |
Title in original language |
Datu ieguves metožu izmantošana kuņģa slimību diagnostikas uzlabošanā |
Title in English |
Using Data Mining Methods to Improve Gastric Disease Diagnostics |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Dr. sc. ing. Inese Poļaka |
Reviewer |
Mg. sc. ing. Egmonts Treiguts |
Abstract |
Lai gan daudzu kuņģa slimību diagnosticēšanai ir identificēti attiecīgie biomarķieri un uz to pamata izstrādāti diagnostiskie testi, to precizitāte ir zema, pielietojot Latvijas pacientiem. Ir svarīgi noskaidrot to pielietošanas iespējas un parametrus Latvijas iedzīvotājiem. Darba mērķis ir pielietojot datu ieguves metodes, noteikt precīzāko kuņģa slimību testu un tā parametrus.
Darbā tika izmantoti reāli pacientu analīžu un aptaujas rezultātu dati. Tika veikta datu bāzes pirmapstrāde, dzēšot liekos atribūtus un ierakstus ar trūkstošiem datiem. Pirmapstrādes procesa rezultātā 60% datu tika dzēsti. Datu kopa tika sadalīta četrās eksperimentu grupās – vispārīgā datu grupa, vīriešu datu grupa, sieviešu datu grupa un smēķētāju datu grupa. Katra eksperimentu grupa saturēja vairākas apakškopas.
Dati tika klasificēti ar trijām dažādām metodēm - C4.5 algoritmu, daudzslāņu perceptronu un izmantojot testu standarta vērtības. Klasifikācijai tika izmantota WEKA 3.6 programma. Rezultāti uzrādīja, ka C4.5 algoritmu efektīvāk izmantot apstrādājot vispārīgos, sieviešu un smēķētāju datus. Vispārīgajai datu kopai precīzākā bija apakškopa Eiken_0-1, sieviešu datu kopai precīzākā bija apakškopa Eiken_sievietes_0-1, bet smēķētāju datu kopai precīzākā bija apakškopa Best_smēķētāji. Vīriešu datu kopai efektīvāk izmantot daudzslāņu perceptronu, kur precīzākos rezultātus uzrādīja apakškopa BEST – vīrieši_0-1. |
Keywords |
Datu ieguve |
Keywords in English |
Data mining |
Language |
lv |
Year |
2015 |
Date and time of uploading |
04.06.2015 10:25:47 |