Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Datizraces algoritmu lietojums pacientu anketēšanas rezultātu analīzē |
Nosaukums angļu valodā |
Data Mining Algorithm Application in Patients Survey Results Analysis |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Dr. sc. ing. Arnis Kiršners |
Recenzents |
Dr. sc. ing. Jurijs Korņijenko |
Anotācija |
Ik dienu ļaundabīgi audzēji tiek diagnosticēti arvien jauniem pacientiem. Līdz ar to ir nepieciešams veikt vēžrades riska faktoru analīzi, lai spētu informēt cilvēkus un, iespējams, samazināt slimnieku skaitu nākotnē.
Darba mērķis ir izmantot datizraces algoritmus vēžrades riska faktoru analīzei. Darbā ir izmantota aptaujas anketa ar reāliem pacientu datiem, kuri ir apkopoti datu kopā. Darba mērķa sasniegšanai tiek veikti vairāki uzdevumi. Sākotnējai datu kopai tiek veikta datu pirmapstrāde, attīrot to no trūkstošajiem datiem un datiem, kuri dublicējas, veicot gan datu normalizāciju, gan datu diskretizāciju, kā arī samazinot datu kopu, noņemot neinformatīvos atribūtus. Tiek izveidotas divas datu kopas – Eiken un Biohit, kur katrā no tām ir atšķirīgas analīzes vēžrades riska noteikšanai. Datu apstrādei tiek izmantota programmatūra R un tās integrētā izstrādes vide RStudio, kā arī trīs klasifikācijas algoritmi – naivais Baijesa, k-tuvāko kaimiņu un C4.5 algoritms.
Veicot eksperimentus tiek noteikts, ka piemērotākais algoritms vēžrades risku izpētei ir C4.5 algoritms, kas veic savu darbību Eiken datu kopai ar precizitāti 86,5%, bet Biohit datu kopai ar 81,9% precizitāti. C4.5 arī ir vienīgais algoritms, kura darbība var tikt uzskatīta par pietiekami precīzu, lai pacientiem, aizpildot datus par sevi, būtu iespējams uzzināt, kurai riska klasei tie pieder, un, vai ir nepieciešams veikt tālākus izmeklējumus.
Darba apjoms - 55. lpp., 8 tabulas, 28 attēli un 6 pielikumi. |
Atslēgas vārdi |
Kuņģa vēzis, aptaujas anketa, datizrace, datu pirmapstrāde, klasifikācijas algoritmi |
Atslēgas vārdi angļu valodā |
Gastric cancer, questionnaire, data mining, data pre-processing, classification algorithms |
Valoda |
lv |
Gads |
2017 |
Darba augšupielādes datums un laiks |
01.06.2017 19:48:36 |