Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Datizraces algoritmu lietojums pacientu anketēšanas rezultātu analīzē
Nosaukums angļu valodā Data Mining Algorithm Application in Patients Survey Results Analysis
Autors Rihards Mudelis
Struktūrvienība 12100 Informācijas tehnoloģijas institūts
Darba vadītājs Dr. sc. ing. Arnis Kiršners
Recenzents Dr. sc. ing. Jurijs Korņijenko
Anotācija Ik dienu ļaundabīgi audzēji tiek diagnosticēti arvien jauniem pacientiem. Līdz ar to ir nepieciešams veikt vēžrades riska faktoru analīzi, lai spētu informēt cilvēkus un, iespējams, samazināt slimnieku skaitu nākotnē. Darba mērķis ir izmantot datizraces algoritmus vēžrades riska faktoru analīzei. Darbā ir izmantota aptaujas anketa ar reāliem pacientu datiem, kuri ir apkopoti datu kopā. Darba mērķa sasniegšanai tiek veikti vairāki uzdevumi. Sākotnējai datu kopai tiek veikta datu pirmapstrāde, attīrot to no trūkstošajiem datiem un datiem, kuri dublicējas, veicot gan datu normalizāciju, gan datu diskretizāciju, kā arī samazinot datu kopu, noņemot neinformatīvos atribūtus. Tiek izveidotas divas datu kopas – Eiken un Biohit, kur katrā no tām ir atšķirīgas analīzes vēžrades riska noteikšanai. Datu apstrādei tiek izmantota programmatūra R un tās integrētā izstrādes vide RStudio, kā arī trīs klasifikācijas algoritmi – naivais Baijesa, k-tuvāko kaimiņu un C4.5 algoritms. Veicot eksperimentus tiek noteikts, ka piemērotākais algoritms vēžrades risku izpētei ir C4.5 algoritms, kas veic savu darbību Eiken datu kopai ar precizitāti 86,5%, bet Biohit datu kopai ar 81,9% precizitāti. C4.5 arī ir vienīgais algoritms, kura darbība var tikt uzskatīta par pietiekami precīzu, lai pacientiem, aizpildot datus par sevi, būtu iespējams uzzināt, kurai riska klasei tie pieder, un, vai ir nepieciešams veikt tālākus izmeklējumus. Darba apjoms - 55. lpp., 8 tabulas, 28 attēli un 6 pielikumi.
Atslēgas vārdi Kuņģa vēzis, aptaujas anketa, datizrace, datu pirmapstrāde, klasifikācijas algoritmi
Atslēgas vārdi angļu valodā Gastric cancer, questionnaire, data mining, data pre-processing, classification algorithms
Valoda lv
Gads 2017
Darba augšupielādes datums un laiks 01.06.2017 19:48:36