Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Krūts vēža datu analīze ar datu ieguves metodēm un algoritmiem |
Nosaukums angļu valodā |
Analysis of Breast Cancer Data with Data Mining Methods and Algorithms |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Mg. sc. ing. Arnis Kiršners |
Recenzents |
Mg. sc. ing. Egmonts Treiguts |
Anotācija |
Lielākā daļa medicīnisko datu mūsdienās tiek glabāti, apstrādāti un analizēti digitālā veidā, kas atvieglo darbu medicīnas nozares darbiniekiem un pacientiem. Darbam ar šāda veida datiem izmanto vairākus rīkus.
Darba ietvaros tiek pētītas datu ieguves izmantošanas iespējas krūts vēža datu kopas analīzē. Tās apstrādei un analīzei izmanto divus datu ieguves rīkus Weka un MedCalc. Darba autors iepazīstas ar šo rīku piedāvātajām iespējām un atrod piemērotākās metodes un algoritmus.
Darbs sastāv no teorētiskās un eksperimentālās daļas. Teorētiskā daļa sastāv no vairākās nodaļām, kurās aprakstītas izmantotās datu apstrādes metodes, kā arī no algoritmu un rīka MedCalc piedāvāto metožu aprakstiem. Eksperimentālajā daļā pēc datu pirmapstrādes veikšanas iegūst datu kopu, kas satur diskrētus datus. Tad veic datu kopas atribūtu svarīgumu noteikšanu un klasifikāciju ar rīku Weka, kā rezultātā iegūst datu kopu, kas tiks izmantota tālākā darba gaitā. Ar rīku MedCalc veic darba autora izvēlētus statistiskos testus un ROC līkņu analīzi.
Rezultātā iegūst apstrādātu datu kopu, kas satur tikai svarīgus atribūtus, kā arī nosaka, ar kuru no trīs izmantotajiem klasifikatoriem, tai var iegūt augstāko precizitāti, jūtīguma un specifiskuma vērtības.
Rīks MedCalc piedāvā vairāk iespēju datu kopām ar nepārtrauktiem datiem, savukārt diskrētu datu analīzei ir maz iespēju, tāpēc tiek veikti tikai trīs statistiskie testi un ROC līkņu analīze. Ar atrastajiem testiem iegūst rezultātus, pēc kuriem var noteikt datu kopas atribūtu attiecības savā starpā, kā arī aprēķināt vairākas tos raksturojošas vērtības. ROC līknes piedāvā šo atribūtu attiecību grafikus.
Darba apjoms - 77. lpp., 9 tabulas, 23 attēli un 3 pielikumi. |
Atslēgas vārdi |
Datu ieguves algoritmi un metodes |
Atslēgas vārdi angļu valodā |
Data mining algorithms and methods |
Valoda |
lv |
Gads |
2014 |
Darba augšupielādes datums un laiks |
05.06.2014 20:06:42 |