Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Krūts vēža datu analīze ar datu ieguves metodēm un algoritmiem
Nosaukums angļu valodā Analysis of Breast Cancer Data with Data Mining Methods and Algorithms
Struktūrvienība 12100 Informācijas tehnoloģijas institūts
Darba vadītājs Mg. sc. ing. Arnis Kiršners
Recenzents Mg. sc. ing. Egmonts Treiguts
Anotācija Lielākā daļa medicīnisko datu mūsdienās tiek glabāti, apstrādāti un analizēti digitālā veidā, kas atvieglo darbu medicīnas nozares darbiniekiem un pacientiem. Darbam ar šāda veida datiem izmanto vairākus rīkus. Darba ietvaros tiek pētītas datu ieguves izmantošanas iespējas krūts vēža datu kopas analīzē. Tās apstrādei un analīzei izmanto divus datu ieguves rīkus Weka un MedCalc. Darba autors iepazīstas ar šo rīku piedāvātajām iespējām un atrod piemērotākās metodes un algoritmus. Darbs sastāv no teorētiskās un eksperimentālās daļas. Teorētiskā daļa sastāv no vairākās nodaļām, kurās aprakstītas izmantotās datu apstrādes metodes, kā arī no algoritmu un rīka MedCalc piedāvāto metožu aprakstiem. Eksperimentālajā daļā pēc datu pirmapstrādes veikšanas iegūst datu kopu, kas satur diskrētus datus. Tad veic datu kopas atribūtu svarīgumu noteikšanu un klasifikāciju ar rīku Weka, kā rezultātā iegūst datu kopu, kas tiks izmantota tālākā darba gaitā. Ar rīku MedCalc veic darba autora izvēlētus statistiskos testus un ROC līkņu analīzi. Rezultātā iegūst apstrādātu datu kopu, kas satur tikai svarīgus atribūtus, kā arī nosaka, ar kuru no trīs izmantotajiem klasifikatoriem, tai var iegūt augstāko precizitāti, jūtīguma un specifiskuma vērtības. Rīks MedCalc piedāvā vairāk iespēju datu kopām ar nepārtrauktiem datiem, savukārt diskrētu datu analīzei ir maz iespēju, tāpēc tiek veikti tikai trīs statistiskie testi un ROC līkņu analīze. Ar atrastajiem testiem iegūst rezultātus, pēc kuriem var noteikt datu kopas atribūtu attiecības savā starpā, kā arī aprēķināt vairākas tos raksturojošas vērtības. ROC līknes piedāvā šo atribūtu attiecību grafikus. Darba apjoms - 77. lpp., 9 tabulas, 23 attēli un 3 pielikumi.
Atslēgas vārdi Datu ieguves algoritmi un metodes
Atslēgas vārdi angļu valodā Data mining algorithms and methods
Valoda lv
Gads 2014
Darba augšupielādes datums un laiks 05.06.2014 20:06:42