Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Information Technology
Title in original language Krūts vēža datu analīze ar datu ieguves metodēm un algoritmiem
Title in English Analysis of Breast Cancer Data with Data Mining Methods and Algorithms
Author Agnese Logina-Vilkaste
Department 12100 Institute of Information Technology
Scientific advisor Mg. sc. ing. Arnis Kiršners
Reviewer Mg. sc. ing. Egmonts Treiguts
Abstract Lielākā daļa medicīnisko datu mūsdienās tiek glabāti, apstrādāti un analizēti digitālā veidā, kas atvieglo darbu medicīnas nozares darbiniekiem un pacientiem. Darbam ar šāda veida datiem izmanto vairākus rīkus. Darba ietvaros tiek pētītas datu ieguves izmantošanas iespējas krūts vēža datu kopas analīzē. Tās apstrādei un analīzei izmanto divus datu ieguves rīkus Weka un MedCalc. Darba autors iepazīstas ar šo rīku piedāvātajām iespējām un atrod piemērotākās metodes un algoritmus. Darbs sastāv no teorētiskās un eksperimentālās daļas. Teorētiskā daļa sastāv no vairākās nodaļām, kurās aprakstītas izmantotās datu apstrādes metodes, kā arī no algoritmu un rīka MedCalc piedāvāto metožu aprakstiem. Eksperimentālajā daļā pēc datu pirmapstrādes veikšanas iegūst datu kopu, kas satur diskrētus datus. Tad veic datu kopas atribūtu svarīgumu noteikšanu un klasifikāciju ar rīku Weka, kā rezultātā iegūst datu kopu, kas tiks izmantota tālākā darba gaitā. Ar rīku MedCalc veic darba autora izvēlētus statistiskos testus un ROC līkņu analīzi. Rezultātā iegūst apstrādātu datu kopu, kas satur tikai svarīgus atribūtus, kā arī nosaka, ar kuru no trīs izmantotajiem klasifikatoriem, tai var iegūt augstāko precizitāti, jūtīguma un specifiskuma vērtības. Rīks MedCalc piedāvā vairāk iespēju datu kopām ar nepārtrauktiem datiem, savukārt diskrētu datu analīzei ir maz iespēju, tāpēc tiek veikti tikai trīs statistiskie testi un ROC līkņu analīze. Ar atrastajiem testiem iegūst rezultātus, pēc kuriem var noteikt datu kopas atribūtu attiecības savā starpā, kā arī aprēķināt vairākas tos raksturojošas vērtības. ROC līknes piedāvā šo atribūtu attiecību grafikus. Darba apjoms - 77. lpp., 9 tabulas, 23 attēli un 3 pielikumi.
Keywords Datu ieguves algoritmi un metodes
Keywords in English Data mining algorithms and methods
Language lv
Year 2014
Date and time of uploading 05.06.2014 20:06:42