Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Information Technology
Title in original language Ēšanas paradumu datu analīze kuņģa vēža riska izpētei
Title in English Data Analysis of Unhealthy Food and Eating Habits in Relation to Gastric Cancer Risk
Department 12100 Institute of Information Technology
Scientific advisor Mg. sc. ing. Arnis Kiršners
Reviewer Dr. sc. ing. Oļegs Užga-Rebrovs
Abstract Kuņģa vēzis ir otrs izplatītākais nāves izraisītājs vēžu grupā. Kuņģa vēzi var izraisīt alkohola lietošana, smēķēšana, pārmērīga sāls lietošana un arī dažādi ēšanas paradumi. Darba mērķis ir atrast likumsakarības ēšanas paradumu datos, lietojot datu ieguves metodes un algoritmus. Datu kopā tika atlasīti informatīvākie atribūti, izmantojot Weka 3.7 datu analīzes un apstrādes programmu. Darbā izpētītie un izmantotie klasifikācijas algoritmi ir naivais Baijesa, C4.5, k tuvāko kaimiņu algoritms un k vidējo sadalošais klasterizācijas algoritms. Izmantojot šos algoritmus, datu ieguves un analīzes programmā Orange Canvas 2.0, tika izveidots viens klasterizācijas modelis un viens klasifikācijas modelis. Analizējot iegūtos rezultātus, tika secināts, ka precīzākie rezultāti tiek iegūti, izmantojot klasterizācijas rezultātā iegūto klasi, un piemērotākais algoritms datu kopai ar klasterizācijas rezultātā iegūto klasi ir naivais Baijesa klasifikācijas algoritms. Tika atrastas likumsakarības, ka cilvēki, kuri lieto alkoholu, smēķē, lieto pārmērīgi sāli, dzer gāzētus, saldinātus dzērienus, lieto kaltētus, salītus produktus, arī atrodas kuņģa vēža saslimšanas riska grupā. Papildus tika izveidots klasterizācijas modelis kuņģa vēža riska noteikšanai. Šis modelis nav kā galvenais rādītājs tam, vai pacientam ir kuņģa vēzis vai nē, bet tas var būt kā viens no palīglīdzekļiem nozares speciālistam kuņģa vēža riska diagnosticēšanas procesā. Darba apjoms - 60. lpp., 7 tabulas, 28 attēli un 1 pielikums.
Keywords datu pirmapstrāde, klasifikācija, klasterizācija
Keywords in English preprocessing, classification, clustering
Language lv
Year 2015
Date and time of uploading 03.06.2015 23:38:23