Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Ēšanas paradumu datu analīze kuņģa vēža riska izpētei
Nosaukums angļu valodā Data Analysis of Unhealthy Food and Eating Habits in Relation to Gastric Cancer Risk
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Mg. sc. ing. Arnis Kiršners
Recenzents Dr. sc. ing. Oļegs Užga-Rebrovs
Anotācija Kuņģa vēzis ir otrs izplatītākais nāves izraisītājs vēžu grupā. Kuņģa vēzi var izraisīt alkohola lietošana, smēķēšana, pārmērīga sāls lietošana un arī dažādi ēšanas paradumi. Darba mērķis ir atrast likumsakarības ēšanas paradumu datos, lietojot datu ieguves metodes un algoritmus. Datu kopā tika atlasīti informatīvākie atribūti, izmantojot Weka 3.7 datu analīzes un apstrādes programmu. Darbā izpētītie un izmantotie klasifikācijas algoritmi ir naivais Baijesa, C4.5, k tuvāko kaimiņu algoritms un k vidējo sadalošais klasterizācijas algoritms. Izmantojot šos algoritmus, datu ieguves un analīzes programmā Orange Canvas 2.0, tika izveidots viens klasterizācijas modelis un viens klasifikācijas modelis. Analizējot iegūtos rezultātus, tika secināts, ka precīzākie rezultāti tiek iegūti, izmantojot klasterizācijas rezultātā iegūto klasi, un piemērotākais algoritms datu kopai ar klasterizācijas rezultātā iegūto klasi ir naivais Baijesa klasifikācijas algoritms. Tika atrastas likumsakarības, ka cilvēki, kuri lieto alkoholu, smēķē, lieto pārmērīgi sāli, dzer gāzētus, saldinātus dzērienus, lieto kaltētus, salītus produktus, arī atrodas kuņģa vēža saslimšanas riska grupā. Papildus tika izveidots klasterizācijas modelis kuņģa vēža riska noteikšanai. Šis modelis nav kā galvenais rādītājs tam, vai pacientam ir kuņģa vēzis vai nē, bet tas var būt kā viens no palīglīdzekļiem nozares speciālistam kuņģa vēža riska diagnosticēšanas procesā. Darba apjoms - 60. lpp., 7 tabulas, 28 attēli un 1 pielikums.
Atslēgas vārdi datu pirmapstrāde, klasifikācija, klasterizācija
Atslēgas vārdi angļu valodā preprocessing, classification, clustering
Valoda lv
Gads 2015
Darba augšupielādes datums un laiks 03.06.2015 23:38:23