Abstract |
Kuņģa vēzis ir otrs izplatītākais nāves izraisītājs vēžu grupā. Kuņģa vēzi var izraisīt alkohola lietošana, smēķēšana, pārmērīga sāls lietošana un arī dažādi ēšanas paradumi. Darba mērķis ir atrast likumsakarības ēšanas paradumu datos, lietojot datu ieguves metodes un algoritmus. Datu kopā tika atlasīti informatīvākie atribūti, izmantojot Weka 3.7 datu analīzes un apstrādes programmu. Darbā izpētītie un izmantotie klasifikācijas algoritmi ir naivais Baijesa, C4.5, k tuvāko kaimiņu algoritms un k vidējo sadalošais klasterizācijas algoritms. Izmantojot šos algoritmus, datu ieguves un analīzes programmā Orange Canvas 2.0, tika izveidots viens klasterizācijas modelis un viens klasifikācijas modelis.
Analizējot iegūtos rezultātus, tika secināts, ka precīzākie rezultāti tiek iegūti, izmantojot klasterizācijas rezultātā iegūto klasi, un piemērotākais algoritms datu kopai ar klasterizācijas rezultātā iegūto klasi ir naivais Baijesa klasifikācijas algoritms. Tika atrastas likumsakarības, ka cilvēki, kuri lieto alkoholu, smēķē, lieto pārmērīgi sāli, dzer gāzētus, saldinātus dzērienus, lieto kaltētus, salītus produktus, arī atrodas kuņģa vēža saslimšanas riska grupā.
Papildus tika izveidots klasterizācijas modelis kuņģa vēža riska noteikšanai. Šis modelis nav kā galvenais rādītājs tam, vai pacientam ir kuņģa vēzis vai nē, bet tas var būt kā viens no palīglīdzekļiem nozares speciālistam kuņģa vēža riska diagnosticēšanas procesā.
Darba apjoms - 60. lpp., 7 tabulas, 28 attēli un 1 pielikums. |