Abstract |
Darba mērķis ir izpildīt anketēšanas un seroloģijas datu analīzi ar datizraces metodēm un novērtēt to iespējamo ietekmi uz kuņģa audu atrofijas un intestinālās metaplāzijas attīstīšanas risku. Tā ietvaros ir izpētītas datizraces metodes, kuras pielieto skriningā, un izvēlētas uzdevumam atbilstošās metodes – klasifikācijas likumu un koku veidošanas algoritmi. Visiem pielietotiem klasifikācijas algoritmiem ir salīdzināti klasifikācijas rezultāti.
Lai sasniegtu izvirzīto darba mērķi, tika izanalizēta literatūra par datizraces metožu pielietošanu medicīnas datu analīzei un izvēlētas, izpētītas un aprakstītas uzdevumam atbilstošās metodes. Tika analizēta reālā datu kopa, kas satur respondentu anketēšanas, seroloģijas un histoloģijas datus; veikta iegūto rezultātu analīze.
Iegūtie rezultāti parāda ka izmantotiem anketēšanas un seroloģijas datiem ir ietekme uz kunģa audu atrofijas un metaplāzijas attistīšanas risku, tomēr klasifikātoru precizitātes, kā mērķa atribūtu izmantojot metaplazijas stadijas, ir mazākas, nekā gadījumā, kad par mērķa atribūtu ir izmantotas atrofijas stadijas. Gadījumā, kad kā mērķa atribūts ir izmantotās atrofijas stadijas, lielāka precizitāte (≈80%) ir iegūta, pielietojot algoritmu CN2. Klasifikātora izveidoto likumu interpretācijai ir nepieciešama medicīnas jomas eksperta piesaiste. Klasifikātora precizitātes uzlabošanai, ar medicīnas jomas eksperta piesaisti, ir jāmodificē klasifikacijā izmantojamās datu kopas atribūtus un to vērtības.
Darba apjoms - 67. lpp., 28 tabulas, 50 attēli un 2 pielikumi. |