Apendektomijas un zarnu mikrobioma hierarhisko taksonomijas datu izpēte ar datizraci

Noslēguma darbu reģistrs

Noslēguma darbu meklēšana

Studiju darba apraksts

Studiju veids	maģistra akadēmiskās studijas
Studiju programmas nosaukums	Informācijas tehnoloģija
Nosaukums	Apendektomijas un zarnu mikrobioma hierarhisko taksonomijas datu izpēte ar datizraci
Nosaukums angļu valodā	Determination of the Association Between Appendectomy and Gut Microbiome by Data Mining
Struktūrvienība	33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs	Inese Poļaka
Recenzents	Arnis Kiršners
Anotācija	Maģistra darbā tiek pētīts, kā ar darba autores izstrādāto 4 līmeņu datu analīzes pieeju tiek meklētas un skaidrotas atšķirības (pazīmju “paraksts”) starp pētāmajām kohortām – kontroles un apendektomijas grupu zarnu mikrobioma datos. Šo datu specifiskās īpašības ir datu kompozicionalitāte, datu skrajums, daudzimensionalitāte un taksonomiskā hierarhija. Izstrādātā pieeja ietver secīgu metožu validāciju: tiek veikta klasifikācija uz noteikta hierarhiskās taksonomijas līmeņa un 5 pazīmju sastopamības atfiltrācijas sliekšņu (1%, 5%, 10%, 30% un 50%) sabalansētām apakškopām, kam seko pamatklasterēšana un apakšklasterēšana (iedalot pēc grupām) uz tām pašām, taču nesabalansētām apakškopām. Noslēgumā tiek pielietota biomarķieru noteikšanas metode uz visas taksonomiskās hierarhijas datu kopas, un dimensiju samazināšanas vizualizācija uz atlasītajiem biomarķieriem. Izstrādātā pieeja pierādīja, ka ne ar vienu no datu analīzēm nav iespējas atrast pazīmes, kas nodalītu pētāmās kohortas. Klasifikācijas modeļi – lēmumu koks, gadījuma mežs, ekstrēmi gadījuma koki, AdaBoost, K-tuvāko kaimiņu metode un atbalsta vektoru mašīnas – visos eksperimentos lielākoties uzrādīja zemu prognozēšanas veiktspēju ap 50% pēc AUC, kopējās precizitātes, jutīguma, specifiskuma, pozitīvo prognožu precizitātes un F1 rādītāja. Klasterēšanas modeļi – K-vidējo un hierarhiskā klasterēšana nesasegmentēja nevienu kohortām specifisku grupu, ko apliecina gan pacientu ierakstu sadalījums, gan Silueta koeficienti. Biomarķieru noteikšanas metode LEfSe uzrādīja, ka nozīmīgākas pazīmes abām grupām atrodas atšķirīgos taksonomijas koka līmeņos, un galveno komponenšu analīzes vizualizācija apstiprināja izteiktu kohortu datu pārklāšanos. Atslēgvārdi – zarnu mikrobioma datu īpašības, pārraudzītā un nepārraudzītā mašīnmācīšanās, biomarķieru identificēšana. Dati par darba apjomu – X lappušu, 36 attēlu, 16 tabulu, 22 izmantoto informācijas avotu.
Atslēgas vārdi	Atslēgvārdi – zarnu mikrobioma datu īpašības, pārraudzītā un nepārraudzītā mašīnmācīšanās, biomarķieru identificēšana.
Atslēgas vārdi angļu valodā	Keywords – gut microbiome data properties, supervised and unsupervised machine learning, biomarker identification.
Valoda	lv
Gads	2026
Darba augšupielādes datums un laiks	08.06.2026 04:36:36