Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Bioinformātikas datu klasifikācija: zarnu mikrobioms pirms un pēc antibiotiku ietekmes |
Nosaukums angļu valodā |
Classification of Bioinformatics Data: Gut Microbiome Before and After Taking Antibiotics |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Inese Poļaka |
Recenzents |
Mg. sc. ing. Olga Jepifanova |
Anotācija |
Arvien vairāk pieaug bioinformātikas datu apjoms, kuru analīze ir sarežģīta, būtiska un kurus cilvēks nespēj izanalizēt. Šī darba ietvaros analīzei bija pieejami bioloģiskie dati, kuri satur informāciju par zarnu mikrobioma baktēriju genomu sekvenču skaitu pirms un pēc antibiotiku lietošanas. Bakalaura darba mērķis ir izveidot klasifikācijas modeli, kas ir spējīgs veikt pēc iespējas precīzāku mikrobioma klasificēšanu pirms un pēc antibiotiku lietošanas. Mērķa sasniegšanai tika veikti seši eksperimenti, kuru laikā tiek izveidoti un salīdzināti seši klasificēšanas algoritmu modeļi un to spēja veikt prognozes dotajiem datiem. Eksperimentu laikā tika pētīts arī, kā klasificēšanas rezultātus ietekmē hiperparametru pielāgošana, atribūtu atlase un datu kopas ierakstu palielināšana. Septītajā eksperimentā veikta sešu klasifikācijas modeļu interpretēšana. Izveidoto modeļu precizitātes novērtēšanai izmantots laukums zem ROC līknes un kopējā klasifikatora precizitāte. Eksperimentu beigās nevarēja viennozīmīgi apgalvot, ka kāds konkrēts algoritms bija veicis stabili precīzākas prognozes par citiem algoritmiem, bet pirmajos eksperimentos labākus rezultātus uzrādīja Gadījuma meža algoritms, taču eksperimentu beigās tā rezultāti bija pasliktinājušies. Pēdējā eksperimentā Neironu tīkla algoritms uzradīja labākos laukuma zem līknes rezultātus starp visiem eksperimentiem un pārējiem algoritmiem. Rezultātus ietekmēja algoritmu hiperparametru pielāgošana, atribūtu atlase un datu kopas ierakstu palielināšana.
Darba apjoms – 56 lpp., 11 tabulas, 20 attēli un 12 pielikumi. |
Atslēgas vārdi |
mašīnmācīšanās, bioinformātikas dati, klasifikācijas algoritmi, zarnu mikrobioms, Atbalsta vektoru mašīna, Gadījuma mežs, k-tuvāko kaimiņu, Neironu tīkls, Naivais Baijesa, Lēmumu koks |
Atslēgas vārdi angļu valodā |
machine learning, bioinformatics data, classification algorithms, gut microbiome, Support vector machine, Random Forest, kNN, Naive Bayes, Neural Network, Decision Tree |
Valoda |
lv |
Gads |
2021 |
Darba augšupielādes datums un laiks |
31.05.2021 21:46:48 |