Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Bioinformātikas datu klasifikācija: zarnu mikrobioms pirms un pēc antibiotiku ietekmes
Nosaukums angļu valodā Classification of Bioinformatics Data: Gut Microbiome Before and After Taking Antibiotics
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Inese Poļaka
Recenzents Mg. sc. ing. Olga Jepifanova
Anotācija Arvien vairāk pieaug bioinformātikas datu apjoms, kuru analīze ir sarežģīta, būtiska un kurus cilvēks nespēj izanalizēt. Šī darba ietvaros analīzei bija pieejami bioloģiskie dati, kuri satur informāciju par zarnu mikrobioma baktēriju genomu sekvenču skaitu pirms un pēc antibiotiku lietošanas. Bakalaura darba mērķis ir izveidot klasifikācijas modeli, kas ir spējīgs veikt pēc iespējas precīzāku mikrobioma klasificēšanu pirms un pēc antibiotiku lietošanas. Mērķa sasniegšanai tika veikti seši eksperimenti, kuru laikā tiek izveidoti un salīdzināti seši klasificēšanas algoritmu modeļi un to spēja veikt prognozes dotajiem datiem. Eksperimentu laikā tika pētīts arī, kā klasificēšanas rezultātus ietekmē hiperparametru pielāgošana, atribūtu atlase un datu kopas ierakstu palielināšana. Septītajā eksperimentā veikta sešu klasifikācijas modeļu interpretēšana. Izveidoto modeļu precizitātes novērtēšanai izmantots laukums zem ROC līknes un kopējā klasifikatora precizitāte. Eksperimentu beigās nevarēja viennozīmīgi apgalvot, ka kāds konkrēts algoritms bija veicis stabili precīzākas prognozes par citiem algoritmiem, bet pirmajos eksperimentos labākus rezultātus uzrādīja Gadījuma meža algoritms, taču eksperimentu beigās tā rezultāti bija pasliktinājušies. Pēdējā eksperimentā Neironu tīkla algoritms uzradīja labākos laukuma zem līknes rezultātus starp visiem eksperimentiem un pārējiem algoritmiem. Rezultātus ietekmēja algoritmu hiperparametru pielāgošana, atribūtu atlase un datu kopas ierakstu palielināšana. Darba apjoms – 56 lpp., 11 tabulas, 20 attēli un 12 pielikumi.
Atslēgas vārdi mašīnmācīšanās, bioinformātikas dati, klasifikācijas algoritmi, zarnu mikrobioms, Atbalsta vektoru mašīna, Gadījuma mežs, k-tuvāko kaimiņu, Neironu tīkls, Naivais Baijesa, Lēmumu koks
Atslēgas vārdi angļu valodā machine learning, bioinformatics data, classification algorithms, gut microbiome, Support vector machine, Random Forest, kNN, Naive Bayes, Neural Network, Decision Tree
Valoda lv
Gads 2021
Darba augšupielādes datums un laiks 31.05.2021 21:46:48