Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Information Technology
Title in original language Bioinformātikas datu klasifikācija: zarnu mikrobioms pirms un pēc antibiotiku ietekmes
Title in English Classification of Bioinformatics Data: Gut Microbiome Before and After Taking Antibiotics
Department 12100 Institute of Information Technology
Scientific advisor Inese Poļaka
Reviewer Mg. sc. ing. Olga Jepifanova
Abstract Arvien vairāk pieaug bioinformātikas datu apjoms, kuru analīze ir sarežģīta, būtiska un kurus cilvēks nespēj izanalizēt. Šī darba ietvaros analīzei bija pieejami bioloģiskie dati, kuri satur informāciju par zarnu mikrobioma baktēriju genomu sekvenču skaitu pirms un pēc antibiotiku lietošanas. Bakalaura darba mērķis ir izveidot klasifikācijas modeli, kas ir spējīgs veikt pēc iespējas precīzāku mikrobioma klasificēšanu pirms un pēc antibiotiku lietošanas. Mērķa sasniegšanai tika veikti seši eksperimenti, kuru laikā tiek izveidoti un salīdzināti seši klasificēšanas algoritmu modeļi un to spēja veikt prognozes dotajiem datiem. Eksperimentu laikā tika pētīts arī, kā klasificēšanas rezultātus ietekmē hiperparametru pielāgošana, atribūtu atlase un datu kopas ierakstu palielināšana. Septītajā eksperimentā veikta sešu klasifikācijas modeļu interpretēšana. Izveidoto modeļu precizitātes novērtēšanai izmantots laukums zem ROC līknes un kopējā klasifikatora precizitāte. Eksperimentu beigās nevarēja viennozīmīgi apgalvot, ka kāds konkrēts algoritms bija veicis stabili precīzākas prognozes par citiem algoritmiem, bet pirmajos eksperimentos labākus rezultātus uzrādīja Gadījuma meža algoritms, taču eksperimentu beigās tā rezultāti bija pasliktinājušies. Pēdējā eksperimentā Neironu tīkla algoritms uzradīja labākos laukuma zem līknes rezultātus starp visiem eksperimentiem un pārējiem algoritmiem. Rezultātus ietekmēja algoritmu hiperparametru pielāgošana, atribūtu atlase un datu kopas ierakstu palielināšana. Darba apjoms – 56 lpp., 11 tabulas, 20 attēli un 12 pielikumi.
Keywords mašīnmācīšanās, bioinformātikas dati, klasifikācijas algoritmi, zarnu mikrobioms, Atbalsta vektoru mašīna, Gadījuma mežs, k-tuvāko kaimiņu, Neironu tīkls, Naivais Baijesa, Lēmumu koks
Keywords in English machine learning, bioinformatics data, classification algorithms, gut microbiome, Support vector machine, Random Forest, kNN, Naive Bayes, Neural Network, Decision Tree
Language lv
Year 2021
Date and time of uploading 31.05.2021 21:46:48