Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Information Technology
Title in original language Bioinformātikas datu klasterēšana: zarnu mikrobioms pirms un pēc antibiotiku ietekmes
Title in English Bioinformatics Data Clustering: Intestinal Microbiome Before and After Antibiotic Effects
Department 12100 Institute of Information Technology
Scientific advisor Inese Poļaka
Reviewer Dr. sc.’ing. Sigita Misiņa
Abstract Bakalaura darbs ir veltīts datizraces metožu un paņēmienu izmantošanai bioinformātikā, klasterēšanas algoritmu pielietošanai reālu datu analīzei. Darbā izmantotā datu kopa satur Latvijas pacientu kuņģa mikrobioma sastāvus, pirms antibiotiku lietošanas un sešus mēnešus pēc antibiotiku lietošanas uzsākšanas. Tika izmantoti uz centroīdiem balstītie nehierarhiskie un hierarhiskie klasterēšanas algoritmi, mainot datu normalizācijas un klasteru skaitu, lai izsekotu mikrobioma sastāva atkarībai no laika brīža. Ievadā aprakstīta datizraces izmantošanas aktualitāte bioinformatikā, bakalaura darba mērķis un uzdevumi. Darba teorētiskajā apskatā detalizētāk aprakstīta datizrace un tās pielietošana, datu klasterēšana, klasterēšanas algoritmi un algoritmu darbības principi, jau veiktie pētījumi bioinformātikā, izmantojot datizraces metodes, kā arī datu vizualizācija. Pēc tam tika aprakstīta formālā uzdevuma nostādne, kas palīdz labāk izprast eksperimentu veikšanas mērķus un vēlamos rezultātus. Praktisku eksperimentu īstenošanai ir aprakstīti esošie datizraces rīki, īpaši Orange rīks, kas tiek izmantots šajā darbā. Turklāt ir aprakstīts datu sagatavošanas process un detalizēts eksperimenta apraksts. Pielietojot k-vidējo un hierarhisko klasterēšanas algoritmus, kā arī dažādas normalizācijas, piemēram, logaritmisko normalizāciju, z-mēra normalizāciju un jau esošo z-mēra normalizāciju Orange rīkā, iegūtie eksperimenta rezultāti tiek salīdzināti savā starpā. Rezultātu interpretācija notiek, salīdzinot laika intervālus, kā arī salīdzinot klasterēšanas algoritmu un izmantoto normalizāciju efektivitāti. Eksperimenta rezultāti ļauj novērtēt klasterēšanas izmantošanas efektivitāti pētījumos ar lielu apjomu empīrisku medicīnisko datu. Darba apjoms - 90. lpp., 16 tabulas, 53 attēli un 8 pielikumi.
Keywords Datizrace, bioinformātika, datu klasterēšana, uz centroīdiem balstītie nehierarhiskie algoritmi, hierarhiskie klasterēšanas algoritmi, mikrobioms, datu vizualizācija
Keywords in English Data mining, Bioinformatics, Data Clustering, Centroid Based Non-hierarchical Algorithms, Hierarchical Clustering Algorithms, Microbiota, Data Visualization
Language lv
Year 2021
Date and time of uploading 04.06.2021 12:24:02