Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Bioinformātikas datu klasterēšana: zarnu mikrobioms pirms un pēc antibiotiku ietekmes
Nosaukums angļu valodā Bioinformatics Data Clustering: Intestinal Microbiome Before and After Antibiotic Effects
Struktūrvienība 12100 Informācijas tehnoloģijas institūts
Darba vadītājs Inese Poļaka
Recenzents Dr. sc.’ing. Sigita Misiņa
Anotācija Bakalaura darbs ir veltīts datizraces metožu un paņēmienu izmantošanai bioinformātikā, klasterēšanas algoritmu pielietošanai reālu datu analīzei. Darbā izmantotā datu kopa satur Latvijas pacientu kuņģa mikrobioma sastāvus, pirms antibiotiku lietošanas un sešus mēnešus pēc antibiotiku lietošanas uzsākšanas. Tika izmantoti uz centroīdiem balstītie nehierarhiskie un hierarhiskie klasterēšanas algoritmi, mainot datu normalizācijas un klasteru skaitu, lai izsekotu mikrobioma sastāva atkarībai no laika brīža. Ievadā aprakstīta datizraces izmantošanas aktualitāte bioinformatikā, bakalaura darba mērķis un uzdevumi. Darba teorētiskajā apskatā detalizētāk aprakstīta datizrace un tās pielietošana, datu klasterēšana, klasterēšanas algoritmi un algoritmu darbības principi, jau veiktie pētījumi bioinformātikā, izmantojot datizraces metodes, kā arī datu vizualizācija. Pēc tam tika aprakstīta formālā uzdevuma nostādne, kas palīdz labāk izprast eksperimentu veikšanas mērķus un vēlamos rezultātus. Praktisku eksperimentu īstenošanai ir aprakstīti esošie datizraces rīki, īpaši Orange rīks, kas tiek izmantots šajā darbā. Turklāt ir aprakstīts datu sagatavošanas process un detalizēts eksperimenta apraksts. Pielietojot k-vidējo un hierarhisko klasterēšanas algoritmus, kā arī dažādas normalizācijas, piemēram, logaritmisko normalizāciju, z-mēra normalizāciju un jau esošo z-mēra normalizāciju Orange rīkā, iegūtie eksperimenta rezultāti tiek salīdzināti savā starpā. Rezultātu interpretācija notiek, salīdzinot laika intervālus, kā arī salīdzinot klasterēšanas algoritmu un izmantoto normalizāciju efektivitāti. Eksperimenta rezultāti ļauj novērtēt klasterēšanas izmantošanas efektivitāti pētījumos ar lielu apjomu empīrisku medicīnisko datu. Darba apjoms - 90. lpp., 16 tabulas, 53 attēli un 8 pielikumi.
Atslēgas vārdi Datizrace, bioinformātika, datu klasterēšana, uz centroīdiem balstītie nehierarhiskie algoritmi, hierarhiskie klasterēšanas algoritmi, mikrobioms, datu vizualizācija
Atslēgas vārdi angļu valodā Data mining, Bioinformatics, Data Clustering, Centroid Based Non-hierarchical Algorithms, Hierarchical Clustering Algorithms, Microbiota, Data Visualization
Valoda lv
Gads 2021
Darba augšupielādes datums un laiks 04.06.2021 12:24:02