Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Bioinformātikas datu klasterēšana: zarnu mikrobioms pirms un pēc antibiotiku ietekmes |
Nosaukums angļu valodā |
Bioinformatics Data Clustering: Intestinal Microbiome Before and After Antibiotic Effects |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Inese Poļaka |
Recenzents |
Dr. sc.’ing. Sigita Misiņa |
Anotācija |
Bakalaura darbs ir veltīts datizraces metožu un paņēmienu izmantošanai bioinformātikā, klasterēšanas algoritmu pielietošanai reālu datu analīzei. Darbā izmantotā datu kopa satur Latvijas pacientu kuņģa mikrobioma sastāvus, pirms antibiotiku lietošanas un sešus mēnešus pēc antibiotiku lietošanas uzsākšanas. Tika izmantoti uz centroīdiem balstītie nehierarhiskie un hierarhiskie klasterēšanas algoritmi, mainot datu normalizācijas un klasteru skaitu, lai izsekotu mikrobioma sastāva atkarībai no laika brīža. Ievadā aprakstīta datizraces izmantošanas aktualitāte bioinformatikā, bakalaura darba mērķis un uzdevumi. Darba teorētiskajā apskatā detalizētāk aprakstīta datizrace un tās pielietošana, datu klasterēšana, klasterēšanas algoritmi un algoritmu darbības principi, jau veiktie pētījumi bioinformātikā, izmantojot datizraces metodes, kā arī datu vizualizācija. Pēc tam tika aprakstīta formālā uzdevuma nostādne, kas palīdz labāk izprast eksperimentu veikšanas mērķus un vēlamos rezultātus. Praktisku eksperimentu īstenošanai ir aprakstīti esošie datizraces rīki, īpaši Orange rīks, kas tiek izmantots šajā darbā. Turklāt ir aprakstīts datu sagatavošanas process un detalizēts eksperimenta apraksts. Pielietojot k-vidējo un hierarhisko klasterēšanas algoritmus, kā arī dažādas normalizācijas, piemēram, logaritmisko normalizāciju, z-mēra normalizāciju un jau esošo z-mēra normalizāciju Orange rīkā, iegūtie eksperimenta rezultāti tiek salīdzināti savā starpā. Rezultātu interpretācija notiek, salīdzinot laika intervālus, kā arī salīdzinot klasterēšanas algoritmu un izmantoto normalizāciju efektivitāti. Eksperimenta rezultāti ļauj novērtēt klasterēšanas izmantošanas efektivitāti pētījumos ar lielu apjomu empīrisku medicīnisko datu. Darba apjoms - 90. lpp., 16 tabulas, 53 attēli un 8 pielikumi. |
Atslēgas vārdi |
Datizrace, bioinformātika, datu klasterēšana, uz centroīdiem balstītie nehierarhiskie algoritmi, hierarhiskie klasterēšanas algoritmi, mikrobioms, datu vizualizācija |
Atslēgas vārdi angļu valodā |
Data mining, Bioinformatics, Data Clustering, Centroid Based Non-hierarchical Algorithms, Hierarchical Clustering Algorithms, Microbiota, Data Visualization |
Valoda |
lv |
Gads |
2021 |
Darba augšupielādes datums un laiks |
04.06.2021 12:24:02 |