Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Īsu laika rindu klasterizācijas izmantošanas iespēju izpēte bioinformātikas uzdevuma risināšanai |
Nosaukums angļu valodā |
Feasibility Analysis of Using Short Time Series Clustering in Solving Bioinformatics Problems |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Mg. sc. ing. Arnis Kiršners |
Recenzents |
Mg. sc. ing. Egmonts Treiguts |
Anotācija |
Bakalaura darbā tika izpētītas īsu laika rindu gēnu ekspresijas klasterizācijas izmantošanas iespējas bioinformātikas uzdevuma risināšanai, kā arī izvērtēta un salīdzināta ar dažādām klasterizācijas metodēm iegūto rezultātu precizitāte. Literatūras analīzes rezultāti tika atspoguļoti teorētiskā daļā, kur tiek aprakstīts par: datu ieguvi, datu tipiem, īsām laika rindas gēnu ekspresijam, datu pirmapstrādes metodēm un izmantotām klasterizācijas datu ieguves metodēm. Tika izpētītas rīkā STEM realizētās klasterizācijas STEM un k-vidējo metodes, ka arī tika izveidots rīka STEM apraksts. Datu analīzei bija izvēlēta datu kopa, kas sastāvēja no kuņģa šūnu reakcijām uz patogēnas baktērijas Helicobacter pylori ietekmi. Lai nebūtu jāpaļaujas uz eksperimenta rezultātā saņemto datu nejaušības pakāpi, bija izvēlēta testēšanas datu kopa, kas atšķīrās no apmācības datu kopas tikai ar laika rindu vērtību izmaiņām. Pēc datu apstrādes ar STEM programmas palīdzību, bija salīdzināta ar dažādām metodēm iegūto rezultātu precizitāte. Salīdzinot atšķirības starp statistiski nozīmīgā mainīgā minimālo un maksimālo vērtību, tika noskaidrots, kurai metodei šī starpība ir mazāka un kurai maksimālā vērtība atrodas pie pašas pieļaujamās robežas. Iegūtie rezultāti apkopoti grafikā. Tajā tiek paradīts kurai metodei ir augstāka gēnu kategorijas noteikšanas precizitāte attiecībā pret kopējo pievienoto gēnu skaitu.
Darba apjoms - 66 lpp., 6 tabulas, 50 attēli un 2 pielikumi. |
Atslēgas vārdi |
īsu laika rindas, datu ieguve, STEM, k-vidējo |
Atslēgas vārdi angļu valodā |
short time series, data mining, STEM, k-means |
Valoda |
lv |
Gads |
2011 |
Darba augšupielādes datums un laiks |
13.06.2011 14:34:02 |