Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Īsu laika rindu klasterizācijas izmantošanas iespēju izpēte bioinformātikas uzdevuma risināšanai
Nosaukums angļu valodā Feasibility Analysis of Using Short Time Series Clustering in Solving Bioinformatics Problems
Struktūrvienība 12100 Informācijas tehnoloģijas institūts
Darba vadītājs Mg. sc. ing. Arnis Kiršners
Recenzents Mg. sc. ing. Egmonts Treiguts
Anotācija Bakalaura darbā tika izpētītas īsu laika rindu gēnu ekspresijas klasterizācijas izmantošanas iespējas bioinformātikas uzdevuma risināšanai, kā arī izvērtēta un salīdzināta ar dažādām klasterizācijas metodēm iegūto rezultātu precizitāte. Literatūras analīzes rezultāti tika atspoguļoti teorētiskā daļā, kur tiek aprakstīts par: datu ieguvi, datu tipiem, īsām laika rindas gēnu ekspresijam, datu pirmapstrādes metodēm un izmantotām klasterizācijas datu ieguves metodēm. Tika izpētītas rīkā STEM realizētās klasterizācijas STEM un k-vidējo metodes, ka arī tika izveidots rīka STEM apraksts. Datu analīzei bija izvēlēta datu kopa, kas sastāvēja no kuņģa šūnu reakcijām uz patogēnas baktērijas Helicobacter pylori ietekmi. Lai nebūtu jāpaļaujas uz eksperimenta rezultātā saņemto datu nejaušības pakāpi, bija izvēlēta testēšanas datu kopa, kas atšķīrās no apmācības datu kopas tikai ar laika rindu vērtību izmaiņām. Pēc datu apstrādes ar STEM programmas palīdzību, bija salīdzināta ar dažādām metodēm iegūto rezultātu precizitāte. Salīdzinot atšķirības starp statistiski nozīmīgā mainīgā minimālo un maksimālo vērtību, tika noskaidrots, kurai metodei šī starpība ir mazāka un kurai maksimālā vērtība atrodas pie pašas pieļaujamās robežas. Iegūtie rezultāti apkopoti grafikā. Tajā tiek paradīts kurai metodei ir augstāka gēnu kategorijas noteikšanas precizitāte attiecībā pret kopējo pievienoto gēnu skaitu. Darba apjoms - 66 lpp., 6 tabulas, 50 attēli un 2 pielikumi.
Atslēgas vārdi īsu laika rindas, datu ieguve, STEM, k-vidējo
Atslēgas vārdi angļu valodā short time series, data mining, STEM, k-means
Valoda lv
Gads 2011
Darba augšupielādes datums un laiks 13.06.2011 14:34:02