Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Teksta analīzes algoritma pielāgošana genoma analīzei |
Nosaukums angļu valodā |
Adaptation of a Text Analysis Algorithm for Genome Analysis |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Inese Poļaka |
Recenzents |
Dr. sc. ing. Sigita Misiņa |
Anotācija |
Pētniekiem bioloģijā un medicīnā lielais datu apjoms apgrūtina datu analīzi ierobežotu resursu dēļ. To apstrādei tiek patērēti liela daudzuma resursi un laika un ir svarīgi iegūt visātrāko un visefektīvāko veidu kā apstrādāt genomus.
Darba mērķis ir adaptēt teksta analīzes algoritmu genomu datu analīzei un uzlabot modeļa darbību, kā arī apkopot kopējos iegūtos rezultātus.
Darba mērķa ietvaros tiek veikta nepieciešamā literatūras analīze un tās izpēte, kā arī tiek lietota “Python” lietojumu programma, realizējot teksta adaptāciju. Modelis tika realizēts ar “gensim” palīdzību, kas sniedz “Word2Vec” vārdu apstrādes funkcionalitāti, kas tiek izmantota genomu analīzei, kā arī izveidots “HeatMap”, kas atspoguļo iegūto rezultātu precizitāti. Izveidotais modelis nodrošina teksta analīzi genomiem.
Rezultātā tika iegūts modelis, kas netika veiksmīgi optimizēts, šo modeli var izmantot datu apstrādei, bet tas nesniedz pietiekami precīzus rezultātus, kā arī ir veikti ieteikumi kā uzlabot modeļa darbību un tā precizitāti.
Darba apjoms - 49. lpp., 0 tabulas, 25 attēli un 0 pielikumi. |
Atslēgas vārdi |
jēdzientelpa, mašīnmācība |
Atslēgas vārdi angļu valodā |
word embedding, machine learning |
Valoda |
lv |
Gads |
2020 |
Darba augšupielādes datums un laiks |
25.06.2020 11:14:08 |