Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Teksta analīzes algoritma pielāgošana genoma analīzei
Nosaukums angļu valodā Adaptation of a Text Analysis Algorithm for Genome Analysis
Struktūrvienība 12100 Informācijas tehnoloģijas institūts
Darba vadītājs Inese Poļaka
Recenzents Dr. sc. ing. Sigita Misiņa
Anotācija Pētniekiem bioloģijā un medicīnā lielais datu apjoms apgrūtina datu analīzi ierobežotu resursu dēļ. To apstrādei tiek patērēti liela daudzuma resursi un laika un ir svarīgi iegūt visātrāko un visefektīvāko veidu kā apstrādāt genomus. Darba mērķis ir adaptēt teksta analīzes algoritmu genomu datu analīzei un uzlabot modeļa darbību, kā arī apkopot kopējos iegūtos rezultātus. Darba mērķa ietvaros tiek veikta nepieciešamā literatūras analīze un tās izpēte, kā arī tiek lietota “Python” lietojumu programma, realizējot teksta adaptāciju. Modelis tika realizēts ar “gensim” palīdzību, kas sniedz “Word2Vec” vārdu apstrādes funkcionalitāti, kas tiek izmantota genomu analīzei, kā arī izveidots “HeatMap”, kas atspoguļo iegūto rezultātu precizitāti. Izveidotais modelis nodrošina teksta analīzi genomiem. Rezultātā tika iegūts modelis, kas netika veiksmīgi optimizēts, šo modeli var izmantot datu apstrādei, bet tas nesniedz pietiekami precīzus rezultātus, kā arī ir veikti ieteikumi kā uzlabot modeļa darbību un tā precizitāti. Darba apjoms - 49. lpp., 0 tabulas, 25 attēli un 0 pielikumi.
Atslēgas vārdi jēdzientelpa, mašīnmācība
Atslēgas vārdi angļu valodā word embedding, machine learning
Valoda lv
Gads 2020
Darba augšupielādes datums un laiks 25.06.2020 11:14:08