Teksta analīzes algoritma pielāgošana genoma analīzei

Noslēguma darbu reģistrs

Noslēguma darbu meklēšana

Studiju darba apraksts

Studiju veids	bakalaura akadēmiskās studijas
Studiju programmas nosaukums	Informācijas tehnoloģija
Nosaukums	Teksta analīzes algoritma pielāgošana genoma analīzei
Nosaukums angļu valodā	Adaptation of a Text Analysis Algorithm for Genome Analysis
Struktūrvienība	33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs	Inese Poļaka
Recenzents	Dr. sc. ing. Sigita Misiņa
Anotācija	Pētniekiem bioloģijā un medicīnā lielais datu apjoms apgrūtina datu analīzi ierobežotu resursu dēļ. To apstrādei tiek patērēti liela daudzuma resursi un laika un ir svarīgi iegūt visātrāko un visefektīvāko veidu kā apstrādāt genomus. Darba mērķis ir adaptēt teksta analīzes algoritmu genomu datu analīzei un uzlabot modeļa darbību, kā arī apkopot kopējos iegūtos rezultātus. Darba mērķa ietvaros tiek veikta nepieciešamā literatūras analīze un tās izpēte, kā arī tiek lietota “Python” lietojumu programma, realizējot teksta adaptāciju. Modelis tika realizēts ar “gensim” palīdzību, kas sniedz “Word2Vec” vārdu apstrādes funkcionalitāti, kas tiek izmantota genomu analīzei, kā arī izveidots “HeatMap”, kas atspoguļo iegūto rezultātu precizitāti. Izveidotais modelis nodrošina teksta analīzi genomiem. Rezultātā tika iegūts modelis, kas netika veiksmīgi optimizēts, šo modeli var izmantot datu apstrādei, bet tas nesniedz pietiekami precīzus rezultātus, kā arī ir veikti ieteikumi kā uzlabot modeļa darbību un tā precizitāti. Darba apjoms - 49. lpp., 0 tabulas, 25 attēli un 0 pielikumi.
Atslēgas vārdi	jēdzientelpa, mašīnmācība
Atslēgas vārdi angļu valodā	word embedding, machine learning
Valoda	lv
Gads	2020
Darba augšupielādes datums un laiks	25.06.2020 11:14:08