Form of studies |
Bachelor |
Title of the study programm |
Information Technology |
Title in original language |
Teksta analīzes algoritma pielāgošana genoma analīzei |
Title in English |
Adaptation of a Text Analysis Algorithm for Genome Analysis |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Inese Poļaka |
Reviewer |
Dr. sc. ing. Sigita Misiņa |
Abstract |
Pētniekiem bioloģijā un medicīnā lielais datu apjoms apgrūtina datu analīzi ierobežotu resursu dēļ. To apstrādei tiek patērēti liela daudzuma resursi un laika un ir svarīgi iegūt visātrāko un visefektīvāko veidu kā apstrādāt genomus.
Darba mērķis ir adaptēt teksta analīzes algoritmu genomu datu analīzei un uzlabot modeļa darbību, kā arī apkopot kopējos iegūtos rezultātus.
Darba mērķa ietvaros tiek veikta nepieciešamā literatūras analīze un tās izpēte, kā arī tiek lietota “Python” lietojumu programma, realizējot teksta adaptāciju. Modelis tika realizēts ar “gensim” palīdzību, kas sniedz “Word2Vec” vārdu apstrādes funkcionalitāti, kas tiek izmantota genomu analīzei, kā arī izveidots “HeatMap”, kas atspoguļo iegūto rezultātu precizitāti. Izveidotais modelis nodrošina teksta analīzi genomiem.
Rezultātā tika iegūts modelis, kas netika veiksmīgi optimizēts, šo modeli var izmantot datu apstrādei, bet tas nesniedz pietiekami precīzus rezultātus, kā arī ir veikti ieteikumi kā uzlabot modeļa darbību un tā precizitāti.
Darba apjoms - 49. lpp., 0 tabulas, 25 attēli un 0 pielikumi. |
Keywords |
jēdzientelpa, mašīnmācība |
Keywords in English |
word embedding, machine learning |
Language |
lv |
Year |
2020 |
Date and time of uploading |
25.06.2020 11:14:08 |