Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids maģistra akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Apmācības ar pastiprināšanu pilnveidošana hierarhisko uzdevumu risināšanai
Nosaukums angļu valodā Enhancements to Reinforcement Learning for Hierarchical Problem Solving
Struktūrvienība 12100 Informācijas tehnoloģijas institūts
Darba vadītājs Dr. sc. ing. Jurijs Čižovs
Recenzents Dr. sc. ing. Sergejs Paršutins
Anotācija Mūsdienu pasaulē lineāras problēmas ir retums, lielākā daļa uzdevumu tiek uzdota abstraktā līmenī un tā izpildei nepieciešams veidot dažādus apakš uzdevumus. Dažādi apmācības ar pastiprināšanu algoritmi ir pierādījuši sevi kā labu uzdevumu risināšanas paņēmienu, tomēr iespēju pilnveidot apmācības ar pastiprināšanu algoritmus ar hierarhiskiem elementiem dažādu hierarhisku uzdevumu risināšanai nav plaši pētīta. Maģistra darba mērķis ir izstrādāt pilnveidojumus esošam apmācības ar pastiprināšanu algoritmam un pārbaudīt uzlabojumus, pielietojot tos hierarhiska uzdevuma risināšanā. Lai sasniegtu šo mērķi tiek izvirzīti sekojoši uzdevumi: apskatīt un izanalizēt galvenās problēmas esošo algoritmu pielietošanā hierarhisku uzdevumu risināšanā; izstrādāt pilnveidojumus esošo problēmu novēršanai; pielietot pilnveidoto algoritmu hierarhiska uzdevuma risināšanai. Darba izstrādes gaitā ir piedāvāts vienkāršots hierarhisks uzdevums, ar kura palīdzību var tikt pierādīta izstrādāto pilnveidojumu darbība, risinot hierarhiskus uzdevumus un realitātei pietuvināts uzdevums, kas ir realizēts Minecraft pasaulē un ar kura palīdzību var demonstrēt pilnveidotā algoritma spēju darboties reālistiskā pasaulē. Rezultātā ir izstrādāts modelis, kurš apraksta pilnveidoto algoritmu un hierarhiska uzdevuma risināšanas procesu, kā arī veikta izstrādātā modeļa realizācija, lai varētu veikt piedāvāto uzdevumu atrisināšanu.
Atslēgas vārdi Apmācība ar pastiprināšanu, Q-learning, hierarhisku uzdevumu risināšana
Atslēgas vārdi angļu valodā Reinforcement learning, Q-learning, Hierarchial problem solving
Valoda lv
Gads 2014
Darba augšupielādes datums un laiks 29.05.2014 16:05:04