Studiju veids |
maģistra akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Apmācības ar pastiprināšanu pilnveidošana hierarhisko uzdevumu risināšanai |
Nosaukums angļu valodā |
Enhancements to Reinforcement Learning for Hierarchical Problem Solving |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Dr. sc. ing. Jurijs Čižovs |
Recenzents |
Dr. sc. ing. Sergejs Paršutins |
Anotācija |
Mūsdienu pasaulē lineāras problēmas ir retums, lielākā daļa uzdevumu tiek uzdota abstraktā līmenī un tā izpildei nepieciešams veidot dažādus apakš uzdevumus. Dažādi apmācības ar pastiprināšanu algoritmi ir pierādījuši sevi kā labu uzdevumu risināšanas paņēmienu, tomēr iespēju pilnveidot apmācības ar pastiprināšanu algoritmus ar hierarhiskiem elementiem dažādu hierarhisku uzdevumu risināšanai nav plaši pētīta.
Maģistra darba mērķis ir izstrādāt pilnveidojumus esošam apmācības ar pastiprināšanu algoritmam un pārbaudīt uzlabojumus, pielietojot tos hierarhiska uzdevuma risināšanā.
Lai sasniegtu šo mērķi tiek izvirzīti sekojoši uzdevumi:
apskatīt un izanalizēt galvenās problēmas esošo algoritmu pielietošanā hierarhisku uzdevumu risināšanā;
izstrādāt pilnveidojumus esošo problēmu novēršanai;
pielietot pilnveidoto algoritmu hierarhiska uzdevuma risināšanai.
Darba izstrādes gaitā ir piedāvāts vienkāršots hierarhisks uzdevums, ar kura palīdzību var tikt pierādīta izstrādāto pilnveidojumu darbība, risinot hierarhiskus uzdevumus un realitātei pietuvināts uzdevums, kas ir realizēts Minecraft pasaulē un ar kura palīdzību var demonstrēt pilnveidotā algoritma spēju darboties reālistiskā pasaulē.
Rezultātā ir izstrādāts modelis, kurš apraksta pilnveidoto algoritmu un hierarhiska uzdevuma risināšanas procesu, kā arī veikta izstrādātā modeļa realizācija, lai varētu veikt piedāvāto uzdevumu atrisināšanu. |
Atslēgas vārdi |
Apmācība ar pastiprināšanu, Q-learning, hierarhisku uzdevumu risināšana |
Atslēgas vārdi angļu valodā |
Reinforcement learning, Q-learning, Hierarchial problem solving |
Valoda |
lv |
Gads |
2014 |
Darba augšupielādes datums un laiks |
29.05.2014 16:05:04 |