Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Datorsistēmas |
Nosaukums |
Ziņkārības modeļa nozīme stimulētā mašīnmācībā |
Nosaukums angļu valodā |
Importance of Curiosity Model in Reinforcement Learning |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Ēvalds Urtāns |
Recenzents |
LDI pētnieks A.Gaidukovs |
Anotācija |
Šajā pētījumā ir piedāvāts jauns stimulētās māšīnapmācības modelis, kas imitē ziņkārības (auto-encoder) modeli. Tika veikta modeļa testēšana un hiper-parametru pārmeklēšana, īpašību un spēja iemācīties politiku vidēs ar retiem balvas stāvokļiem. Modelis tika izstrādāts, balstoties uz jaunākajiem pētījumiem ziņkārības imitēšanā dziļajā stimulētajā māšīnapmācībā. Esošie “varavīksnes” DDQN vērtību funkcijā balstītie modeļi tika papildināti ar ziņkārības modeli un auto-kodēšanas izmantojot OpenAI Gym datorspēļu vides, kā arī salīdzinājums jau ar esošām metodēm.
Tika noskaidrots, ka stimulētās mašīnapmācības modeļi ar ziņkārības modeli spēj iegūt labākus rezultātus vidēs ar retiem balvas stāvokļiem. Pievienojot ziņkārības modelim arī auto-kodēšanas modeli, pārejas stāvokļu reprezentācijas kļuva vēl aprakstošākas un varēja iegūt vēl labākus rezultātus par “varavīksnes” DDQN vērtību modeļiem.
Darba pamattekstā ir 61 lappuses, 43 attēli, 5 tabulas un 55 informācijas avoti. |
Atslēgas vārdi |
dziļie mākslīgie neironu tīkli, stimulētā mašīnapmācība, ziņkārības modelis, auto-kodēšanas modelis, ddqn |
Atslēgas vārdi angļu valodā |
deep artificial neural networks, reinforcement learning, curiosity model, auto-encoder model, ddqn |
Valoda |
lv |
Gads |
2019 |
Darba augšupielādes datums un laiks |
27.05.2019 12:03:39 |