Q-Learning apmācības algoritms līnijsekotājā

Noslēguma darbu reģistrs

Noslēguma darbu meklēšana

Studiju darba apraksts

Studiju veids	bakalaura akadēmiskās studijas
Studiju programmas nosaukums	Datorsistēmas
Nosaukums	Q-Learning apmācības algoritms līnijsekotājā
Nosaukums angļu valodā	Q-Learning Algorithm in Line Follower
Struktūrvienība	33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs	J.Grundspeņķis, STP kat. profesors
Recenzents
Anotācija	Darbā ir aplūkotie un izanalizēti stimulētie algoritmi. Īpaša uzmanība tiek pievērsta Q-apmācībai. Pētījuma ietvaros bija izveidots līnijsekotājs, kurš tika ieprogrammēts ar Q-apmācību. Pētījumā tika pārbaudīta līnijsekotāja spēja apmācīties ar dažādām apbalvojuma funkcijām, dažādos apstākļos. Ka arī tika pārbaudīta algoritma modificētais variants. Darbs sastāv no ievada, divām nodaļām un 6 pielikumiem. Pirmajā nodaļā ir ļoti īsi aplūkoti vispārējā līmenī visi apmācības algoritmi, un tālāk sīkāk izskatīti stimulācijas apmācība ar uzsvaru un TD(0), Q-apmācību un SARSA algoritmiem. Tiek izskatīti Markova Lēmumu Pieņemšanas Procesi un atsevišķi izskatīts Q-apmācība Otrajā nodaļā ir praktiska darba apraksts un secinājumi. Apraksta ietilpst: Q-apmācības algoritma prototips (kurš ir izveidot datorā), līnijsekotākatāja izveidošana un modificēšana, citu līdzīgu darbu apskats, eksperimentu apraksts un secinājumu izvedums. Nodaļas beigās, es rakstu par savas domās par to kas varētu mūs gaidīt nākotnē. Darba pamattekstā ir 52 lappuses, 16 attēli, 34 tabulas, 15 nosaukumu informācijas avoti un 6 pielikumi.
Atslēgas vārdi	Mašīnapmācība, stimulētie algoritmi, Markova Lēmumu Pieņemšanas Process, TD(0), Q-apmācība, SARSA, l
Atslēgas vārdi angļu valodā	Machine learning, reinforcement learning, Markov decision process, TD(0), SARSA, Q-Learning, line fo
Valoda	lv
Gads	2013
Darba augšupielādes datums un laiks	03.06.2013 14:01:40