Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Automation and Computer Engineering
Title in original language Fonetisko skaņu atpazīšana pēc cilvēka lūpu kustībām
Title in English Recognition of Phonetic Sounds Based on Person's Lip Movement
Department Viedo datortehnoloģiju institūts
Scientific advisor Olga Krutikova
Reviewer Jeļena Tumiloviča
Abstract Bakalaura darba mērķis ir apskatīt eksistējošas runas atpazīšanas sistēmas un izpētīt modeļa, kas apmācīts izmantojot pārneses apmācības metodi, atpazīšanas precizitāti uz fonētisko skaņu (latviešu alfabēta burtu) pēc cilvēku lūpu kustības attēliem. Bakalaura darbs sastāv no trīs daļām - teorētiskās daļas, praktiskās daļas un novērtējuma daļas. Darba teorētiskajā daļā tika veikta runas atpazīšanas izpēte. Balstoties uz pētījumiem nozarē, tika apkopots, kādas eksistējošas sistēmas eksistē un tiek izmantotas runas atpazīšanā un kādas ir šo sistēmu priekšrocības un trūkumi. Darba laikā tika izpētītas lūpu kontūru izdalīšanas metodes, kā arī, balstoties uz prasībām darba mērķa sasniegšanai, tika izvirzīta apmācības laikā iegūto zināšanu pārnešanas metode, kura tika izmantota darba praktiskajā daļā. Darba praktiskajā daļā tika izveidota apmācības un eksaminācijas izlase, kas sastāvēja no ierunātiem latviešu alfabēta burtiem. Darba laikā tiek izmantota apmācības laikā iegūto zināšanu pārnešanas metode, ar kuru tika apmācīts modelis ar apmācības izlases attēliem, fonētisko skaņu atpazīšanai, savukārt izmantojot eksaminācijas izlases attēlus, tika veikta modeļa atpazīšanas testēšana. Darba novērtējuma daļā iegūto apmācīto modeļu atpazīšanas precizitāte tika testēta un salīdzināta starp modeļiem. Tika analizēti iegūtie rezultāti un apmācības laikā iegūto zināšanu pārnešanas metodes piemērotība fonētisko skaņu atpazīšanai. Bakalaura darbs sastāv no 66 lappusēm, 32 attēliem, 1 tabulas, 4 diagrammām un 3 pielikumiem.
Keywords Runas atpazīšana, Attēlu apstrāde, Apmācības laikā iegūto zināšanu pārnese
Keywords in English Speech Recognition, Image Processing, Transfer Learning
Language lv
Year 2020
Date and time of uploading 30.08.2020 23:55:19