Form of studies |
Bachelor |
Title of the study programm |
Automation and Computer Engineering |
Title in original language |
Fonetisko skaņu atpazīšana pēc cilvēka lūpu kustībām |
Title in English |
Recognition of Phonetic Sounds Based on Person's Lip Movement |
Department |
Viedo datortehnoloģiju institūts |
Scientific advisor |
Olga Krutikova |
Reviewer |
Jeļena Tumiloviča |
Abstract |
Bakalaura darba mērķis ir apskatīt eksistējošas runas atpazīšanas sistēmas un izpētīt modeļa, kas apmācīts izmantojot pārneses apmācības metodi, atpazīšanas precizitāti uz fonētisko skaņu (latviešu alfabēta burtu) pēc cilvēku lūpu kustības attēliem. Bakalaura darbs sastāv no trīs daļām - teorētiskās daļas, praktiskās daļas un novērtējuma daļas.
Darba teorētiskajā daļā tika veikta runas atpazīšanas izpēte. Balstoties uz pētījumiem nozarē, tika apkopots, kādas eksistējošas sistēmas eksistē un tiek izmantotas runas atpazīšanā un kādas ir šo sistēmu priekšrocības un trūkumi.
Darba laikā tika izpētītas lūpu kontūru izdalīšanas metodes, kā arī, balstoties uz prasībām darba mērķa sasniegšanai, tika izvirzīta apmācības laikā iegūto zināšanu pārnešanas metode, kura tika izmantota darba praktiskajā daļā.
Darba praktiskajā daļā tika izveidota apmācības un eksaminācijas izlase, kas sastāvēja no ierunātiem latviešu alfabēta burtiem. Darba laikā tiek izmantota apmācības laikā iegūto zināšanu pārnešanas metode, ar kuru tika apmācīts modelis ar apmācības izlases attēliem, fonētisko skaņu atpazīšanai, savukārt izmantojot eksaminācijas izlases attēlus, tika veikta modeļa atpazīšanas testēšana.
Darba novērtējuma daļā iegūto apmācīto modeļu atpazīšanas precizitāte tika testēta un salīdzināta starp modeļiem. Tika analizēti iegūtie rezultāti un apmācības laikā iegūto zināšanu pārnešanas metodes piemērotība fonētisko skaņu atpazīšanai.
Bakalaura darbs sastāv no 66 lappusēm, 32 attēliem, 1 tabulas, 4 diagrammām un 3 pielikumiem. |
Keywords |
Runas atpazīšana, Attēlu apstrāde, Apmācības laikā iegūto zināšanu pārnese |
Keywords in English |
Speech Recognition, Image Processing, Transfer Learning |
Language |
lv |
Year |
2020 |
Date and time of uploading |
30.08.2020 23:55:19 |