| Studiju veids |
bakalaura akadēmiskās studijas |
| Studiju programmas nosaukums |
Informācijas tehnoloģija |
| Nosaukums |
Dziļās mācīšanās metožu analīze runas sintēzē un runas atpazīšanā |
| Nosaukums angļu valodā |
Analysis of Deep Learning Methods in Speech Synthesis and Speech Recognition |
| Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
| Darba vadītājs |
Henrihs Gorskis |
| Recenzents |
Artis Ābolts |
| Anotācija |
Darbā tiek analizētas dziļās mācīšanās metodes runas sintēzē un runas atpazīšanā. Darbā apskatīti galvenie runas apstrādes virzieni: teksta pārveidošana runā (Text-to-Speech, TTS), automātiskā runas atpazīšana (Automatic Speech Recognition, ASR) un balss konvertēšana (Voice Conversion, VC). Tiek izskaidroti šo tehnoloģiju darbības principi, pielietojuma jomas, priekšrocības un ierobežojumi.
Tika veikti eksperimenti ar “Piper” TTS, “Whisper” ASR, “RVC” un “SO-VITS-SVC” modeļiem. Tika analizēts modeļu ģenerēšanas ātrums, apmācības ilgums, datora resursu patēriņš. Papildus tika pētīta klusuma ietekme uz balss konvertēšanas modeļu darbību, kā arī izskatīta un analizēta “warm-up” efekta ietekme uz ģenerēšanas laiku.
Iegūtie rezultāti parāda atšķirības starp dažādām runas apstrādes metodēm un ļauj novērtēt to piemērotību praktiskai izmantošanai. Darbā veikta arī modeļu salīdzinošā analīze pēc kvalitātes, veiktspējas un patērētajiem skaitļošanas resursiem.
Darba apjoms: 50 lappuses, 33 attēli, 8 tabulas, 18 informācijas avoti. |
| Atslēgas vārdi |
Dziļā mācīšanās, runas sintēze, runas atpazīšana, balss konvertēšana |
| Atslēgas vārdi angļu valodā |
Deep learning, speech synthesis, speech recegnition, voice conversion |
| Valoda |
lv |
| Gads |
2026 |
| Darba augšupielādes datums un laiks |
27.05.2026 21:50:32 |