| Form of studies |
Bachelor |
| Title of the study programm |
Information Technology |
| Title in original language |
Dziļās mācīšanās metožu analīze runas sintēzē un runas atpazīšanā |
| Title in English |
Analysis of Deep Learning Methods in Speech Synthesis and Speech Recognition |
| Department |
Faculty Of Computer Science Information Tehnology And Energy |
| Scientific advisor |
Henrihs Gorskis |
| Reviewer |
Artis Ābolts |
| Abstract |
Darbā tiek analizētas dziļās mācīšanās metodes runas sintēzē un runas atpazīšanā. Darbā apskatīti galvenie runas apstrādes virzieni: teksta pārveidošana runā (Text-to-Speech, TTS), automātiskā runas atpazīšana (Automatic Speech Recognition, ASR) un balss konvertēšana (Voice Conversion, VC). Tiek izskaidroti šo tehnoloģiju darbības principi, pielietojuma jomas, priekšrocības un ierobežojumi.
Tika veikti eksperimenti ar “Piper” TTS, “Whisper” ASR, “RVC” un “SO-VITS-SVC” modeļiem. Tika analizēts modeļu ģenerēšanas ātrums, apmācības ilgums, datora resursu patēriņš. Papildus tika pētīta klusuma ietekme uz balss konvertēšanas modeļu darbību, kā arī izskatīta un analizēta “warm-up” efekta ietekme uz ģenerēšanas laiku.
Iegūtie rezultāti parāda atšķirības starp dažādām runas apstrādes metodēm un ļauj novērtēt to piemērotību praktiskai izmantošanai. Darbā veikta arī modeļu salīdzinošā analīze pēc kvalitātes, veiktspējas un patērētajiem skaitļošanas resursiem.
Darba apjoms: 50 lappuses, 33 attēli, 8 tabulas, 18 informācijas avoti. |
| Keywords |
Dziļā mācīšanās, runas sintēze, runas atpazīšana, balss konvertēšana |
| Keywords in English |
Deep learning, speech synthesis, speech recegnition, voice conversion |
| Language |
lv |
| Year |
2026 |
| Date and time of uploading |
27.05.2026 21:50:32 |