Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Information Technology
Title in original language Dziļās mācīšanās metožu analīze runas sintēzē un runas atpazīšanā
Title in English Analysis of Deep Learning Methods in Speech Synthesis and Speech Recognition
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Henrihs Gorskis
Reviewer Artis Ābolts
Abstract Darbā tiek analizētas dziļās mācīšanās metodes runas sintēzē un runas atpazīšanā. Darbā apskatīti galvenie runas apstrādes virzieni: teksta pārveidošana runā (Text-to-Speech, TTS), automātiskā runas atpazīšana (Automatic Speech Recognition, ASR) un balss konvertēšana (Voice Conversion, VC). Tiek izskaidroti šo tehnoloģiju darbības principi, pielietojuma jomas, priekšrocības un ierobežojumi. Tika veikti eksperimenti ar “Piper” TTS, “Whisper” ASR, “RVC” un “SO-VITS-SVC” modeļiem. Tika analizēts modeļu ģenerēšanas ātrums, apmācības ilgums, datora resursu patēriņš. Papildus tika pētīta klusuma ietekme uz balss konvertēšanas modeļu darbību, kā arī izskatīta un analizēta “warm-up” efekta ietekme uz ģenerēšanas laiku. Iegūtie rezultāti parāda atšķirības starp dažādām runas apstrādes metodēm un ļauj novērtēt to piemērotību praktiskai izmantošanai. Darbā veikta arī modeļu salīdzinošā analīze pēc kvalitātes, veiktspējas un patērētajiem skaitļošanas resursiem. Darba apjoms: 50 lappuses, 33 attēli, 8 tabulas, 18 informācijas avoti.
Keywords Dziļā mācīšanās, runas sintēze, runas atpazīšana, balss konvertēšana
Keywords in English Deep learning, speech synthesis, speech recegnition, voice conversion
Language lv
Year 2026
Date and time of uploading 27.05.2026 21:50:32