Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Dziļās mācīšanās metožu analīze runas sintēzē un runas atpazīšanā
Nosaukums angļu valodā Analysis of Deep Learning Methods in Speech Synthesis and Speech Recognition
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Henrihs Gorskis
Recenzents Artis Ābolts
Anotācija Darbā tiek analizētas dziļās mācīšanās metodes runas sintēzē un runas atpazīšanā. Darbā apskatīti galvenie runas apstrādes virzieni: teksta pārveidošana runā (Text-to-Speech, TTS), automātiskā runas atpazīšana (Automatic Speech Recognition, ASR) un balss konvertēšana (Voice Conversion, VC). Tiek izskaidroti šo tehnoloģiju darbības principi, pielietojuma jomas, priekšrocības un ierobežojumi. Tika veikti eksperimenti ar “Piper” TTS, “Whisper” ASR, “RVC” un “SO-VITS-SVC” modeļiem. Tika analizēts modeļu ģenerēšanas ātrums, apmācības ilgums, datora resursu patēriņš. Papildus tika pētīta klusuma ietekme uz balss konvertēšanas modeļu darbību, kā arī izskatīta un analizēta “warm-up” efekta ietekme uz ģenerēšanas laiku. Iegūtie rezultāti parāda atšķirības starp dažādām runas apstrādes metodēm un ļauj novērtēt to piemērotību praktiskai izmantošanai. Darbā veikta arī modeļu salīdzinošā analīze pēc kvalitātes, veiktspējas un patērētajiem skaitļošanas resursiem. Darba apjoms: 50 lappuses, 33 attēli, 8 tabulas, 18 informācijas avoti.
Atslēgas vārdi Dziļā mācīšanās, runas sintēze, runas atpazīšana, balss konvertēšana
Atslēgas vārdi angļu valodā Deep learning, speech synthesis, speech recegnition, voice conversion
Valoda lv
Gads 2026
Darba augšupielādes datums un laiks 27.05.2026 21:50:32