Dziļās mācīšanās metožu analīze runas sintēzē un runas atpazīšanā

Noslēguma darbu reģistrs

Noslēguma darbu meklēšana

Studiju darba apraksts

Studiju veids	bakalaura akadēmiskās studijas
Studiju programmas nosaukums	Informācijas tehnoloģija
Nosaukums	Dziļās mācīšanās metožu analīze runas sintēzē un runas atpazīšanā
Nosaukums angļu valodā	Analysis of Deep Learning Methods in Speech Synthesis and Speech Recognition
Struktūrvienība	33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs	Henrihs Gorskis
Recenzents	Artis Ābolts
Anotācija	Darbā tiek analizētas dziļās mācīšanās metodes runas sintēzē un runas atpazīšanā. Darbā apskatīti galvenie runas apstrādes virzieni: teksta pārveidošana runā (Text-to-Speech, TTS), automātiskā runas atpazīšana (Automatic Speech Recognition, ASR) un balss konvertēšana (Voice Conversion, VC). Tiek izskaidroti šo tehnoloģiju darbības principi, pielietojuma jomas, priekšrocības un ierobežojumi. Tika veikti eksperimenti ar “Piper” TTS, “Whisper” ASR, “RVC” un “SO-VITS-SVC” modeļiem. Tika analizēts modeļu ģenerēšanas ātrums, apmācības ilgums, datora resursu patēriņš. Papildus tika pētīta klusuma ietekme uz balss konvertēšanas modeļu darbību, kā arī izskatīta un analizēta “warm-up” efekta ietekme uz ģenerēšanas laiku. Iegūtie rezultāti parāda atšķirības starp dažādām runas apstrādes metodēm un ļauj novērtēt to piemērotību praktiskai izmantošanai. Darbā veikta arī modeļu salīdzinošā analīze pēc kvalitātes, veiktspējas un patērētajiem skaitļošanas resursiem. Darba apjoms: 50 lappuses, 33 attēli, 8 tabulas, 18 informācijas avoti.
Atslēgas vārdi	Dziļā mācīšanās, runas sintēze, runas atpazīšana, balss konvertēšana
Atslēgas vārdi angļu valodā	Deep learning, speech synthesis, speech recegnition, voice conversion
Valoda	lv
Gads	2026
Darba augšupielādes datums un laiks	27.05.2026 21:50:32