Graduate papers
  
Description of the graduate paper
Form of studies Master
Title of the study programm Intelligent robotic systems
Title in original language Automatizēta parametru atrašana audio signāla dinamiskai apstrādei, izmantojot dziļās stimulētās mācīšanās metodes
Title in English Automatic Parameter Generation for Dynamic Range Processing of Audio Signal by Applyng Deep Reinforcement Learning Methods
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Sergejs Šarkovskis
Reviewer Ēvalds Urtāns
Abstract Signāla daudzslāņu dinamiskā apstrāde ir to sadalīšana joslās (pielietojot digitālus filtrus) un katras joslas dinamiskā diapazona kontrole (izmantojot kompresoru - automatizētu amplitūdas līmeņa kontroles rīku). Pediatriskajā praksē dzirdes problēmas ir saistītas ne tikai ar dzirdes jutības zaudēšanu noteiktos dzirdamo frekvenču diapazonos, bet arī ar dinamikas izmaiņu izšķirtspējas zaudēšanu šajos diapazonos (spēju atšķirt amplitūdas izmaiņas). Tieši tāpēc mūsdienās izplatīta prakse ir iekļaut dzirdes aparātos daudzslāņu dinamiskos signāla apstrādes ķēdes elementus un kalibrēt dzirdes aparātus, balstoties uz subjekta audiogrammu (datiem par dzirdes jutību dažādās frekvencēs). Kalibrēšanas procedūru DSL-v5 (Scollie, 2007), kas aprakstīta tehniskajā specifikācijā, savā praksē plaši lieto gan dzirdes aparātu ražotāji, gan ārsti. Tomēr daži pētījumi liecina par to, ka DSL-v5 ģenerētais kalibrēšanas profila skanējums var neapmierināt gala lietotāju un pat radīt viņam diskomfortu (N. Alamdari et al., 2020). Šī pētījuma autors piedāvā inovatīvu metodi automatizētai audiosignāla daudzslāņu dinamiskās apstrādes moduļa parametru ģenerēšanai, kas balstās uz dziļā stimulētā mācīšanās pieejas. Metode ir izmantojama viedtālruņa austiņās, un tās gala rezultāts ir subjektīvi uzlabota muzikālā materiāla klausīšanas pieredze. Pētījuma mērķis ir eksperimentāli novērtēt autora izstrādātās skaņas apstrādes personalizēšanas metodes efektivitāti, salīdzinot to ar DSLv-5 rekomendēto un piedāvāto sākotnēja rakstā, kurā tika aprakstīts līdzīga modeļa pielietojums (N. Alamdari et al., 2020). Darba apjoms ir 62 lapaspuses, 20 attēli, 3 tabulas. Ir izmantots 31 informācijas avots.
Keywords signāla dinamiskā diapazona apstrāde, atskaņošanas rīku apstrādes ķēdes preference, dziļā Q-mācīšanas, dziļā stimulētās mācīšanas
Keywords in English signal dynamic range processing, audio playback processing chain personalization, deep Q-learning, deep reinforcement learning
Language lv
Year 2023
Date and time of uploading 30.05.2023 11:52:55