Automatic Parameter Generation for Dynamic Range Processing of Audio Signal by Applyng Deep Reinforcement Learning Methods

Graduate papers

Search graduate papers

Description of the graduate paper

Form of studies	Master
Title of the study programm	Intelligent robotic systems
Title in original language	Automatizēta parametru atrašana audio signāla dinamiskai apstrādei, izmantojot dziļās stimulētās mācīšanās metodes
Title in English	Automatic Parameter Generation for Dynamic Range Processing of Audio Signal by Applyng Deep Reinforcement Learning Methods
Department	Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor	Sergejs Šarkovskis
Reviewer	Ēvalds Urtāns
Abstract	Signāla daudzslāņu dinamiskā apstrāde ir to sadalīšana joslās (pielietojot digitālus filtrus) un katras joslas dinamiskā diapazona kontrole (izmantojot kompresoru - automatizētu amplitūdas līmeņa kontroles rīku). Pediatriskajā praksē dzirdes problēmas ir saistītas ne tikai ar dzirdes jutības zaudēšanu noteiktos dzirdamo frekvenču diapazonos, bet arī ar dinamikas izmaiņu izšķirtspējas zaudēšanu šajos diapazonos (spēju atšķirt amplitūdas izmaiņas). Tieši tāpēc mūsdienās izplatīta prakse ir iekļaut dzirdes aparātos daudzslāņu dinamiskos signāla apstrādes ķēdes elementus un kalibrēt dzirdes aparātus, balstoties uz subjekta audiogrammu (datiem par dzirdes jutību dažādās frekvencēs). Kalibrēšanas procedūru DSL-v5 (Scollie, 2007), kas aprakstīta tehniskajā specifikācijā, savā praksē plaši lieto gan dzirdes aparātu ražotāji, gan ārsti. Tomēr daži pētījumi liecina par to, ka DSL-v5 ģenerētais kalibrēšanas profila skanējums var neapmierināt gala lietotāju un pat radīt viņam diskomfortu (N. Alamdari et al., 2020). Šī pētījuma autors piedāvā inovatīvu metodi automatizētai audiosignāla daudzslāņu dinamiskās apstrādes moduļa parametru ģenerēšanai, kas balstās uz dziļā stimulētā mācīšanās pieejas. Metode ir izmantojama viedtālruņa austiņās, un tās gala rezultāts ir subjektīvi uzlabota muzikālā materiāla klausīšanas pieredze. Pētījuma mērķis ir eksperimentāli novērtēt autora izstrādātās skaņas apstrādes personalizēšanas metodes efektivitāti, salīdzinot to ar DSLv-5 rekomendēto un piedāvāto sākotnēja rakstā, kurā tika aprakstīts līdzīga modeļa pielietojums (N. Alamdari et al., 2020). Darba apjoms ir 62 lapaspuses, 20 attēli, 3 tabulas. Ir izmantots 31 informācijas avots.
Keywords	signāla dinamiskā diapazona apstrāde, atskaņošanas rīku apstrādes ķēdes preference, dziļā Q-mācīšanas, dziļā stimulētās mācīšanas
Keywords in English	signal dynamic range processing, audio playback processing chain personalization, deep Q-learning, deep reinforcement learning
Language	lv
Year	2023
Date and time of uploading	30.05.2023 11:52:55