Studiju veids |
maģistra akadēmiskās studijas |
Studiju programmas nosaukums |
Datorsistēmas |
Nosaukums |
Dziļās mašīnmācīšanās pieejas izstrāde sejas atpazīšanai |
Nosaukums angļu valodā |
Development of Deep Learning Base on Facial Recognition Mechanism |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Egons Lavendelis |
Recenzents |
Asociētais profesors Katrina Boločko |
Anotācija |
Sejas atpazīšanai ir nozīmīga loma datorredzes jomā tās plašā pielietojuma dēļ, sākot no drošības sistēmām un beidzot ar dažādiem citiem komerciāliem pielietojumiem. Neskatoties uz to, ka sejas atpazīšanas jomā veikti daudzi pētījumi, tā joprojām ir izaicinājumu pilna, jo precizitāte joprojām ir uzlabojama.
Google pētnieki 2015. gadā publicēja FaceNet dziļo neironu tīklu, kas ir sasniedzis jaunu līmeni.Tas pārveido sejas attēlu 128 dimensiju attēlojuma vektorā. Facenet ir šī brīža aktuālais sejas atpazīšanas risinājums. Tomēr ieejas attēliem ir liela ietekme uz atpazīšanas rezultātu. Apmācot FaceNet, balstoties uz dažādām lielām datu kopām un veicot novērtēšanu uz LFW datu kopas, ir noskaidrots, ka tādas nenozīmīgas detaļas kā krāsains fons vai matu griezums ietekmē atpazīšanas precizitāti. Šādas nenozīmīgas ieejas attēlu detaļas attēlojumu telpā rada pārāk lielus attālumus starp vienas klases piemēriem un vienlaicīgi pārāk mazus attālumus starp klasteru centriem, kas padara sarežģītu attēlojumu vektoru klasifikāciju. Nepieciešams panākt situāciju, kad attālumi starp vienas klases objektiem ir mazi, bet starp klašu centriem – lieli. Šādā situācijā klasifikācija ir vienkārša un attiecīgi precizitāte uzlabojas.
Lai novērstu kaitīgu attēla detaļu ietekmi uz sejas atpazīšanas precizitāti, maģistra darbā ir izstrādāta sejas atpazīšanas sistēma. Sistēma satur segmentācijas bloku, kas tika apmācīts, balstoties uz CelebAMask-HQ datu kopas. Tika veikta esošo segmentācijas metožu salīdzināšana ar mērķi atrast efektīvāko metodi. Analīzes rezultātā segmentācijai tika izvēlēts Deeplab-V3+ ar Efficentnet-b2 pamattīklu. Segmentācijas rezultātā tiek izgriezta seja no pārējā attēlā un pārējie attēla pikseļi tiek aizstāti ar attēla visbiežāk sastopamo (mediāna) krāsu. Šādā veidā modelis spēj apmācīties sejas attēlu nozīmīgās īpašības. Modeļa validācija uz LFW datu kopas pierāda, ka šāda nenozīmīgo attēla daļu noņemšana uzlabo atpazīšanas precizitāti |
Atslēgas vārdi |
segmentācijas, sejas atpazīšanas ,FaceNet, CNN |
Atslēgas vārdi angļu valodā |
FEATURE EXTRACTION, SEMANTIC SEGMENTATION, CNN |
Valoda |
eng |
Gads |
2021 |
Darba augšupielādes datums un laiks |
04.01.2021 15:00:57 |