| Anotācija |
Šajā bakalaura darbā tiek pētīta mašīnmācīšanās balstītu sejas atpazīšanas sistēmu izstrāde un novērtēšana, koncentrējoties uz viegla, precīza un reāllaika prototipa ieviešanu. Pētījumā galvenokārt tiek pētīta iepriekš apmācītu modeļu, piemēram, FaceNet un EdgeFace, veiktspēja, izmantojot modernas apmācības metodes, tostarp tripletu zudumu un precizēšanu maziem, konkrētai jomai specifiskiem datu kopumiem. Projekts risina galvenās sejas atpazīšanas problēmas, piemēram, skaitļošanas efektivitāti, pielāgošanās spēju ierobežotiem datiem un reālās pasaules izvietošanas ierobežojumus. Lai sasniegtu šos mērķus, tika izmantotas divas datu kopas: liela mēroga CelebA tripletu datu kopa un pielāgota datu kopa, kas sastāv no 10 personām ar vairākiem sejas attēliem, kas uzņemti dažādos apstākļos. CelebA datu kopa tika izmantota sākotnējai apmācībai, lai izmantotu liela mēroga iepriekšējas apmācības priekšrocības, savukārt pielāgota datu kopa tika izmantota modeļa precizēšanai un pielāgošanai. Izmantojot šo duālo apmācības stratēģiju, prototips demonstrē uzlabotu precizitāti personalizētos identitātes atpazīšanas uzdevumos. Modeļa veiktspēja tika uzraudzīta un novērtēta, izmantojot Comet.ml, lai vizualizētu apmācības dinamiku, tostarp zudumu līknes un precizitātes tendences. Tādi rādītāji kā F1 rādītājs, tripletu zudums un secinājumu laiks tika izmantoti, lai novērtētu vispārināšanas spējas un sistēmas reaģētspēju. Šajā pētījumā atlasīto modeļu novērtēšanai dažādos apstākļos tika izmantotas vairākas apmācības konfigurācijas un datu kopas. Lai gan tas nav oficiāls etalons, eksperimenti izveido salīdzinošu modeļa uzvedības bāzi gan liela mēroga (CelebA), gan maza mēroga (pielāgota) datu kopas apstākļos. Ziņotie veiktspējas rādītāji piedāvā praktisku atsauci turpmākam darbam līdzīgās ierobežotās vidēs. Lai demonstrētu lietojamību reāllaikā un praktisku integrāciju, apmācītais EdgeFace modelis tika eksportēts ONNX formātā un izvietots, izmantojot Hugging Face Spaces, izmantojot Gradio saskarni tiešraides sejas atpazīšanai. Šī izvietošana ļāva pārbaudīt identitāti, izmantojot tīmekļa kameru vai attēlu augšupielādi, ar reāllaika vērtēšanu un datubāzes attēlu saskaņošanu. Neskatoties uz EdgeFace modeļa efektīvo arhitektūru, eksperimenti atklāja ievērojamu ierobežojumu: tripletu zuduma konfigurācijā modelim neizdevās sasniegt nozīmīgu precizitāti un F1 rādītāju, kas liecina, ka tas, iespējams, nav strukturāli saderīgs ar tripletu metrikas apguvi. Šī atziņa paver ceļu turpmākiem pētījumiem par arhitektūras un zuduma funkciju saderību.
Testēšanas laikā novērotie augstas ticamības rezultāti izceļ apmācītās sistēmas efektivitāti, savukārt atpazīšanas kļūmes dažos perifērijas gadījumos norāda uz uzlabojumiem. Šis darbs sniedz ieguldījumu augošajā mākslīgā intelekta darbinātas sejas atpazīšanas jomā, piedāvājot atkārtojamu metodoloģiju, izvērtējot modeļu kompromisus un demonstrējot praktiskus pielietojumus. Tas arī uzsver datu kopu daudzveidības, reāllaika veiktspējas uzraudzības un izvietošanas stratēģiju nozīmi intelektuālu atpazīšanas sistēmu projektēšanā. |