Studiju veids |
maģistra akadēmiskās studijas |
Studiju programmas nosaukums |
Datorsistēmas |
Nosaukums |
Nestrukturētu maksājumu dokumentu apstrādes metodes izstrādāšana un realizēšana |
Nosaukums angļu valodā |
The Development and Implementation of Unstructured Payment Document Processing Method |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Ilze Andersone |
Recenzents |
Katrina Boločko |
Anotācija |
Maģistra darbā ir aprakstītas iespējamās metodes, kā apstrādāt nestrukturētu maksājumu kvīšu datus. Maģistra darba autore novēroja, ka nepieciešamās metodes nestrukturētu maksājumu kvīšu apstrādei ir attēlu izlīdzināšana, teksta izvilkšana un maksājuma kvīšu datu apstrāde, izmantojot regex un simbolisko virkni, vairāku etiķešu teksta klasifikācija, teksta klasifikācija, izmantojot izlases meža algoritmu un teksta klasifikācija. izmantojot neironu tīklu. Tiek ņemti vērā četri dažādi maksājuma kvīts dati, kas ir kvīts vienības, kvīts numurs, kvīts kopā un kvīts adrese. Attēla izlīdzināšanas process tiek īstenots, izmantojot malu noteikšanas paņēmienu. Teksta izvilkšanas metode tiek ieviesta, izmantojot Google vision API, kas ļauj izvilkt rediģējamo tekstu ar teksta pozīciju ievades attēlā. Maksājuma kvīts rediģējamais teksts tiek apstrādāts, izmantojot galvenās trīs dažādas pieejas, kas ir Regex un Symbolic String, Multi-Label klasifikācija un Teksta klasifikācija, izmantojot Random Forest Algorithm. Iegūtie rezultāti ir noderīgi nestrukturētu maksājumu saņemšanas dokumentu apstrādei, no maksājuma saņemšanas dokumenta izvelkot un apstrādājot rediģējamo tekstu. Pamatojoties uz sasniegtajiem rezultātiem, maģistra darba autore secina, ka ir nepieciešams maksājuma čeka attēla līdzinājums, lai iegūtu pareizu tekstu par iegādātajām precēm un to cenu. Random Forest algoritma ieviešana maksājumu kvīšu datu klasifikācijai nodrošina labākus rezultātus, salīdzinot ar Regex un Multi-Label klasifikāciju.
Maģistra darbā kopumā ir 100 lappuses, 43 attēli, 6 tabulas, 97 uzziņu avoti un 9 pielikumi. |
Atslēgas vārdi |
NESTRUKTURĒTS MAKSĀJUMA KJŪTA DOKUMENTS, MAKSĀJUMA KVIŅA DATU IDENTIFIKĀCIJA, ATTĒLU LĪDZINĀŠANA, OPTISKĀS RAKSTUROJU PAZĪŠANA, TEKSTA KLASIFIKĀCIJA, NEURĀLAIS TĪKLS |
Atslēgas vārdi angļu valodā |
UNSTRUCTURED PAYMENT RECEIPT DOCUMENT, PAYMENT RECEIPT DATA IDENTIFICATION, IMAGE ALIGNMENT, OPTICAL CHARACTER RECOGNITION, TEXT CLASSIFICATION, NEURAL NETWORK |
Valoda |
eng |
Gads |
2023 |
Darba augšupielādes datums un laiks |
02.01.2023 23:49:38 |