Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids maģistra akadēmiskās studijas
Studiju programmas nosaukums Datorsistēmas
Nosaukums Nestrukturētu maksājumu dokumentu apstrādes metodes izstrādāšana un realizēšana
Nosaukums angļu valodā The Development and Implementation of Unstructured Payment Document Processing Method
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Ilze Andersone
Recenzents Katrina Boločko
Anotācija Maģistra darbā ir aprakstītas iespējamās metodes, kā apstrādāt nestrukturētu maksājumu kvīšu datus. Maģistra darba autore novēroja, ka nepieciešamās metodes nestrukturētu maksājumu kvīšu apstrādei ir attēlu izlīdzināšana, teksta izvilkšana un maksājuma kvīšu datu apstrāde, izmantojot regex un simbolisko virkni, vairāku etiķešu teksta klasifikācija, teksta klasifikācija, izmantojot izlases meža algoritmu un teksta klasifikācija. izmantojot neironu tīklu. Tiek ņemti vērā četri dažādi maksājuma kvīts dati, kas ir kvīts vienības, kvīts numurs, kvīts kopā un kvīts adrese. Attēla izlīdzināšanas process tiek īstenots, izmantojot malu noteikšanas paņēmienu. Teksta izvilkšanas metode tiek ieviesta, izmantojot Google vision API, kas ļauj izvilkt rediģējamo tekstu ar teksta pozīciju ievades attēlā. Maksājuma kvīts rediģējamais teksts tiek apstrādāts, izmantojot galvenās trīs dažādas pieejas, kas ir Regex un Symbolic String, Multi-Label klasifikācija un Teksta klasifikācija, izmantojot Random Forest Algorithm. Iegūtie rezultāti ir noderīgi nestrukturētu maksājumu saņemšanas dokumentu apstrādei, no maksājuma saņemšanas dokumenta izvelkot un apstrādājot rediģējamo tekstu. Pamatojoties uz sasniegtajiem rezultātiem, maģistra darba autore secina, ka ir nepieciešams maksājuma čeka attēla līdzinājums, lai iegūtu pareizu tekstu par iegādātajām precēm un to cenu. Random Forest algoritma ieviešana maksājumu kvīšu datu klasifikācijai nodrošina labākus rezultātus, salīdzinot ar Regex un Multi-Label klasifikāciju. Maģistra darbā kopumā ir 100 lappuses, 43 attēli, 6 tabulas, 97 uzziņu avoti un 9 pielikumi.
Atslēgas vārdi NESTRUKTURĒTS MAKSĀJUMA KJŪTA DOKUMENTS, MAKSĀJUMA KVIŅA DATU IDENTIFIKĀCIJA, ATTĒLU LĪDZINĀŠANA, OPTISKĀS RAKSTUROJU PAZĪŠANA, TEKSTA KLASIFIKĀCIJA, NEURĀLAIS TĪKLS
Atslēgas vārdi angļu valodā UNSTRUCTURED PAYMENT RECEIPT DOCUMENT, PAYMENT RECEIPT DATA IDENTIFICATION, IMAGE ALIGNMENT, OPTICAL CHARACTER RECOGNITION, TEXT CLASSIFICATION, NEURAL NETWORK
Valoda eng
Gads 2023
Darba augšupielādes datums un laiks 02.01.2023 23:49:38