Graduate papers
  
Description of the graduate paper
Form of studies Master
Title of the study programm Computer Systems
Title in original language Nestrukturētu maksājumu dokumentu apstrādes metodes izstrādāšana un realizēšana
Title in English The Development and Implementation of Unstructured Payment Document Processing Method
Department 12300 Institute of Applied Computer Systems
Scientific advisor Ilze Andersone
Reviewer Katrina Boločko
Abstract Maģistra darbā ir aprakstītas iespējamās metodes, kā apstrādāt nestrukturētu maksājumu kvīšu datus. Maģistra darba autore novēroja, ka nepieciešamās metodes nestrukturētu maksājumu kvīšu apstrādei ir attēlu izlīdzināšana, teksta izvilkšana un maksājuma kvīšu datu apstrāde, izmantojot regex un simbolisko virkni, vairāku etiķešu teksta klasifikācija, teksta klasifikācija, izmantojot izlases meža algoritmu un teksta klasifikācija. izmantojot neironu tīklu. Tiek ņemti vērā četri dažādi maksājuma kvīts dati, kas ir kvīts vienības, kvīts numurs, kvīts kopā un kvīts adrese. Attēla izlīdzināšanas process tiek īstenots, izmantojot malu noteikšanas paņēmienu. Teksta izvilkšanas metode tiek ieviesta, izmantojot Google vision API, kas ļauj izvilkt rediģējamo tekstu ar teksta pozīciju ievades attēlā. Maksājuma kvīts rediģējamais teksts tiek apstrādāts, izmantojot galvenās trīs dažādas pieejas, kas ir Regex un Symbolic String, Multi-Label klasifikācija un Teksta klasifikācija, izmantojot Random Forest Algorithm. Iegūtie rezultāti ir noderīgi nestrukturētu maksājumu saņemšanas dokumentu apstrādei, no maksājuma saņemšanas dokumenta izvelkot un apstrādājot rediģējamo tekstu. Pamatojoties uz sasniegtajiem rezultātiem, maģistra darba autore secina, ka ir nepieciešams maksājuma čeka attēla līdzinājums, lai iegūtu pareizu tekstu par iegādātajām precēm un to cenu. Random Forest algoritma ieviešana maksājumu kvīšu datu klasifikācijai nodrošina labākus rezultātus, salīdzinot ar Regex un Multi-Label klasifikāciju. Maģistra darbā kopumā ir 100 lappuses, 43 attēli, 6 tabulas, 97 uzziņu avoti un 9 pielikumi.
Keywords NESTRUKTURĒTS MAKSĀJUMA KJŪTA DOKUMENTS, MAKSĀJUMA KVIŅA DATU IDENTIFIKĀCIJA, ATTĒLU LĪDZINĀŠANA, OPTISKĀS RAKSTUROJU PAZĪŠANA, TEKSTA KLASIFIKĀCIJA, NEURĀLAIS TĪKLS
Keywords in English UNSTRUCTURED PAYMENT RECEIPT DOCUMENT, PAYMENT RECEIPT DATA IDENTIFICATION, IMAGE ALIGNMENT, OPTICAL CHARACTER RECOGNITION, TEXT CLASSIFICATION, NEURAL NETWORK
Language eng
Year 2023
Date and time of uploading 02.01.2023 23:49:38