Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Computer Systems
Title in original language Rīka izstrāde automatizētai dokumentu parsēšanai, iegūto datu analīzei un ievadei
Title in English Development of a Tool for Automated Document Parsing, Analysis and Input of Obtained Data
Department 12300 Institute of Applied Computer Systems
Scientific advisor Natālija Prokofjeva
Reviewer Ainārs Auziņš
Abstract Bakalaura darba 3. tips: Produkta vai prototipa izstrāde Bakalaura darbs ir veltīts rīka izstrādei, kurš spēs automatizēt lietotāju darbu saistītu ar informācijas izgūšanu no dokumentiem, šīs informācijas analīzi un lietotāja izvēlēto datu izgūšanu ar mērķi ievadīt tos lietotnēs. Galvenā uzmanība pievērsta šādu uzdevumu risināšanai: dokumentu parsēšanas un optisko rakstzīmju atpazīšanas tehnoloģiju un paplašinājumu salīdzināšanai, datu meklēšanas un analīzes algoritmu salīdzināšanai, automatizētu datu ievades pieeju pārbaude un salīdzināšana, rīka izstrāde un tā apraksta izveidošana, izveidotā rīka prototipa testēšanā un rezultātu apkopošana. Bakalaura darbs sastāv no ievada, piecām nodaļām un secinājumiem. Ievadā ir aprakstīta tēmas aktualitāte, formulēts darba mērķis un uzdevumi. Pirmajā nodaļā ir aprakstīta PDF un Word dokumentu parsēšana un teksta izgūšana no attēliem izmantojot optisko rakstzīmju atpazīšanas pieeju. Otrajā nodaļā tiek aprakstītas un salīdzinātas pieejas datu meklēšanai un šo datu analīzei. Trešā nodaļa tiek veltīta datu ievades pieeju salīdzināšanai ar mērķi noteikt to stiprās un vājās puses. Ceturtā nodaļa satur informāciju par rīka izstrādes soļiem, kā tika izveidots sākotnējais plāns un kā tas tika attīstīts līdz iecerēto darbību stāvoklim. Piektā nodaļa apraksta izveidotā rīka testēšanas plānu, izveidotā rīka pielietojuma iespējas un to, kā turpmāk ir iespējams šo rīku attīstīt un uzlabot. Darba pamattekstā ir 74 lappuses, 6 attēli, 13 tabulas, 92 izmantotie literatūras avoti un 19 pielikumi.
Keywords PDF, word, OCR, API, parsēšana, ievade, analīze, automatizācija, izstrāde
Keywords in English PDF, word, OCR, API, parsing, input, analysis, automation, development
Language lv
Year 2022
Date and time of uploading 05.09.2022 23:07:44