Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Datorsistēmas
Nosaukums Rīka izstrāde automatizētai dokumentu parsēšanai, iegūto datu analīzei un ievadei
Nosaukums angļu valodā Development of a Tool for Automated Document Parsing, Analysis and Input of Obtained Data
Struktūrvienība 12300 Lietišķo datorsistēmu institūts
Darba vadītājs Natālija Prokofjeva
Recenzents Ainārs Auziņš
Anotācija Bakalaura darba 3. tips: Produkta vai prototipa izstrāde Bakalaura darbs ir veltīts rīka izstrādei, kurš spēs automatizēt lietotāju darbu saistītu ar informācijas izgūšanu no dokumentiem, šīs informācijas analīzi un lietotāja izvēlēto datu izgūšanu ar mērķi ievadīt tos lietotnēs. Galvenā uzmanība pievērsta šādu uzdevumu risināšanai: dokumentu parsēšanas un optisko rakstzīmju atpazīšanas tehnoloģiju un paplašinājumu salīdzināšanai, datu meklēšanas un analīzes algoritmu salīdzināšanai, automatizētu datu ievades pieeju pārbaude un salīdzināšana, rīka izstrāde un tā apraksta izveidošana, izveidotā rīka prototipa testēšanā un rezultātu apkopošana. Bakalaura darbs sastāv no ievada, piecām nodaļām un secinājumiem. Ievadā ir aprakstīta tēmas aktualitāte, formulēts darba mērķis un uzdevumi. Pirmajā nodaļā ir aprakstīta PDF un Word dokumentu parsēšana un teksta izgūšana no attēliem izmantojot optisko rakstzīmju atpazīšanas pieeju. Otrajā nodaļā tiek aprakstītas un salīdzinātas pieejas datu meklēšanai un šo datu analīzei. Trešā nodaļa tiek veltīta datu ievades pieeju salīdzināšanai ar mērķi noteikt to stiprās un vājās puses. Ceturtā nodaļa satur informāciju par rīka izstrādes soļiem, kā tika izveidots sākotnējais plāns un kā tas tika attīstīts līdz iecerēto darbību stāvoklim. Piektā nodaļa apraksta izveidotā rīka testēšanas plānu, izveidotā rīka pielietojuma iespējas un to, kā turpmāk ir iespējams šo rīku attīstīt un uzlabot. Darba pamattekstā ir 74 lappuses, 6 attēli, 13 tabulas, 92 izmantotie literatūras avoti un 19 pielikumi.
Atslēgas vārdi PDF, word, OCR, API, parsēšana, ievade, analīze, automatizācija, izstrāde
Atslēgas vārdi angļu valodā PDF, word, OCR, API, parsing, input, analysis, automation, development
Valoda lv
Gads 2022
Darba augšupielādes datums un laiks 05.09.2022 23:07:44