Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Datorsistēmas |
Nosaukums |
Rīka izstrāde automatizētai dokumentu parsēšanai, iegūto datu analīzei un ievadei |
Nosaukums angļu valodā |
Development of a Tool for Automated Document Parsing, Analysis and Input of Obtained Data |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Natālija Prokofjeva |
Recenzents |
Ainārs Auziņš |
Anotācija |
Bakalaura darba 3. tips: Produkta vai prototipa izstrāde
Bakalaura darbs ir veltīts rīka izstrādei, kurš spēs automatizēt lietotāju darbu
saistītu ar informācijas izgūšanu no dokumentiem, šīs informācijas analīzi un lietotāja
izvēlēto datu izgūšanu ar mērķi ievadīt tos lietotnēs.
Galvenā uzmanība pievērsta šādu uzdevumu risināšanai: dokumentu parsēšanas
un optisko rakstzīmju atpazīšanas tehnoloģiju un paplašinājumu salīdzināšanai, datu
meklēšanas un analīzes algoritmu salīdzināšanai, automatizētu datu ievades pieeju
pārbaude un salīdzināšana, rīka izstrāde un tā apraksta izveidošana, izveidotā rīka
prototipa testēšanā un rezultātu apkopošana.
Bakalaura darbs sastāv no ievada, piecām nodaļām un secinājumiem. Ievadā ir
aprakstīta tēmas aktualitāte, formulēts darba mērķis un uzdevumi.
Pirmajā nodaļā ir aprakstīta PDF un Word dokumentu parsēšana un teksta
izgūšana no attēliem izmantojot optisko rakstzīmju atpazīšanas pieeju.
Otrajā nodaļā tiek aprakstītas un salīdzinātas pieejas datu meklēšanai un šo datu
analīzei.
Trešā nodaļa tiek veltīta datu ievades pieeju salīdzināšanai ar mērķi noteikt to
stiprās un vājās puses.
Ceturtā nodaļa satur informāciju par rīka izstrādes soļiem, kā tika izveidots
sākotnējais plāns un kā tas tika attīstīts līdz iecerēto darbību stāvoklim.
Piektā nodaļa apraksta izveidotā rīka testēšanas plānu, izveidotā rīka
pielietojuma iespējas un to, kā turpmāk ir iespējams šo rīku attīstīt un uzlabot.
Darba pamattekstā ir 74 lappuses, 6 attēli, 13 tabulas, 92 izmantotie literatūras avoti un
19 pielikumi. |
Atslēgas vārdi |
PDF, word, OCR, API, parsēšana, ievade, analīze, automatizācija, izstrāde |
Atslēgas vārdi angļu valodā |
PDF, word, OCR, API, parsing, input, analysis, automation, development |
Valoda |
lv |
Gads |
2022 |
Darba augšupielādes datums un laiks |
05.09.2022 23:07:44 |