Form of studies |
Bachelor |
Title of the study programm |
Computer Systems |
Title in original language |
Rīka izstrāde automatizētai dokumentu parsēšanai, iegūto datu analīzei un ievadei |
Title in English |
Development of a Tool for Automated Document Parsing, Analysis and Input of Obtained Data |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Natālija Prokofjeva |
Reviewer |
Ainārs Auziņš |
Abstract |
Bakalaura darba 3. tips: Produkta vai prototipa izstrāde
Bakalaura darbs ir veltīts rīka izstrādei, kurš spēs automatizēt lietotāju darbu
saistītu ar informācijas izgūšanu no dokumentiem, šīs informācijas analīzi un lietotāja
izvēlēto datu izgūšanu ar mērķi ievadīt tos lietotnēs.
Galvenā uzmanība pievērsta šādu uzdevumu risināšanai: dokumentu parsēšanas
un optisko rakstzīmju atpazīšanas tehnoloģiju un paplašinājumu salīdzināšanai, datu
meklēšanas un analīzes algoritmu salīdzināšanai, automatizētu datu ievades pieeju
pārbaude un salīdzināšana, rīka izstrāde un tā apraksta izveidošana, izveidotā rīka
prototipa testēšanā un rezultātu apkopošana.
Bakalaura darbs sastāv no ievada, piecām nodaļām un secinājumiem. Ievadā ir
aprakstīta tēmas aktualitāte, formulēts darba mērķis un uzdevumi.
Pirmajā nodaļā ir aprakstīta PDF un Word dokumentu parsēšana un teksta
izgūšana no attēliem izmantojot optisko rakstzīmju atpazīšanas pieeju.
Otrajā nodaļā tiek aprakstītas un salīdzinātas pieejas datu meklēšanai un šo datu
analīzei.
Trešā nodaļa tiek veltīta datu ievades pieeju salīdzināšanai ar mērķi noteikt to
stiprās un vājās puses.
Ceturtā nodaļa satur informāciju par rīka izstrādes soļiem, kā tika izveidots
sākotnējais plāns un kā tas tika attīstīts līdz iecerēto darbību stāvoklim.
Piektā nodaļa apraksta izveidotā rīka testēšanas plānu, izveidotā rīka
pielietojuma iespējas un to, kā turpmāk ir iespējams šo rīku attīstīt un uzlabot.
Darba pamattekstā ir 74 lappuses, 6 attēli, 13 tabulas, 92 izmantotie literatūras avoti un
19 pielikumi. |
Keywords |
PDF, word, OCR, API, parsēšana, ievade, analīze, automatizācija, izstrāde |
Keywords in English |
PDF, word, OCR, API, parsing, input, analysis, automation, development |
Language |
lv |
Year |
2022 |
Date and time of uploading |
05.09.2022 23:07:44 |