Abstract |
Pieaug pārstrādāto pārtikas produktu ražošana un patēriņš. Eksistē vairāk nekā 3000 pārtikas sastāvdaļu, un ir sarežģīti zināt katras iespējamās sastāvdaļas izcelsmi, lai gan tas var būt svarīgi dažādu iemeslu dēļ, kā izvēlētās diētas vai alerģiju dēļ (International Food Information Council & U.S. Food and Drug Administration, 2004). Sevišķi pasaulē ir augusi interese par augu valsts uzturu un tādu produktu patēriņa samazināšanu, kas satur dzīvnieku izcelsmes sastāvdaļas – ētisku, veselības vai vides apsvērumu dēļ (World Health Organization & Regional Office for Europe, 2021). Tomēr ne vienmēr ir elementāri atpazīt dzīvnieku izcelsmes sastāvdaļas uz pārtikas preču mārķējumiem, jo nepastāv regulas, kas liktu ražotājiem obligāti norādīt to klātbūtni produktā. Attēlu apstrāde ir risinājums, kas var palīdzēt apkopot un izvērtēt informāciju, kas norādīta uz pārtikas produktu marķējumiem – gan sastāvdaļu sarakstu, gan uzturvērtību. Lai palielinātu teksta atpazīšanas precizitāti, ir izstrādāti dažādi mašīnmācīšanās algoritmi un apstrādes metodes. Pētījumi liecina, ka nozīmīgs ir ne tikai optiskās rakstzīmju atpazīšanas (OCR) process, bet arī attēla priekšapstrāde un OCR rīka izgūtā teksta pēcapstrāde.
Šajā darbā ir izveidots risinājums, kas veic pārtikas produkta sastāvdaļu saraksta (latviešu valodā) atpazīšanu no attēla ar produkta marķējumu, izmantojot OCR tehnoloģiju. Projekts ietver gan OCR, gan priekšapstrādes un pēcapstrādes paņēmienus. Risinājums klasificē produktu kā augu valsts izcelsmes vai nē, un, ja tas nav, tad norāda, kuras sastāvdaļas ir dzīvnieku izcelsmes.
Bakalaura darbs izstrādāts angļu valodā. Tas sastāv no 60 lapām. Darbā izmantotas 37 atsauces; tajā iekļautas 10 tabulas un 5 ilustrācijas (neieskaitot pielikumus), kā arī 6 pielikumi. |