Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura profesionālās studijas
Studiju programmas nosaukums Finanšu pārvaldības informācijas sistēmas
Nosaukums Tīmekļa skrāpēšanas tehnoloģijas izmantošana reklāmas satura analīzei
Nosaukums angļu valodā Using Web Scraping Technology to Analyze Advertising Content
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Aleksejs Jurenoks
Recenzents Viktorija Stepanova
Anotācija Šajā bakalaura darbā izstrādāts un eksperimentāli validēts tehnoloģisks risinājums, kas apvieno tīmekļa skrāpēšanas un optiskās rakstzīmju atpazīšanas (OCR) metodes, lai automatizēti identificētu un analizētu tīmekļa vietnēs publicēto digitālās reklāmas vizuālo saturu. Ņemot vērā digitālās reklāmas straujo izaugsmi un arvien pieaugošo vizuālā satura nozīmi, šāds automatizēts risinājums ir īpaši aktuāls mārketinga datu analīzē. Izstrādātais rīks ļauj efektīvi apstrādāt lielu skaitu reklāmas baneru attēlu, automātiski izgūt no tiem būtisku informāciju (piemēram, produktu nosaukumus, cenas, atlaides) un strukturēt šos datus turpmākai analīzei. Risinājums izstrādāts Python programmēšanas valodā, izmantojot vairākas atvērtā pirmkoda bibliotēkas. Tostarp BeautifulSoup tika pielietots tīmekļa lapu satura iegūšanai, Tesseract OCR — teksta atpazīšanai reklāmas attēlos, bet pandas — iegūto datu strukturēšanai un analīzei. Praktiskā testēšana tika veikta, apstrādājot reklāmas materiālus no divām lielām mazumtirdzniecības ķēdēm (Maxima un Lidl), lai novērtētu risinājuma veiktspēju reālos apstākļos. Iegūtie rezultāti apliecināja risinājuma augstu efektivitāti: teksta atpazīšanas precizitāte sasniedza aptuveni 90 - 95%, un sistēma spēja pielāgoties atšķirīgiem baneru dizainiem un formātiem. Analīzes gaitā iegūtie strukturētie dati (piemēram, produktu nosaukumi, cenas, atlaižu procenti) atbilda oriģinālajos reklāmas materiālos norādītajai informācijai, apstiprinot risinājuma uzticamību. Darba rezultāti apliecina, ka digitālo reklāmu automatizēta analīze ir efektīvs veids, kā iegūt konkurētspējīgus ieskatus mārketinga stratēģiju pilnveidei. Bakalaura darbs sastāv no 54 lappusēm, 9 attēliem, un 51 literatūras avota.
Atslēgas vārdi tīmekļa skrāpēšana, digitālā reklāma, OCR, datu analīze
Atslēgas vārdi angļu valodā web scraping, digital advertising, OCR, data analysis
Valoda lv
Gads 2025
Darba augšupielādes datums un laiks 27.05.2025 23:40:44