Graduate papers
  
Description of the graduate paper
Form of studies Professional Bachelor
Title of the study programm Finance management information systems
Title in original language Tīmekļa skrāpēšanas tehnoloģijas izmantošana reklāmas satura analīzei
Title in English Using Web Scraping Technology to Analyze Advertising Content
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Aleksejs Jurenoks
Reviewer Viktorija Stepanova
Abstract Šajā bakalaura darbā izstrādāts un eksperimentāli validēts tehnoloģisks risinājums, kas apvieno tīmekļa skrāpēšanas un optiskās rakstzīmju atpazīšanas (OCR) metodes, lai automatizēti identificētu un analizētu tīmekļa vietnēs publicēto digitālās reklāmas vizuālo saturu. Ņemot vērā digitālās reklāmas straujo izaugsmi un arvien pieaugošo vizuālā satura nozīmi, šāds automatizēts risinājums ir īpaši aktuāls mārketinga datu analīzē. Izstrādātais rīks ļauj efektīvi apstrādāt lielu skaitu reklāmas baneru attēlu, automātiski izgūt no tiem būtisku informāciju (piemēram, produktu nosaukumus, cenas, atlaides) un strukturēt šos datus turpmākai analīzei. Risinājums izstrādāts Python programmēšanas valodā, izmantojot vairākas atvērtā pirmkoda bibliotēkas. Tostarp BeautifulSoup tika pielietots tīmekļa lapu satura iegūšanai, Tesseract OCR — teksta atpazīšanai reklāmas attēlos, bet pandas — iegūto datu strukturēšanai un analīzei. Praktiskā testēšana tika veikta, apstrādājot reklāmas materiālus no divām lielām mazumtirdzniecības ķēdēm (Maxima un Lidl), lai novērtētu risinājuma veiktspēju reālos apstākļos. Iegūtie rezultāti apliecināja risinājuma augstu efektivitāti: teksta atpazīšanas precizitāte sasniedza aptuveni 90 - 95%, un sistēma spēja pielāgoties atšķirīgiem baneru dizainiem un formātiem. Analīzes gaitā iegūtie strukturētie dati (piemēram, produktu nosaukumi, cenas, atlaižu procenti) atbilda oriģinālajos reklāmas materiālos norādītajai informācijai, apstiprinot risinājuma uzticamību. Darba rezultāti apliecina, ka digitālo reklāmu automatizēta analīze ir efektīvs veids, kā iegūt konkurētspējīgus ieskatus mārketinga stratēģiju pilnveidei. Bakalaura darbs sastāv no 54 lappusēm, 9 attēliem, un 51 literatūras avota.
Keywords tīmekļa skrāpēšana, digitālā reklāma, OCR, datu analīze
Keywords in English web scraping, digital advertising, OCR, data analysis
Language lv
Year 2025
Date and time of uploading 27.05.2025 23:40:44