| Form of studies |
Professional Bachelor |
| Title of the study programm |
Finance management information systems |
| Title in original language |
Tīmekļa skrāpēšanas tehnoloģijas izmantošana reklāmas satura analīzei |
| Title in English |
Using Web Scraping Technology to Analyze Advertising Content |
| Department |
Faculty Of Computer Science Information Tehnology And Energy |
| Scientific advisor |
Aleksejs Jurenoks |
| Reviewer |
Viktorija Stepanova |
| Abstract |
Šajā bakalaura darbā izstrādāts un eksperimentāli validēts tehnoloģisks
risinājums, kas apvieno tīmekļa skrāpēšanas un optiskās rakstzīmju atpazīšanas (OCR)
metodes, lai automatizēti identificētu un analizētu tīmekļa vietnēs publicēto digitālās
reklāmas vizuālo saturu. Ņemot vērā digitālās reklāmas straujo izaugsmi un arvien
pieaugošo vizuālā satura nozīmi, šāds automatizēts risinājums ir īpaši aktuāls
mārketinga datu analīzē. Izstrādātais rīks ļauj efektīvi apstrādāt lielu skaitu reklāmas
baneru attēlu, automātiski izgūt no tiem būtisku informāciju (piemēram, produktu
nosaukumus, cenas, atlaides) un strukturēt šos datus turpmākai analīzei. Risinājums
izstrādāts Python programmēšanas valodā, izmantojot vairākas atvērtā pirmkoda
bibliotēkas. Tostarp BeautifulSoup tika pielietots tīmekļa lapu satura iegūšanai,
Tesseract OCR — teksta atpazīšanai reklāmas attēlos, bet pandas — iegūto datu
strukturēšanai un analīzei. Praktiskā testēšana tika veikta, apstrādājot reklāmas
materiālus no divām lielām mazumtirdzniecības ķēdēm (Maxima un Lidl), lai novērtētu
risinājuma veiktspēju reālos apstākļos. Iegūtie rezultāti apliecināja risinājuma augstu
efektivitāti: teksta atpazīšanas precizitāte sasniedza aptuveni 90 - 95%, un sistēma spēja
pielāgoties atšķirīgiem baneru dizainiem un formātiem. Analīzes gaitā iegūtie
strukturētie dati (piemēram, produktu nosaukumi, cenas, atlaižu procenti) atbilda
oriģinālajos reklāmas materiālos norādītajai informācijai, apstiprinot risinājuma
uzticamību. Darba rezultāti apliecina, ka digitālo reklāmu automatizēta analīze ir
efektīvs veids, kā iegūt konkurētspējīgus ieskatus mārketinga stratēģiju pilnveidei.
Bakalaura darbs sastāv no 54 lappusēm, 9 attēliem, un 51 literatūras avota. |
| Keywords |
tīmekļa skrāpēšana, digitālā reklāma, OCR, datu analīze |
| Keywords in English |
web scraping, digital advertising, OCR, data analysis |
| Language |
lv |
| Year |
2025 |
| Date and time of uploading |
27.05.2025 23:40:44 |