Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Adaptīvu tīmekļa rasmošanas metožu izpēte datu iegūšanai no dažādām tīmekļa vietnēm |
Nosaukums angļu valodā |
Evaluation of Adaptive Web Scraping Methods for Extracting Data from Various Websites |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Guntis Mosāns |
Recenzents |
Rihards Vītols |
Anotācija |
Internetā pieejamie dati bieži vien nav strukturētā formā, tāpēc rodas nepieciešamība pēc efektīviem tīmekļa rasmošanas rīkiem. Tomēr lielākā daļa no esošajiem rīkiem tiek izstrādāti specifiski katram tīmekļa resursam, kas ir laikietilpīgs un neelastīgs process, turklāt tie ir jutīgi pret mājaslapas struktūras izmaiņām, radot problēmas ar rīka efektivitāti un datu uzticamību. Lai risinātu šo problēmu, tika izpētītas adaptīvas tīmekļa rasmošanas metodes, kas spēj automātiski pielāgoties dažādu mājaslapu struktūrām un to izmaiņām. Pamatojoties uz šīm metodēm tika izstrādāta AdaptiCrawl rasmošanas metode, kas iegūst specifiskas atribūtu vērtības no dažādiem tīmekļa resursiem ar līdzīgu saturu. Bakalaura darba ietvaros tika izstrādāta AdaptiCrawl metodes implementācija, lai iegūtu ieskatu par Baltijas lietoto automašīnu tirgu un tā tendencēm laika gaitā. Rasmotāja ievākto datu apakškopa tika analizēta, lai novērtētu rīka precizitāti un jutīgumu, kā arī tā efektivitāti laika gaitā.
Darba apjoms: 73 lappuses, 20 attēli, 0 tabulas, 10 pielikumi un 26 izmantotie avoti. |
Atslēgas vārdi |
Rasmošana, Adaptīva rasmošana, Datu ieguve, AdaptiCrawl |
Atslēgas vārdi angļu valodā |
Scraping, Adaptive Scraping, Data mining, AdaptiCrawl |
Valoda |
lv |
Gads |
2024 |
Darba augšupielādes datums un laiks |
28.05.2024 23:56:44 |