Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Adaptīvu tīmekļa rasmošanas metožu izpēte datu iegūšanai no dažādām tīmekļa vietnēm
Nosaukums angļu valodā Evaluation of Adaptive Web Scraping Methods for Extracting Data from Various Websites
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Guntis Mosāns
Recenzents Rihards Vītols
Anotācija Internetā pieejamie dati bieži vien nav strukturētā formā, tāpēc rodas nepieciešamība pēc efektīviem tīmekļa rasmošanas rīkiem. Tomēr lielākā daļa no esošajiem rīkiem tiek izstrādāti specifiski katram tīmekļa resursam, kas ir laikietilpīgs un neelastīgs process, turklāt tie ir jutīgi pret mājaslapas struktūras izmaiņām, radot problēmas ar rīka efektivitāti un datu uzticamību. Lai risinātu šo problēmu, tika izpētītas adaptīvas tīmekļa rasmošanas metodes, kas spēj automātiski pielāgoties dažādu mājaslapu struktūrām un to izmaiņām. Pamatojoties uz šīm metodēm tika izstrādāta AdaptiCrawl rasmošanas metode, kas iegūst specifiskas atribūtu vērtības no dažādiem tīmekļa resursiem ar līdzīgu saturu. Bakalaura darba ietvaros tika izstrādāta AdaptiCrawl metodes implementācija, lai iegūtu ieskatu par Baltijas lietoto automašīnu tirgu un tā tendencēm laika gaitā. Rasmotāja ievākto datu apakškopa tika analizēta, lai novērtētu rīka precizitāti un jutīgumu, kā arī tā efektivitāti laika gaitā. Darba apjoms: 73 lappuses, 20 attēli, 0 tabulas, 10 pielikumi un 26 izmantotie avoti.
Atslēgas vārdi Rasmošana, Adaptīva rasmošana, Datu ieguve, AdaptiCrawl
Atslēgas vārdi angļu valodā Scraping, Adaptive Scraping, Data mining, AdaptiCrawl
Valoda lv
Gads 2024
Darba augšupielādes datums un laiks 28.05.2024 23:56:44