Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Information Technology
Title in original language Adaptīvu tīmekļa rasmošanas metožu izpēte datu iegūšanai no dažādām tīmekļa vietnēm
Title in English Evaluation of Adaptive Web Scraping Methods for Extracting Data from Various Websites
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Guntis Mosāns
Reviewer Rihards Vītols
Abstract Internetā pieejamie dati bieži vien nav strukturētā formā, tāpēc rodas nepieciešamība pēc efektīviem tīmekļa rasmošanas rīkiem. Tomēr lielākā daļa no esošajiem rīkiem tiek izstrādāti specifiski katram tīmekļa resursam, kas ir laikietilpīgs un neelastīgs process, turklāt tie ir jutīgi pret mājaslapas struktūras izmaiņām, radot problēmas ar rīka efektivitāti un datu uzticamību. Lai risinātu šo problēmu, tika izpētītas adaptīvas tīmekļa rasmošanas metodes, kas spēj automātiski pielāgoties dažādu mājaslapu struktūrām un to izmaiņām. Pamatojoties uz šīm metodēm tika izstrādāta AdaptiCrawl rasmošanas metode, kas iegūst specifiskas atribūtu vērtības no dažādiem tīmekļa resursiem ar līdzīgu saturu. Bakalaura darba ietvaros tika izstrādāta AdaptiCrawl metodes implementācija, lai iegūtu ieskatu par Baltijas lietoto automašīnu tirgu un tā tendencēm laika gaitā. Rasmotāja ievākto datu apakškopa tika analizēta, lai novērtētu rīka precizitāti un jutīgumu, kā arī tā efektivitāti laika gaitā. Darba apjoms: 73 lappuses, 20 attēli, 0 tabulas, 10 pielikumi un 26 izmantotie avoti.
Keywords Rasmošana, Adaptīva rasmošana, Datu ieguve, AdaptiCrawl
Keywords in English Scraping, Adaptive Scraping, Data mining, AdaptiCrawl
Language lv
Year 2024
Date and time of uploading 28.05.2024 23:56:44