Form of studies |
Bachelor |
Title of the study programm |
Information Technology |
Title in original language |
Adaptīvu tīmekļa rasmošanas metožu izpēte datu iegūšanai no dažādām tīmekļa vietnēm |
Title in English |
Evaluation of Adaptive Web Scraping Methods for Extracting Data from Various Websites |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Guntis Mosāns |
Reviewer |
Rihards Vītols |
Abstract |
Internetā pieejamie dati bieži vien nav strukturētā formā, tāpēc rodas nepieciešamība pēc efektīviem tīmekļa rasmošanas rīkiem. Tomēr lielākā daļa no esošajiem rīkiem tiek izstrādāti specifiski katram tīmekļa resursam, kas ir laikietilpīgs un neelastīgs process, turklāt tie ir jutīgi pret mājaslapas struktūras izmaiņām, radot problēmas ar rīka efektivitāti un datu uzticamību. Lai risinātu šo problēmu, tika izpētītas adaptīvas tīmekļa rasmošanas metodes, kas spēj automātiski pielāgoties dažādu mājaslapu struktūrām un to izmaiņām. Pamatojoties uz šīm metodēm tika izstrādāta AdaptiCrawl rasmošanas metode, kas iegūst specifiskas atribūtu vērtības no dažādiem tīmekļa resursiem ar līdzīgu saturu. Bakalaura darba ietvaros tika izstrādāta AdaptiCrawl metodes implementācija, lai iegūtu ieskatu par Baltijas lietoto automašīnu tirgu un tā tendencēm laika gaitā. Rasmotāja ievākto datu apakškopa tika analizēta, lai novērtētu rīka precizitāti un jutīgumu, kā arī tā efektivitāti laika gaitā.
Darba apjoms: 73 lappuses, 20 attēli, 0 tabulas, 10 pielikumi un 26 izmantotie avoti. |
Keywords |
Rasmošana, Adaptīva rasmošana, Datu ieguve, AdaptiCrawl |
Keywords in English |
Scraping, Adaptive Scraping, Data mining, AdaptiCrawl |
Language |
lv |
Year |
2024 |
Date and time of uploading |
28.05.2024 23:56:44 |