Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Computer Systems
Title in original language Informācijas izgūšanas metožu un rīku lietojums automatizētai informācijas apkopošanai
Title in English Information Retrieval Methods and Tools for Automated Content Gathering
Department 12300 Institute of Applied Computer Systems
Scientific advisor P.Rudzājs
Reviewer R.Rollande, Ventspils augstskolas lektore
Abstract Bakalaura darbā ir pētītas informācijas izgūšanas metodes, rīki un modeļi, kā arī to pielietojums informācijas apkopošanā. Informācijas izgūšanā pastāv dažādi veidi, piemēram, manuāla izgūšana, izgūšana no datubāzes, izgūšana ar tīmekļa pārmeklētājiem un izgūšana, izmantojot tīmekļa servisus. Šajā darbā tiek sīkāk pētīts, kā notiek informācijas izgūšana ar tīmekļa pārmeklētāju palīdzību un kādi algoritmi tiek pielietoti tīmekļa pārmeklētājos. Papildus tiek aprakstīti un salīdzināti tīmekļa pārmeklētāju esošie risinājumi, kā arī sīkāk tiek aplūkotas tīmekļa pārmeklētāja Apache Nutch iespējas. Balstoties uz veikto pētījumu, ir izstrādāts lietojuma projektējums automātiskai darba sludinājumu izgūšanai un apkopošanai. Praktiski ir veikta darba sludinājumu informācijas izgūšana ar Apache Nutch tīmekļa pārmeklētāju, kā arī izgūtās informācijas apstrāde, izmantojot izstrādāto faila apstrādātāju. Darba sastāv no 65 lappusēm, 18 attēliem, 5 tabulām, 3 pielikumiem un tajā ir iekļauti 15 informācijas avoti.
Keywords INFORMĀCIJAS IZGŪŠANA, TĪMEKĻA PĀRMEKLĒTĀJS, APACHE NUTCH
Keywords in English INFORMATION RETRIEVAL, WEB CRAWLER, APACHE NUTCH
Language lv
Year 2014
Date and time of uploading 26.05.2014 16:03:07