Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Datorsistēmas |
Nosaukums |
Informācijas izgūšanas metožu un rīku lietojums automatizētai informācijas apkopošanai |
Nosaukums angļu valodā |
Information Retrieval Methods and Tools for Automated Content Gathering |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
P.Rudzājs |
Recenzents |
R.Rollande, Ventspils augstskolas lektore |
Anotācija |
Bakalaura darbā ir pētītas informācijas izgūšanas metodes, rīki un modeļi, kā arī to pielietojums informācijas apkopošanā. Informācijas izgūšanā pastāv dažādi veidi, piemēram, manuāla izgūšana, izgūšana no datubāzes, izgūšana ar tīmekļa pārmeklētājiem un izgūšana, izmantojot tīmekļa servisus. Šajā darbā tiek sīkāk pētīts, kā notiek informācijas izgūšana ar tīmekļa pārmeklētāju palīdzību un kādi algoritmi tiek pielietoti tīmekļa pārmeklētājos. Papildus tiek aprakstīti un salīdzināti tīmekļa pārmeklētāju esošie risinājumi, kā arī sīkāk tiek aplūkotas tīmekļa pārmeklētāja Apache Nutch iespējas. Balstoties uz veikto pētījumu, ir izstrādāts lietojuma projektējums automātiskai darba sludinājumu izgūšanai un apkopošanai. Praktiski ir veikta darba sludinājumu informācijas izgūšana ar Apache Nutch tīmekļa pārmeklētāju, kā arī izgūtās informācijas apstrāde, izmantojot izstrādāto faila apstrādātāju.
Darba sastāv no 65 lappusēm, 18 attēliem, 5 tabulām, 3 pielikumiem un tajā ir iekļauti 15 informācijas avoti. |
Atslēgas vārdi |
INFORMĀCIJAS IZGŪŠANA, TĪMEKĻA PĀRMEKLĒTĀJS, APACHE NUTCH |
Atslēgas vārdi angļu valodā |
INFORMATION RETRIEVAL, WEB CRAWLER, APACHE NUTCH |
Valoda |
lv |
Gads |
2014 |
Darba augšupielādes datums un laiks |
26.05.2014 16:03:07 |