Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Computer Systems
Title in original language Izglītības informāciju saturošu dokumentu izgūšana un integrācija EduMon portālā
Title in English Educational Information Retrieval and Integration in EduMon portal
Author Rinalds Vīksna
Department 12300 Institute of Applied Computer Systems
Scientific advisor P.Rudzājs
Reviewer R.Rollande, Ventspils Augstskolas IT fakultātes docente
Abstract Bakalaura darbā ir pētītas informācijas izgūšanas metodes, modeļi un rīki. Padziļināti ir izpētītas tīmekļa rāpuļprogrammas un to darbības principi. Detalizēti izpētīta rāpuļprogramma Apache Nutch. Darbā apskatītas Latvijas universitāšu tīmekļa vietnes ar mērķi noskaidrot iespējas automatizēti izgūt studiju kursu aprakstus saturošās tīmekļa lapas. EduMON portāls (www.edumon.eu) ir sistēma, kas veic izglītības piedāvājuma un pieprasījuma monitoringu, tādēļ ir svarīgi, lai tai būtu pieejama pēc iespējas jaunāka informācija. Lai risinātu šo jautājumu, balstoties uz veikto pētījumu, ir izveidota programmatūra automatizētai studiju kursu informāciju saturošu dokumentu izgūšanai. Izveidotais informācijas izgūšanas programmatūras prototips veic arī izgūtās informācijas strukturēšanu, t.i. dokumenta struktūras identificēšanu, lai nodrošinātu tikai EduMON portālam nozīmīgas informācijas iegūšanu. Darba gaitā tika veikts arī projektējums informācijas izgūšanas programmatūras integrēšanai EduMON portālā. Darba pamattekstā ir 58 lappuses, 19 attēli, 3 tabulas, 19 nosaukumu informācijas avoti un 3 pielikumi.
Keywords INFORMĀCIJAS IZGŪŠANA, APACHE NUTCH, TĪMEKĻA RĀPUĻPROGRAMMA, EduMON
Keywords in English INFORMATION RETRIEVAL, APACHE NUTCH, CRAWLER, EduMON
Language lv
Year 2016
Date and time of uploading 28.05.2016 18:25:39