Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Datorsistēmas
Nosaukums Izglītības informāciju saturošu dokumentu izgūšana un integrācija EduMon portālā
Nosaukums angļu valodā Educational Information Retrieval and Integration in EduMon portal
Autors Rinalds Vīksna
Struktūrvienība 12300 Lietišķo datorsistēmu institūts
Darba vadītājs P.Rudzājs
Recenzents R.Rollande, Ventspils Augstskolas IT fakultātes docente
Anotācija Bakalaura darbā ir pētītas informācijas izgūšanas metodes, modeļi un rīki. Padziļināti ir izpētītas tīmekļa rāpuļprogrammas un to darbības principi. Detalizēti izpētīta rāpuļprogramma Apache Nutch. Darbā apskatītas Latvijas universitāšu tīmekļa vietnes ar mērķi noskaidrot iespējas automatizēti izgūt studiju kursu aprakstus saturošās tīmekļa lapas. EduMON portāls (www.edumon.eu) ir sistēma, kas veic izglītības piedāvājuma un pieprasījuma monitoringu, tādēļ ir svarīgi, lai tai būtu pieejama pēc iespējas jaunāka informācija. Lai risinātu šo jautājumu, balstoties uz veikto pētījumu, ir izveidota programmatūra automatizētai studiju kursu informāciju saturošu dokumentu izgūšanai. Izveidotais informācijas izgūšanas programmatūras prototips veic arī izgūtās informācijas strukturēšanu, t.i. dokumenta struktūras identificēšanu, lai nodrošinātu tikai EduMON portālam nozīmīgas informācijas iegūšanu. Darba gaitā tika veikts arī projektējums informācijas izgūšanas programmatūras integrēšanai EduMON portālā. Darba pamattekstā ir 58 lappuses, 19 attēli, 3 tabulas, 19 nosaukumu informācijas avoti un 3 pielikumi.
Atslēgas vārdi INFORMĀCIJAS IZGŪŠANA, APACHE NUTCH, TĪMEKĻA RĀPUĻPROGRAMMA, EduMON
Atslēgas vārdi angļu valodā INFORMATION RETRIEVAL, APACHE NUTCH, CRAWLER, EduMON
Valoda lv
Gads 2016
Darba augšupielādes datums un laiks 28.05.2016 18:25:39