Studiju veids |
maģistra akadēmiskās studijas |
Studiju programmas nosaukums |
Datorsistēmas |
Nosaukums |
Tekstveida datu ģeoparsēšanas optimizēšana, izmantojot ģenētisko algoritmu |
Nosaukums angļu valodā |
Optimization of Textual Data Geoparsing Using Genetic Algorithm |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Vad.pētnieks G.Jēkabsons, Dr.sc.ing. |
Recenzents |
L.Novickis, Dr.hab.sc.ing., LDP prof. grupas profesors |
Anotācija |
Tekstveida datu ģeogrāfiskā konteksta analīze un izgūšana ir viens no veidiem, kā informācijas grupēšanu, filtrēšanu un meklēšanu mūsdienu pārpildītājā internettelpā padarīt vienkāršāku un efektīvāku. Tekstveida datu ģeoparsēšanas sistēma analizē nestrukturizētu tekstu un piesaista tam vai tā vārdiem ģeogrāfiskus identifikatorus, tālākai to izmantošanai uz atrašanās vietu balstītos servisos un ģeogrāfiskās informācijas sistēmās.
Maģistra darba gaitā ir izstrādāta ģeoparsēšanas metodoloģija, kas nav atkarīga no konkrētas teksta valodas un ir spējīga strādāt ar tekstveida datiem visās Eiropas saimes valodās. Izstrādātajā metodoloģijā ir integrēta automātiska vietvārdu kārtošanas koeficientu vērtību optimizēšana, izmantojot Ģenētisko algoritmu, tādā veidā ļaujot ģeoparsēšanas sistēmai efektīvi adaptēties darbam ar dažādu valodu, dažādu ģeogrāfisko mērogu un dažādu nozaru tekstveida datiem.
Izstrādāta metodoloģija tika realizēta programmatūrā, ar kuru tika veikti ģeoparsēšanas eksperimenti vietvārdu kārtošanas svara koeficentu optimizēšanā, iegūstot optimizēšanas procesa un pielietoto ģenētisko operatoru efektivitātes novērtējumu. Eksperimentu rezultāti parādīja, ka Ģenētiskais algoritms ir spējīgs sasniegt rezultātus, kas ir līdzīgi vai pat labāki nekā rezultāti, kas iegūti ar cilvēka-eksperta noteiktajām kārtošanas koeficientu vērtībām.
Izstrādātā metodoloģija ir pielietojama ģeoparsēšanas iespēju integrēšanai uz atrašanās vietu balstītos servisos un ģeogrāfiskās informācijas sistēmās, kā arī var kalpot par pamatu, izstrādājot jaunas ģeoparsēšanas sistēmas.
Maģistra darbs satur ievadu, 4 nodaļas, nobeigumu, literatūras sarakstu (53 nosaukumi), 13 attēlus, 8 tabulas, kopā 63 lappuses. |
Atslēgas vārdi |
ģeoparsēšana, ģeogrāfiskas informācijas izgūšana, ģenētiskais algoritms, dabīgās valodas apstrāde |
Atslēgas vārdi angļu valodā |
geoparsing, geographic information retrieval, genetic algorithm, natural language processing |
Valoda |
lv |
Gads |
2013 |
Darba augšupielādes datums un laiks |
02.06.2013 13:29:39 |