Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids maģistra akadēmiskās studijas
Studiju programmas nosaukums Datorsistēmas
Nosaukums Tekstveida datu ģeoparsēšanas optimizēšana, izmantojot ģenētisko algoritmu
Nosaukums angļu valodā Optimization of Textual Data Geoparsing Using Genetic Algorithm
Struktūrvienība 12300 Lietišķo datorsistēmu institūts
Darba vadītājs Vad.pētnieks G.Jēkabsons, Dr.sc.ing.
Recenzents L.Novickis, Dr.hab.sc.ing., LDP prof. grupas profesors
Anotācija Tekstveida datu ģeogrāfiskā konteksta analīze un izgūšana ir viens no veidiem, kā informācijas grupēšanu, filtrēšanu un meklēšanu mūsdienu pārpildītājā internettelpā padarīt vienkāršāku un efektīvāku. Tekstveida datu ģeoparsēšanas sistēma analizē nestrukturizētu tekstu un piesaista tam vai tā vārdiem ģeogrāfiskus identifikatorus, tālākai to izmantošanai uz atrašanās vietu balstītos servisos un ģeogrāfiskās informācijas sistēmās. Maģistra darba gaitā ir izstrādāta ģeoparsēšanas metodoloģija, kas nav atkarīga no konkrētas teksta valodas un ir spējīga strādāt ar tekstveida datiem visās Eiropas saimes valodās. Izstrādātajā metodoloģijā ir integrēta automātiska vietvārdu kārtošanas koeficientu vērtību optimizēšana, izmantojot Ģenētisko algoritmu, tādā veidā ļaujot ģeoparsēšanas sistēmai efektīvi adaptēties darbam ar dažādu valodu, dažādu ģeogrāfisko mērogu un dažādu nozaru tekstveida datiem. Izstrādāta metodoloģija tika realizēta programmatūrā, ar kuru tika veikti ģeoparsēšanas eksperimenti vietvārdu kārtošanas svara koeficentu optimizēšanā, iegūstot optimizēšanas procesa un pielietoto ģenētisko operatoru efektivitātes novērtējumu. Eksperimentu rezultāti parādīja, ka Ģenētiskais algoritms ir spējīgs sasniegt rezultātus, kas ir līdzīgi vai pat labāki nekā rezultāti, kas iegūti ar cilvēka-eksperta noteiktajām kārtošanas koeficientu vērtībām. Izstrādātā metodoloģija ir pielietojama ģeoparsēšanas iespēju integrēšanai uz atrašanās vietu balstītos servisos un ģeogrāfiskās informācijas sistēmās, kā arī var kalpot par pamatu, izstrādājot jaunas ģeoparsēšanas sistēmas. Maģistra darbs satur ievadu, 4 nodaļas, nobeigumu, literatūras sarakstu (53 nosaukumi), 13 attēlus, 8 tabulas, kopā 63 lappuses.
Atslēgas vārdi ģeoparsēšana, ģeogrāfiskas informācijas izgūšana, ģenētiskais algoritms, dabīgās valodas apstrāde
Atslēgas vārdi angļu valodā geoparsing, geographic information retrieval, genetic algorithm, natural language processing
Valoda lv
Gads 2013
Darba augšupielādes datums un laiks 02.06.2013 13:29:39