Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids maģistra akadēmiskās studijas
Studiju programmas nosaukums Digitālās humanitārās zinātnes
Nosaukums Digitālo kolekciju ģeotelpisko datu izguve un analīze: Autobiogrāfiju krājuma gadījuma izpēte
Nosaukums angļu valodā Acquisition and Analysis of Geospatial Data from Digital Collections: Case Study of Autobiography Collection
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Sanita Bērziņa-Reinsone
Recenzents Gints Jēkabsons
Anotācija Viestura Vēvera izstrādātais maģistra darbs “Digitālo kolekciju ģeotelpisko datu izguve un analīze: Autobiogrāfiju krājuma gadījuma izpēte” ir pētījums, kurš balstīts telpu analizējošajā digitālo humanitāro zinātņu apakšvirzienā (spatial humanities) un dabiskās valodas apstrādē. Pētījuma galvenais mērķis ir piedāvāt metodi, kā no digitālajām tekstu kolekcijām izgūt vietu nosaukumus kā specifisku ģeotelpisko datu formu un analizēt iegūto informāciju. Kā analīzes piemērs ir izvēlēts Latvijas Folkloras arhīva Autobiogrāfiju krājums Latvijas Universitātes Literatūras, folkloras un mākslas institūtā. Maģistra darbu veido četras nodaļas, no kurām otrajā identificētas galvenās teorētiskās pieejas un mērķa sasniegšanai svarīgākie izstrādāto algoritmu veidi, kā arī sniegti to pielietošanas piemēri humanitārajās zinātnēs. Trešajā nodaļā atspoguļots patstāvīgi veiktais eksperiments un tajā iegūtie rezultāti. Svarīgākie secinājumi un turpmākās pētījuma paplašināšanas virzieni apkopoti ceturtajā, noslēdzošajā nodaļā. Nozīmīgākais pētījuma ieguldījums ir ilustrācija, kā digitālo humanitāro zinātņu pārstāvji var pārbaudīt un pielietot vienkāršus, bet efektīvus jaunāko paaudžu mašīnmācīšanās algoritmus, ja tie pieejami jau adaptētā veidā. Īstenotie eksperimenti norādīja, ka nosaukto entītiju atpazīšana var tikt piemērota arī stilistiski sarežģītiem tekstiem no kultūras mantojumam piederīgām kolekcijām latviešu valodā. Nostiprinātu, papildinātu un precizētu rezultātu turpmāka pielietojuma iespējas ietver ģeokodēšanu, iegūto vietvārdu sarakstu izmantošanu telpas veidošanas prakšu izpētē, Autobiogrāfiju krājuma metadatu papildināšanai, zināšanu bāzes papildināšanai, kā arī jaunu resursu – vietu indeksu un algoritmu apmācībām izmantojamu datu kopu – veidošanai. Maģistra darbu veido 93 lappuses, un tā apjoms ir 33 817 vārdu. Darbā izmantotas 106 atsauces. Pētījumam ir astoņi pielikumi.
Atslēgas vārdi telpu pētošās digitālās humanitārās zinātnes; dabiskā valodas apstrāde; lielie valoda modeļi; nosaukto entītiju atpazīšana; telpa un vieta.
Atslēgas vārdi angļu valodā Spatial Humanities; Natural Language Processing; Language Models; Named Entity Recognition; place and space.
Valoda eng
Gads 2024
Darba augšupielādes datums un laiks 27.05.2024 10:59:05