Studiju veids |
maģistra akadēmiskās studijas |
Studiju programmas nosaukums |
Digitālās humanitārās zinātnes |
Nosaukums |
Digitālo kolekciju ģeotelpisko datu izguve un analīze: Autobiogrāfiju krājuma gadījuma izpēte |
Nosaukums angļu valodā |
Acquisition and Analysis of Geospatial Data from Digital Collections: Case Study of Autobiography Collection |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Sanita Bērziņa-Reinsone |
Recenzents |
Gints Jēkabsons |
Anotācija |
Viestura Vēvera izstrādātais maģistra darbs “Digitālo kolekciju ģeotelpisko datu izguve un analīze: Autobiogrāfiju krājuma gadījuma izpēte” ir pētījums, kurš balstīts telpu analizējošajā digitālo humanitāro zinātņu apakšvirzienā (spatial humanities) un dabiskās valodas apstrādē.
Pētījuma galvenais mērķis ir piedāvāt metodi, kā no digitālajām tekstu kolekcijām izgūt vietu nosaukumus kā specifisku ģeotelpisko datu formu un analizēt iegūto informāciju. Kā analīzes piemērs ir izvēlēts Latvijas Folkloras arhīva Autobiogrāfiju krājums Latvijas Universitātes Literatūras, folkloras un mākslas institūtā.
Maģistra darbu veido četras nodaļas, no kurām otrajā identificētas galvenās teorētiskās pieejas un mērķa sasniegšanai svarīgākie izstrādāto algoritmu veidi, kā arī sniegti to pielietošanas piemēri humanitārajās zinātnēs. Trešajā nodaļā atspoguļots patstāvīgi veiktais eksperiments un tajā iegūtie rezultāti. Svarīgākie secinājumi un turpmākās pētījuma paplašināšanas virzieni apkopoti ceturtajā, noslēdzošajā nodaļā.
Nozīmīgākais pētījuma ieguldījums ir ilustrācija, kā digitālo humanitāro zinātņu pārstāvji var pārbaudīt un pielietot vienkāršus, bet efektīvus jaunāko paaudžu mašīnmācīšanās algoritmus, ja tie pieejami jau adaptētā veidā. Īstenotie eksperimenti norādīja, ka nosaukto entītiju atpazīšana var tikt piemērota arī stilistiski sarežģītiem tekstiem no kultūras mantojumam piederīgām kolekcijām latviešu valodā.
Nostiprinātu, papildinātu un precizētu rezultātu turpmāka pielietojuma iespējas ietver ģeokodēšanu, iegūto vietvārdu sarakstu izmantošanu telpas veidošanas prakšu izpētē, Autobiogrāfiju krājuma metadatu papildināšanai, zināšanu bāzes papildināšanai, kā arī jaunu resursu – vietu indeksu un algoritmu apmācībām izmantojamu datu kopu – veidošanai.
Maģistra darbu veido 93 lappuses, un tā apjoms ir 33 817 vārdu. Darbā izmantotas 106 atsauces. Pētījumam ir astoņi pielikumi. |
Atslēgas vārdi |
telpu pētošās digitālās humanitārās zinātnes; dabiskā valodas apstrāde; lielie valoda modeļi; nosaukto entītiju atpazīšana; telpa un vieta. |
Atslēgas vārdi angļu valodā |
Spatial Humanities; Natural Language Processing; Language Models; Named Entity Recognition; place and space. |
Valoda |
eng |
Gads |
2024 |
Darba augšupielādes datums un laiks |
27.05.2024 10:59:05 |