Graduate papers
  
Description of the graduate paper
Form of studies Master
Title of the study programm Digital Humanities
Title in original language Digitālo kolekciju ģeotelpisko datu izguve un analīze: Autobiogrāfiju krājuma gadījuma izpēte
Title in English Acquisition and Analysis of Geospatial Data from Digital Collections: Case Study of Autobiography Collection
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Sanita Bērziņa-Reinsone
Reviewer Gints Jēkabsons
Abstract Viestura Vēvera izstrādātais maģistra darbs “Digitālo kolekciju ģeotelpisko datu izguve un analīze: Autobiogrāfiju krājuma gadījuma izpēte” ir pētījums, kurš balstīts telpu analizējošajā digitālo humanitāro zinātņu apakšvirzienā (spatial humanities) un dabiskās valodas apstrādē. Pētījuma galvenais mērķis ir piedāvāt metodi, kā no digitālajām tekstu kolekcijām izgūt vietu nosaukumus kā specifisku ģeotelpisko datu formu un analizēt iegūto informāciju. Kā analīzes piemērs ir izvēlēts Latvijas Folkloras arhīva Autobiogrāfiju krājums Latvijas Universitātes Literatūras, folkloras un mākslas institūtā. Maģistra darbu veido četras nodaļas, no kurām otrajā identificētas galvenās teorētiskās pieejas un mērķa sasniegšanai svarīgākie izstrādāto algoritmu veidi, kā arī sniegti to pielietošanas piemēri humanitārajās zinātnēs. Trešajā nodaļā atspoguļots patstāvīgi veiktais eksperiments un tajā iegūtie rezultāti. Svarīgākie secinājumi un turpmākās pētījuma paplašināšanas virzieni apkopoti ceturtajā, noslēdzošajā nodaļā. Nozīmīgākais pētījuma ieguldījums ir ilustrācija, kā digitālo humanitāro zinātņu pārstāvji var pārbaudīt un pielietot vienkāršus, bet efektīvus jaunāko paaudžu mašīnmācīšanās algoritmus, ja tie pieejami jau adaptētā veidā. Īstenotie eksperimenti norādīja, ka nosaukto entītiju atpazīšana var tikt piemērota arī stilistiski sarežģītiem tekstiem no kultūras mantojumam piederīgām kolekcijām latviešu valodā. Nostiprinātu, papildinātu un precizētu rezultātu turpmāka pielietojuma iespējas ietver ģeokodēšanu, iegūto vietvārdu sarakstu izmantošanu telpas veidošanas prakšu izpētē, Autobiogrāfiju krājuma metadatu papildināšanai, zināšanu bāzes papildināšanai, kā arī jaunu resursu – vietu indeksu un algoritmu apmācībām izmantojamu datu kopu – veidošanai. Maģistra darbu veido 93 lappuses, un tā apjoms ir 33 817 vārdu. Darbā izmantotas 106 atsauces. Pētījumam ir astoņi pielikumi.
Keywords telpu pētošās digitālās humanitārās zinātnes; dabiskā valodas apstrāde; lielie valoda modeļi; nosaukto entītiju atpazīšana; telpa un vieta.
Keywords in English Spatial Humanities; Natural Language Processing; Language Models; Named Entity Recognition; place and space.
Language eng
Year 2024
Date and time of uploading 27.05.2024 10:59:05