Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Datorsistēmas
Nosaukums Metožu salīdzinājums daudzvalodu semantiskajā meklēšanā
Nosaukums angļu valodā Comparison of Methods for Multilingual Semantic Search
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Gints Jēkabsons
Recenzents Ainārs Auziņš
Anotācija Bakalaura darbā ir izpētītas un salīdzinātas dažādas metodes daudzvalodu semantiskajai meklēšanai ar mērķi identificēt efektīvākos veidus informācijas izguvei latviešu un angļu valodas pārī. Bakalaura darbs ir motivēts ar to, ka zinātniskajā vidē trūkst publicētu pētījumu par semantisko meklēšanu latviešu valodas kontekstā. Darbs apraksta klasiskās meklēšanas pieejas, definē tās galveno problēmu un fokusējas uz valodas modeļiem un to ģenerētām jēdzientelpām, kas ļauj informācijas sistēmām saprast cilvēka valodu tuvāk tam kā to saprot cilvēki. Darbā tiek izpētīta un aprakstīta teorija par vienvalodas valodas modeļu pirmsākumiem un daudzvalodu valodas modeļu veidiem. Tiek apskatīti un apkopoti eksistējošie pētījumi, kas veic vairāku daudzvalodu valodas modeļu salīdzinājumu dažādos uzdevumos. Darbā tika izveidota datu kopa no 77736 rakstu pāriem no latviešu un angļu Vikipēdijām. Tika semantiski indeksēti raksti angļu valodā, bet meklēšana tika veikta latviešu valodā. Iegūtie rezultāti ir salīdzināti un ir noteikts efektīvākais semantiskās meklēšanas veids latviešu un angļu valodas pārī. Darbā ir 68 lapas, 23 attēli, 18 tabulas, 104 informācijas avoti un 12 pielikumi.
Atslēgas vārdi Semantiskā meklēšana, daudzvalodu meklēšana, valodas modelis, jēdzientelpas, informācijas izguve
Atslēgas vārdi angļu valodā Semantic search, multilingual search, language model, embeddings, information retrieval.
Valoda lv
Gads 2024
Darba augšupielādes datums un laiks 28.05.2024 19:16:58