Form of studies |
Bachelor |
Title of the study programm |
Computer Systems |
Title in original language |
Metožu salīdzinājums daudzvalodu semantiskajā meklēšanā |
Title in English |
Comparison of Methods for Multilingual Semantic Search |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Gints Jēkabsons |
Reviewer |
Ainārs Auziņš |
Abstract |
Bakalaura darbā ir izpētītas un salīdzinātas dažādas metodes daudzvalodu semantiskajai meklēšanai ar mērķi identificēt efektīvākos veidus informācijas izguvei latviešu un angļu valodas pārī. Bakalaura darbs ir motivēts ar to, ka zinātniskajā vidē trūkst publicētu pētījumu par semantisko meklēšanu latviešu valodas kontekstā.
Darbs apraksta klasiskās meklēšanas pieejas, definē tās galveno problēmu un fokusējas uz valodas modeļiem un to ģenerētām jēdzientelpām, kas ļauj informācijas sistēmām saprast cilvēka valodu tuvāk tam kā to saprot cilvēki. Darbā tiek izpētīta un aprakstīta teorija par vienvalodas valodas modeļu pirmsākumiem un daudzvalodu valodas modeļu veidiem. Tiek apskatīti un apkopoti eksistējošie pētījumi, kas veic vairāku daudzvalodu valodas modeļu salīdzinājumu dažādos uzdevumos.
Darbā tika izveidota datu kopa no 77736 rakstu pāriem no latviešu un angļu Vikipēdijām. Tika semantiski indeksēti raksti angļu valodā, bet meklēšana tika veikta latviešu valodā. Iegūtie rezultāti ir salīdzināti un ir noteikts efektīvākais semantiskās meklēšanas veids latviešu un angļu valodas pārī.
Darbā ir 68 lapas, 23 attēli, 18 tabulas, 104 informācijas avoti un 12 pielikumi. |
Keywords |
Semantiskā meklēšana, daudzvalodu meklēšana, valodas modelis, jēdzientelpas, informācijas izguve |
Keywords in English |
Semantic search, multilingual search, language model, embeddings, information retrieval. |
Language |
lv |
Year |
2024 |
Date and time of uploading |
28.05.2024 19:16:58 |