Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Computer Systems
Title in original language Trie un hešēšanas datu struktūru salīdzinošā analīze ātrai teksta apstrādei
Title in English Comparative Analysis of Trie and Hashing Data Structures for Fast Text Processing
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Aleksejs Jurenoks
Reviewer Ēriks Kļaviņš
Abstract Bakalaura darbs pēta Trie un hešēšanas tabulu datu struktūras, lai noteiktu to efektivitāti reāllaika teksta apstrādes sistēmās. Darba mērķis ir veikt šo datu struktūru analīzi un izstrādāt metodiku to optimālai izmantošanai, ņemot vērā pieaugošo teksta datu apjomu un nepieciešamību pēc ātras informācijas apstrādes. Pētījumā tika veikta teorētiskā analīze, izstrādāti veiktspējas salīdzināšanas kritēriji un veikti eksperimenti, izmantojot dažādas Trie un hešēšanas tabulu implementācijas ar divu veidu datu kopām: nejauši ģenerētām virknēm un reāliem teksta datiem. Pēc eksperimentālo rezultātu iegūšanas tika secināts, ka Robin Hood hešēšanas tabula nodrošināja vislabāko kopējo veiktspēju un stabilitāti attiecībā uz ievietošanas un meklēšanas ātrumu dažādos scenārijos, īpaši ar nejauši ģenerētiem datiem. Trie uzrādīja labu meklēšanas ātrumu dabiskās valodas datos ar biežiem priedēkļiem un efektīvu atmiņas izmantošanu šādos gadījumos. Tika secināts, ka datu struktūras izvēle ir būtiski atkarīga no datu rakstura un specifiskajām operāciju prasībām. Trie struktūras ir pārākas uzdevumos, kas saistīti ar priedēkļu meklēšanu un alfabētiski sakārtotu datu piekļuvi, kamēr hešēšanas tabulas parasti ir ātrākas precīzas atbilstības meklēšanā. Darba rezultātā tika sniegtas rekomendācijas datu struktūru izvēlei: Robin Hood hešēšanas tabula ieteicama vispārīgiem reāllaika lietojumiem, bet Cedar Trie – teksta indeksēšanas un meklēšanas sistēmām, kas strādā ar dabiskās valodas datiem.
Keywords Trie, hešēšanas tabulas, teksta apstrāde, datu struktūras, veiktspējas analīze, reāllaika sistēmas.
Keywords in English trie, hash tables, text processing, data structures, performance analysis, real-time systems.
Language lv
Year 2025
Date and time of uploading 26.05.2025 18:58:04