| Studiju veids |
bakalaura akadēmiskās studijas |
| Studiju programmas nosaukums |
Datorsistēmas |
| Nosaukums |
Trie un hešēšanas datu struktūru salīdzinošā analīze ātrai teksta apstrādei |
| Nosaukums angļu valodā |
Comparative Analysis of Trie and Hashing Data Structures for Fast Text Processing |
| Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
| Darba vadītājs |
Aleksejs Jurenoks |
| Recenzents |
Ēriks Kļaviņš |
| Anotācija |
Bakalaura darbs pēta Trie un hešēšanas tabulu datu struktūras, lai noteiktu to efektivitāti reāllaika teksta apstrādes sistēmās. Darba mērķis ir veikt šo datu struktūru analīzi un izstrādāt metodiku to optimālai izmantošanai, ņemot vērā pieaugošo teksta datu apjomu un nepieciešamību pēc ātras informācijas apstrādes. Pētījumā tika veikta teorētiskā analīze, izstrādāti veiktspējas salīdzināšanas kritēriji un veikti eksperimenti, izmantojot dažādas Trie un hešēšanas tabulu implementācijas ar divu veidu datu kopām: nejauši ģenerētām virknēm un reāliem teksta datiem.
Pēc eksperimentālo rezultātu iegūšanas tika secināts, ka Robin Hood hešēšanas tabula nodrošināja vislabāko kopējo veiktspēju un stabilitāti attiecībā uz ievietošanas un meklēšanas ātrumu dažādos scenārijos, īpaši ar nejauši ģenerētiem datiem. Trie uzrādīja labu meklēšanas ātrumu dabiskās valodas datos ar biežiem priedēkļiem un efektīvu atmiņas izmantošanu šādos gadījumos. Tika secināts, ka datu struktūras izvēle ir būtiski atkarīga no datu rakstura un specifiskajām operāciju prasībām. Trie struktūras ir pārākas uzdevumos, kas saistīti ar priedēkļu meklēšanu un alfabētiski sakārtotu datu piekļuvi, kamēr hešēšanas tabulas parasti ir ātrākas precīzas atbilstības meklēšanā. Darba rezultātā tika sniegtas rekomendācijas datu struktūru izvēlei: Robin Hood hešēšanas tabula ieteicama vispārīgiem reāllaika lietojumiem, bet Cedar Trie – teksta indeksēšanas un meklēšanas sistēmām, kas strādā ar dabiskās valodas datiem. |
| Atslēgas vārdi |
Trie, hešēšanas tabulas, teksta apstrāde, datu struktūras, veiktspējas analīze, reāllaika sistēmas. |
| Atslēgas vārdi angļu valodā |
trie, hash tables, text processing, data structures, performance analysis, real-time systems. |
| Valoda |
lv |
| Gads |
2025 |
| Darba augšupielādes datums un laiks |
26.05.2025 18:58:04 |