| Form of studies |
Bachelor |
| Title of the study programm |
Computer Systems |
| Title in original language |
Trie un hešēšanas datu struktūru salīdzinošā analīze ātrai teksta apstrādei |
| Title in English |
Comparative Analysis of Trie and Hashing Data Structures for Fast Text Processing |
| Department |
Faculty Of Computer Science Information Tehnology And Energy |
| Scientific advisor |
Aleksejs Jurenoks |
| Reviewer |
Ēriks Kļaviņš |
| Abstract |
Bakalaura darbs pēta Trie un hešēšanas tabulu datu struktūras, lai noteiktu to efektivitāti reāllaika teksta apstrādes sistēmās. Darba mērķis ir veikt šo datu struktūru analīzi un izstrādāt metodiku to optimālai izmantošanai, ņemot vērā pieaugošo teksta datu apjomu un nepieciešamību pēc ātras informācijas apstrādes. Pētījumā tika veikta teorētiskā analīze, izstrādāti veiktspējas salīdzināšanas kritēriji un veikti eksperimenti, izmantojot dažādas Trie un hešēšanas tabulu implementācijas ar divu veidu datu kopām: nejauši ģenerētām virknēm un reāliem teksta datiem.
Pēc eksperimentālo rezultātu iegūšanas tika secināts, ka Robin Hood hešēšanas tabula nodrošināja vislabāko kopējo veiktspēju un stabilitāti attiecībā uz ievietošanas un meklēšanas ātrumu dažādos scenārijos, īpaši ar nejauši ģenerētiem datiem. Trie uzrādīja labu meklēšanas ātrumu dabiskās valodas datos ar biežiem priedēkļiem un efektīvu atmiņas izmantošanu šādos gadījumos. Tika secināts, ka datu struktūras izvēle ir būtiski atkarīga no datu rakstura un specifiskajām operāciju prasībām. Trie struktūras ir pārākas uzdevumos, kas saistīti ar priedēkļu meklēšanu un alfabētiski sakārtotu datu piekļuvi, kamēr hešēšanas tabulas parasti ir ātrākas precīzas atbilstības meklēšanā. Darba rezultātā tika sniegtas rekomendācijas datu struktūru izvēlei: Robin Hood hešēšanas tabula ieteicama vispārīgiem reāllaika lietojumiem, bet Cedar Trie – teksta indeksēšanas un meklēšanas sistēmām, kas strādā ar dabiskās valodas datiem. |
| Keywords |
Trie, hešēšanas tabulas, teksta apstrāde, datu struktūras, veiktspējas analīze, reāllaika sistēmas. |
| Keywords in English |
trie, hash tables, text processing, data structures, performance analysis, real-time systems. |
| Language |
lv |
| Year |
2025 |
| Date and time of uploading |
26.05.2025 18:58:04 |