Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Datorsistēmas |
Nosaukums |
Dokumentu tuvdublikātu noteikšanas algoritmu salīdzinošā analīze |
Nosaukums angļu valodā |
Comparative Analysis of Near-Duplicate Document Detection Algorithms |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Gints Jēkabsons |
Recenzents |
Katrina Boločko |
Anotācija |
Šajā bakalaura darbā ir veikta tuvdublikātu dokumentu noteikšanas algoritmu salīdzinoša analīze, izceļot tuvdublikātu dokumentu noteikšanas problēmu liela izmēra datu kopās.
Lai novērtētu un salīdzinātu tuvdublikātu dokumentu noteikšanas algoritmus, tiek pievērsta uzmanība algoritmu izpildei un loģikai.
Pētījuma noslēgumā ar eksperimentā iegūtajiem rezultātiem tiek veikta katra aplūkotā algoritma analīze un sniegti secinājumi, kuros apkopots izmantoto algoritmu salīdzinājums un to efektivitāte tuvdublikātu dokumentu atklāšanā. |
Atslēgas vārdi |
gandrīz dublikāts, teksta līdzība, līdzības noteikšanas metodes |
Atslēgas vārdi angļu valodā |
near-duplicate, text similarity, similarity evaluation methods |
Valoda |
eng |
Gads |
2023 |
Darba augšupielādes datums un laiks |
02.01.2023 13:33:00 |