Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Datorsistēmas
Nosaukums Dokumentu tuvdublikātu noteikšanas algoritmu salīdzinošā analīze
Nosaukums angļu valodā Comparative Analysis of Near-Duplicate Document Detection Algorithms
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Gints Jēkabsons
Recenzents Katrina Boločko
Anotācija Šajā bakalaura darbā ir veikta tuvdublikātu dokumentu noteikšanas algoritmu salīdzinoša analīze, izceļot tuvdublikātu dokumentu noteikšanas problēmu liela izmēra datu kopās. Lai novērtētu un salīdzinātu tuvdublikātu dokumentu noteikšanas algoritmus, tiek pievērsta uzmanība algoritmu izpildei un loģikai. Pētījuma noslēgumā ar eksperimentā iegūtajiem rezultātiem tiek veikta katra aplūkotā algoritma analīze un sniegti secinājumi, kuros apkopots izmantoto algoritmu salīdzinājums un to efektivitāte tuvdublikātu dokumentu atklāšanā.
Atslēgas vārdi gandrīz dublikāts, teksta līdzība, līdzības noteikšanas metodes
Atslēgas vārdi angļu valodā near-duplicate, text similarity, similarity evaluation methods
Valoda eng
Gads 2023
Darba augšupielādes datums un laiks 02.01.2023 13:33:00