Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Computer Systems
Title in original language Dokumentu tuvdublikātu noteikšanas algoritmu salīdzinošā analīze
Title in English Comparative Analysis of Near-Duplicate Document Detection Algorithms
Department 12300 Institute of Applied Computer Systems
Scientific advisor Gints Jēkabsons
Reviewer Katrina Boločko
Abstract Šajā bakalaura darbā ir veikta tuvdublikātu dokumentu noteikšanas algoritmu salīdzinoša analīze, izceļot tuvdublikātu dokumentu noteikšanas problēmu liela izmēra datu kopās. Lai novērtētu un salīdzinātu tuvdublikātu dokumentu noteikšanas algoritmus, tiek pievērsta uzmanība algoritmu izpildei un loģikai. Pētījuma noslēgumā ar eksperimentā iegūtajiem rezultātiem tiek veikta katra aplūkotā algoritma analīze un sniegti secinājumi, kuros apkopots izmantoto algoritmu salīdzinājums un to efektivitāte tuvdublikātu dokumentu atklāšanā.
Keywords gandrīz dublikāts, teksta līdzība, līdzības noteikšanas metodes
Keywords in English near-duplicate, text similarity, similarity evaluation methods
Language eng
Year 2023
Date and time of uploading 02.01.2023 13:33:00