Form of studies |
Bachelor |
Title of the study programm |
Computer Systems |
Title in original language |
Dokumentu tuvdublikātu noteikšanas algoritmu salīdzinošā analīze |
Title in English |
Comparative Analysis of Near-Duplicate Document Detection Algorithms |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Gints Jēkabsons |
Reviewer |
Katrina Boločko |
Abstract |
Šajā bakalaura darbā ir veikta tuvdublikātu dokumentu noteikšanas algoritmu salīdzinoša analīze, izceļot tuvdublikātu dokumentu noteikšanas problēmu liela izmēra datu kopās.
Lai novērtētu un salīdzinātu tuvdublikātu dokumentu noteikšanas algoritmus, tiek pievērsta uzmanība algoritmu izpildei un loģikai.
Pētījuma noslēgumā ar eksperimentā iegūtajiem rezultātiem tiek veikta katra aplūkotā algoritma analīze un sniegti secinājumi, kuros apkopots izmantoto algoritmu salīdzinājums un to efektivitāte tuvdublikātu dokumentu atklāšanā. |
Keywords |
gandrīz dublikāts, teksta līdzība, līdzības noteikšanas metodes |
Keywords in English |
near-duplicate, text similarity, similarity evaluation methods |
Language |
eng |
Year |
2023 |
Date and time of uploading |
02.01.2023 13:33:00 |