Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Datorsistēmas |
Nosaukums |
Datizraces metožu izmantošana anomāliju atklāšanai |
Nosaukums angļu valodā |
Application of Data Mining Methods for Anomaly Detection |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Agris Ņikitenko |
Recenzents |
Mihails Kovaļovs |
Anotācija |
Anomālijas ir datu kopas modeļi, kas atšķiras no paredzamās vai normālās
uzvedības. Šī darba mērķis ir izpētīt un salīdzināt plaši izmantoto datu ieguves metoţu
veiktspēju ar netradicionāliem algoritmiem, lai noteiktu piemērotāko pieeju anomāliju
atklāšanai. Anomāliju atklāšana ir ļoti svarīga daţādās jomās, piemēram,
kiberdrošībā, finansēs un veselības aprūpē, lai noteiktu nenormālu uzvedību. Lai to
panāktu, autors īstenoja sešus daţādus datu ieguves algoritmus: Logistiskā regresija,
lēmumu koks, izlases meţs, XGBoost, CatBoost un LightGBM. Šie algoritmi tika
piemēroti reālās pasaules datu kopai, konkrēti kredītkaršu krāpšanas datu kopai, lai
noteiktu anomālijas. Katra algoritma veiktspēja tika salīdzināta un novērtēta,
izmantojot tādus rādītājus kā precizitāte, precizitāte, atsaukšana, F1 rezultāts un AUC
rezultāts.
Šo darbu veido 3 nodaļas, kuru kopējais apjoms ir 56 lappuses. Turklāt tajā ir
8 tabulas un 42 attēli ar 65 atsaucēm. |
Atslēgas vārdi |
Datu ieguve, Anomāliju noteikšana, Loģistiskā regresija, Lēmumu koks, Gadījuma meţs, XGboost, Catboost, LightGBM |
Atslēgas vārdi angļu valodā |
Data mining, Anomaly detection, Logistic regression, Decision tree, Random forest, XGboost, Catboost, LightGBM |
Valoda |
eng |
Gads |
2024 |
Darba augšupielādes datums un laiks |
28.05.2024 23:44:15 |