Studiju veids |
maģistra akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Uz mašīnmācīšanos balstītas tīkla trafika analīzes metodoloģijas izstrāde |
Nosaukums angļu valodā |
Development of a Machine Learning Based Network Traffic Analysis Methodology |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Inese Poļaka |
Recenzents |
Henrihs Gorskis |
Anotācija |
COVID-19 pandēmijas laikā ir pieaugusi nepieciešamība pēc biznesa procesu digitalizācijas. Līdz ar to ir arī palielinājies kiberuzbrukumu skaits, kas negatīvi ietekmē biznesu. Viens no veidiem kā atklāt kiberdraudus sistēmā ir veikt tīkla trafika analīzi, izmantojot automatizētās metodes. Mašīnmācīšanās algoritmi spēj nodrošināt datu analīzes automatizāciju. Maģistra darba mērķis ir iepazīties ar kiberdraudu atklāšanas esošajiem risinājumiem, praktiski tos novērtēt un piedāvāt metodoloģijas uzlabojumus. Lai sasniegtu izvirzīto mērķi, tika izvēlēta CICIDS-2017 ielaušanās noteikšanas novērtēšanas datu kopa un veikta tās priekšapstrāde. Šī datu kopa tika izmantota mašīnmācīšanās klasifikatoru apmācībai un testēšanai. Dažādi klasifikatori tika apmācīti katra uzbrukuma veida binārajai klasifikācijai un pēc piemērotāko klasifikatoru izvēles tie tika apmācīti visu uzbrukuma veidu binārajai klasifikācijai un daudzklašu klasifikācijai, lai izvēlētos piemērotākos klasifikatorus mašīnmācīšanās ansambļa izveidei. Binārās klasifikācijas mašīnmācīšanās ansamblis sastāvēja no gadījuma meža, 3 dažādu veidu lēmumu koka, XGBoost un ārkārtīgi randomizētu koku klasifikatora. Daudzklašu klasifikācijas mašīnmācīšanās ansamblis sastāvēja no visiem iepriekš minētajiem klasifikatoriem, izņemot XGBoost klasifikatoru. Binārās klasifikācijas gadījumā mašīnmācīšanās ansamblis sniedz testa datiem 0,9997 lielu precizitāti, 0,9994 pozitīvo prognostisko vērtību, 0,9994 F1 mēru, 0,9995 jutīgumu un 0,9997 specifiskumu. Apmācības laiks ir 449,5 sekundes, bet testēšanas ātrums ir 32768 ieraksti/sekundē. Daudzklašu klasifikācijas mašīnmācīšanās ansamblis sniedz testa datiem 0,9991 precizitāti, apmācības laiku 1671,39 sekundes un testēšanas ātrumu 7695 ieraksti/sekundē. Pārējie mēri tika iegūti katram uzbrukuma veidam, vidēji iegūstot, ka pozitīvā prognostiskā vērtība ir 0,999, jutīgums 0,979 un F1 mērs 0,984. Noslēguma darba rezultātā tika izstrādāta metodoloģija piemērotāko klasifikatoru izvēlei mašīnmācīšanās ansambļa izveidei. |
Atslēgas vārdi |
tīkla trafika analīze, binārā klasifikācija, daudzklašu klasifikācija, atribūtu izvēle, mašīnmācīšanās ansamblis, metodoloģija |
Atslēgas vārdi angļu valodā |
network traffic analysis, binary classification, multiclass classification, feature selection, machine learning ensemble, methodology |
Valoda |
lv |
Gads |
2022 |
Darba augšupielādes datums un laiks |
26.05.2022 13:41:02 |