Uz mašīnmācīšanos balstītas tīkla trafika analīzes metodoloģijas izstrāde

Noslēguma darbu reģistrs

Noslēguma darbu meklēšana

Studiju darba apraksts

Studiju veids	maģistra akadēmiskās studijas
Studiju programmas nosaukums	Informācijas tehnoloģija
Nosaukums	Uz mašīnmācīšanos balstītas tīkla trafika analīzes metodoloģijas izstrāde
Nosaukums angļu valodā	Development of a Machine Learning Based Network Traffic Analysis Methodology
Struktūrvienība	33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs	Inese Poļaka
Recenzents	Henrihs Gorskis
Anotācija	COVID-19 pandēmijas laikā ir pieaugusi nepieciešamība pēc biznesa procesu digitalizācijas. Līdz ar to ir arī palielinājies kiberuzbrukumu skaits, kas negatīvi ietekmē biznesu. Viens no veidiem kā atklāt kiberdraudus sistēmā ir veikt tīkla trafika analīzi, izmantojot automatizētās metodes. Mašīnmācīšanās algoritmi spēj nodrošināt datu analīzes automatizāciju. Maģistra darba mērķis ir iepazīties ar kiberdraudu atklāšanas esošajiem risinājumiem, praktiski tos novērtēt un piedāvāt metodoloģijas uzlabojumus. Lai sasniegtu izvirzīto mērķi, tika izvēlēta CICIDS-2017 ielaušanās noteikšanas novērtēšanas datu kopa un veikta tās priekšapstrāde. Šī datu kopa tika izmantota mašīnmācīšanās klasifikatoru apmācībai un testēšanai. Dažādi klasifikatori tika apmācīti katra uzbrukuma veida binārajai klasifikācijai un pēc piemērotāko klasifikatoru izvēles tie tika apmācīti visu uzbrukuma veidu binārajai klasifikācijai un daudzklašu klasifikācijai, lai izvēlētos piemērotākos klasifikatorus mašīnmācīšanās ansambļa izveidei. Binārās klasifikācijas mašīnmācīšanās ansamblis sastāvēja no gadījuma meža, 3 dažādu veidu lēmumu koka, XGBoost un ārkārtīgi randomizētu koku klasifikatora. Daudzklašu klasifikācijas mašīnmācīšanās ansamblis sastāvēja no visiem iepriekš minētajiem klasifikatoriem, izņemot XGBoost klasifikatoru. Binārās klasifikācijas gadījumā mašīnmācīšanās ansamblis sniedz testa datiem 0,9997 lielu precizitāti, 0,9994 pozitīvo prognostisko vērtību, 0,9994 F1 mēru, 0,9995 jutīgumu un 0,9997 specifiskumu. Apmācības laiks ir 449,5 sekundes, bet testēšanas ātrums ir 32768 ieraksti/sekundē. Daudzklašu klasifikācijas mašīnmācīšanās ansamblis sniedz testa datiem 0,9991 precizitāti, apmācības laiku 1671,39 sekundes un testēšanas ātrumu 7695 ieraksti/sekundē. Pārējie mēri tika iegūti katram uzbrukuma veidam, vidēji iegūstot, ka pozitīvā prognostiskā vērtība ir 0,999, jutīgums 0,979 un F1 mērs 0,984. Noslēguma darba rezultātā tika izstrādāta metodoloģija piemērotāko klasifikatoru izvēlei mašīnmācīšanās ansambļa izveidei.
Atslēgas vārdi	tīkla trafika analīze, binārā klasifikācija, daudzklašu klasifikācija, atribūtu izvēle, mašīnmācīšanās ansamblis, metodoloģija
Atslēgas vārdi angļu valodā	network traffic analysis, binary classification, multiclass classification, feature selection, machine learning ensemble, methodology
Valoda	lv
Gads	2022
Darba augšupielādes datums un laiks	26.05.2022 13:41:02