Abstract |
Sekmīgai un ilgstošai informācijas sistēmas uzturēšanai nepietiek tikai ar produkcijas vides datubāzi. Ir nepieciešamas vismaz divas tās kopijas testēšanai un izstrādei, bet bieži vien vēl vairākas citiem nolūkiem. Jo vairāk kopiju, jo vairāk dažādu lietotāju, kas šīm kopijām piekļūst. Tas attiecīgi rada draudus datu drošībai un, tātad, arī klienta biznesam.
Darbā tiek pētīta problēma kā datubāzes īpašniekam droši nodot savas produkcijas vides klonu izstrādātājam, tajā pat laikā nodrošinoties pret sensitīvās informācijas noplūšanu. Pretstatā informācijas šifrēšanai un stingru piekļuvju kontrolei, kurām ir savi mīnusi, tiek apskatīta datu neatgriezeniska izmainīšana pirms datubāzes klona nodošanas tālākās rokās. Tā ir patiesās informācijas noslēpšana jeb datu anonimizācija (angļu val. Data Scrambling).
Anonimizācijas procesā grūtākais ir izmainīt datus tā, lai tiktu dzēsta patiesā sensitīvā informācija, vienlaicīgi nepārkāpjot datu integritātes nosacījumus un saglabājot datu reālumu un ticamību. Ļoti vājš anonimizācijas risinājums ir, ja, piemēram, darbinieku algu tabulā visiem ierakstiem ieliek vērtību 0 vai vispār datus no tabulas izdzēš. Tādā gadījumā atskaites, kas izmanto šādas tabulas datus, zaudē savu lietojamību. Anonimizācijai jābūt inteliģentai, lai, izmantojot datubāzes, kur ir veikta anonimizācija, varētu veikt testus, un to rezultāti būtu tuvi situācijai lietojot produkcijas vides datus.
Darba gaitā ir izklāstītas galvenās problēmas, ar kurām saskaras, plānojot anonimizāciju, izpētīta daļa no pieejamajiem anonimizācijas rīkiem kā arī izstrādāts savs anonimizācijas rīks, kurā iespējams apvienot savus skriptus kopā ar jau gataviem vairākiem algoritmiem dažādām situācijām, un izstrādāts interfeiss, kas ļauj saplānot un izpildīt anonimizācijas programmu izvēlētai datubāzei.
Dokuments sastāv no 178 lappusēm (pamattekstā 99 lpp.), 11 tabulām, 101 attēla un 14 pielikumiem. |