Graduate papers
  
Description of the graduate paper
Form of studies Professional Master
Title of the study programm Computer Systems
Title in original language Datu anonimizācija
Title in English Data Scrambling
Author Mārtiņš Paukšte
Department 12300 Institute of Applied Computer Systems
Scientific advisor Dr.sc.ing. J.Eiduks
Reviewer Dr.sc.ing. V.Graudiņa, LDI pētniece
Abstract Sekmīgai un ilgstošai informācijas sistēmas uzturēšanai nepietiek tikai ar produkcijas vides datubāzi. Ir nepieciešamas vismaz divas tās kopijas testēšanai un izstrādei, bet bieži vien vēl vairākas citiem nolūkiem. Jo vairāk kopiju, jo vairāk dažādu lietotāju, kas šīm kopijām piekļūst. Tas attiecīgi rada draudus datu drošībai un, tātad, arī klienta biznesam. Darbā tiek pētīta problēma kā datubāzes īpašniekam droši nodot savas produkcijas vides klonu izstrādātājam, tajā pat laikā nodrošinoties pret sensitīvās informācijas noplūšanu. Pretstatā informācijas šifrēšanai un stingru piekļuvju kontrolei, kurām ir savi mīnusi, tiek apskatīta datu neatgriezeniska izmainīšana pirms datubāzes klona nodošanas tālākās rokās. Tā ir patiesās informācijas noslēpšana jeb datu anonimizācija (angļu val. Data Scrambling). Anonimizācijas procesā grūtākais ir izmainīt datus tā, lai tiktu dzēsta patiesā sensitīvā informācija, vienlaicīgi nepārkāpjot datu integritātes nosacījumus un saglabājot datu reālumu un ticamību. Ļoti vājš anonimizācijas risinājums ir, ja, piemēram, darbinieku algu tabulā visiem ierakstiem ieliek vērtību 0 vai vispār datus no tabulas izdzēš. Tādā gadījumā atskaites, kas izmanto šādas tabulas datus, zaudē savu lietojamību. Anonimizācijai jābūt inteliģentai, lai, izmantojot datubāzes, kur ir veikta anonimizācija, varētu veikt testus, un to rezultāti būtu tuvi situācijai lietojot produkcijas vides datus. Darba gaitā ir izklāstītas galvenās problēmas, ar kurām saskaras, plānojot anonimizāciju, izpētīta daļa no pieejamajiem anonimizācijas rīkiem kā arī izstrādāts savs anonimizācijas rīks, kurā iespējams apvienot savus skriptus kopā ar jau gataviem vairākiem algoritmiem dažādām situācijām, un izstrādāts interfeiss, kas ļauj saplānot un izpildīt anonimizācijas programmu izvēlētai datubāzei. Dokuments sastāv no 178 lappusēm (pamattekstā 99 lpp.), 11 tabulām, 101 attēla un 14 pielikumiem.
Keywords Datu anonimizācija maisīšana datubāzes drošība šifrēšana maskēšana sanitizācija
Keywords in English Data Scrambling Sanitization Anonymization Scrubbing Masking Obfuscation Cleansing Disguising
Language lv
Year 2014
Date and time of uploading 17.01.2014 14:47:45