Abstract |
Batimetrijas datos, kas ievākti ar SONAR radaru, punktu mākoņos, dažādu apstākļu, piemēram, šķēršļu, viļņu, ūdens ķīmiskā sastāva u.c., dēļ rodas trokšņi, kas apgrūtina zemūdens vides izpēti. Netīrītu datu interpretācija ir apgrūtināta, kā arī tie var sniegt maldinošas zināšanas. Tā kā manuāla datu tīrīšana pieprasa kompetenta speciālista ilgstošu darbu, tiek meklēti risinājumi, kā attīrīšanas procesu automatizēt. Šajā darbā tiek pielietots DBSCAN klasterēšanas algoritms, ar kuru zemūdens vidi raksturojošus punktu mākoņus attīra no trokšņiem, balstoties uz punktu blīvumu.
Darbā iesākumā ir aprakstīti punktu mākoņi un tiem piesaistītas tēmas. Pēcāk aprakstīta klasterēšana, padziļināti iztirzāti divi sadalošie klasterēšanas algoritmi, taču pamata uzsvars likts uz blīvuma klasterēšanas algoritmiem, sevišķi DBSCAN. Lai veiktu datu attīrīšanu ar DBSCAN algoritmu, tika veikta režģa pārmeklēšana, un kā salīdzināšanas metrikas tika izmantots silueta vērtējums, vizuāla analīze un autora definēts trokšņu klasifikācijas precizitātes vērtējums (maksimālā vērtība 1), kas ņem vērā gan pareizi, gan nepareizi klasificētos trokšņu punktus. Datu vizualizācijai tika izmantots atvērtā pirmkoda rīks Potree.
Rezultātā tika atrasti DBSCAN parametri un ar DBSCAN algoritmu no trokšņiem veiksmīgi tika attīrīti reāli dati, kuri autoram bija pieejami sakarā ar dalību RTU HEAL projektā. Netīrīts punktu mākonis ar 7352665 punktiem uz autora datorsistēmas tika attīrīts nepilnās piecpadsmit minūtēs ar trokšņu klasifikācijas precizitātes vērtējumu 0,9906.
Darbā ir 69 lappuses, 48 attēli, 4 tabulas, 2 pielikumi un 38 informācijas avoti. |