Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Mašīnmācīšanās modeļu noviržu cēloņu analīze |
Nosaukums angļu valodā |
Analysis of the Causes of Bias in Machine Learning |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Inese Poļaka |
Recenzents |
Egmonts Treiguts |
Anotācija |
Darba mērķis ir noskaidrot, kas ir noslieces mašīnmācīšanās procesos, kā un
kādēļ tās rodas, kā novērst un nepieļaut noslieču atkārošanos, kā arī praktiski pārbaudīt
iegūtās zināšanas par nosliecēm mašīnmācīšanās procesos.
Darbā tika izpētītas un apkopotas biežāk sastopamākās noslieces, tādas kā –
atlases nosliece, pārskata nosliece, nereprezentēšanas nosliece un citas.
Praktiski tika pārbaudīts, kā noteikt, vai atrastā datu kopa ir ar nosliecēm vai
bez, kā saprast, ka datu kopā ir noslieces, un kā tās mazināt.
Apskatītajā datu kopā bija gan mērķa atribūtu klases disbalanss, gan bija pārāk
liela dzimumu nesabalansētība, tādēļ tika veidota datu priekšapstrāde līdz datu kopā
bija vienāds skaits abu dzimumu un abu mērķa atribūtu klases. Datu apstrāde notika
lietojumprogrammā Orange.
Izpētītie galvenie mašīnmācīšanās procesu posmi, kuros var parādīties noslieces
– datu ievākšana (no kādas respondentu grupas neievērošanas līdz datu
nesabalansētībai), ievākto datu priekšapstrāde (trūkstošo datu ignorēšana) un algoritma
izvēle (nepiemērota algoritma izvēle uzdevuma veikšanai).
Darba apjoms - 68. lpp., 39 tabulas, 17 attēli un 0 pielikumi. |
Atslēgas vārdi |
mākslīgais intelekts, mašīnmācīšanās, noslieces |
Atslēgas vārdi angļu valodā |
artificial intelligence, machine learning, biases |
Valoda |
lv |
Gads |
2022 |
Darba augšupielādes datums un laiks |
30.05.2022 12:45:46 |