Form of studies |
Bachelor |
Title of the study programm |
Information Technology |
Title in original language |
Mašīnmācīšanās modeļu noviržu cēloņu analīze |
Title in English |
Analysis of the Causes of Bias in Machine Learning |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Inese Poļaka |
Reviewer |
Egmonts Treiguts |
Abstract |
Darba mērķis ir noskaidrot, kas ir noslieces mašīnmācīšanās procesos, kā un
kādēļ tās rodas, kā novērst un nepieļaut noslieču atkārošanos, kā arī praktiski pārbaudīt
iegūtās zināšanas par nosliecēm mašīnmācīšanās procesos.
Darbā tika izpētītas un apkopotas biežāk sastopamākās noslieces, tādas kā –
atlases nosliece, pārskata nosliece, nereprezentēšanas nosliece un citas.
Praktiski tika pārbaudīts, kā noteikt, vai atrastā datu kopa ir ar nosliecēm vai
bez, kā saprast, ka datu kopā ir noslieces, un kā tās mazināt.
Apskatītajā datu kopā bija gan mērķa atribūtu klases disbalanss, gan bija pārāk
liela dzimumu nesabalansētība, tādēļ tika veidota datu priekšapstrāde līdz datu kopā
bija vienāds skaits abu dzimumu un abu mērķa atribūtu klases. Datu apstrāde notika
lietojumprogrammā Orange.
Izpētītie galvenie mašīnmācīšanās procesu posmi, kuros var parādīties noslieces
– datu ievākšana (no kādas respondentu grupas neievērošanas līdz datu
nesabalansētībai), ievākto datu priekšapstrāde (trūkstošo datu ignorēšana) un algoritma
izvēle (nepiemērota algoritma izvēle uzdevuma veikšanai).
Darba apjoms - 68. lpp., 39 tabulas, 17 attēli un 0 pielikumi. |
Keywords |
mākslīgais intelekts, mašīnmācīšanās, noslieces |
Keywords in English |
artificial intelligence, machine learning, biases |
Language |
lv |
Year |
2022 |
Date and time of uploading |
30.05.2022 12:45:46 |