Analysis of the Causes of Bias in Machine Learning

Graduate papers

Search graduate papers

Description of the graduate paper

Form of studies	Bachelor
Title of the study programm	Information Technology
Title in original language	Mašīnmācīšanās modeļu noviržu cēloņu analīze
Title in English	Analysis of the Causes of Bias in Machine Learning
Department	Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor	Inese Poļaka
Reviewer	Egmonts Treiguts
Abstract	Darba mērķis ir noskaidrot, kas ir noslieces mašīnmācīšanās procesos, kā un kādēļ tās rodas, kā novērst un nepieļaut noslieču atkārošanos, kā arī praktiski pārbaudīt iegūtās zināšanas par nosliecēm mašīnmācīšanās procesos. Darbā tika izpētītas un apkopotas biežāk sastopamākās noslieces, tādas kā – atlases nosliece, pārskata nosliece, nereprezentēšanas nosliece un citas. Praktiski tika pārbaudīts, kā noteikt, vai atrastā datu kopa ir ar nosliecēm vai bez, kā saprast, ka datu kopā ir noslieces, un kā tās mazināt. Apskatītajā datu kopā bija gan mērķa atribūtu klases disbalanss, gan bija pārāk liela dzimumu nesabalansētība, tādēļ tika veidota datu priekšapstrāde līdz datu kopā bija vienāds skaits abu dzimumu un abu mērķa atribūtu klases. Datu apstrāde notika lietojumprogrammā Orange. Izpētītie galvenie mašīnmācīšanās procesu posmi, kuros var parādīties noslieces – datu ievākšana (no kādas respondentu grupas neievērošanas līdz datu nesabalansētībai), ievākto datu priekšapstrāde (trūkstošo datu ignorēšana) un algoritma izvēle (nepiemērota algoritma izvēle uzdevuma veikšanai). Darba apjoms - 68. lpp., 39 tabulas, 17 attēli un 0 pielikumi.
Keywords	mākslīgais intelekts, mašīnmācīšanās, noslieces
Keywords in English	artificial intelligence, machine learning, biases
Language	lv
Year	2022
Date and time of uploading	30.05.2022 12:45:46