Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Information Technology
Title in original language Mašīnmācīšanās modeļu noviržu cēloņu analīze
Title in English Analysis of the Causes of Bias in Machine Learning
Department 12100 Institute of Information Technology
Scientific advisor Inese Poļaka
Reviewer Egmonts Treiguts
Abstract Darba mērķis ir noskaidrot, kas ir noslieces mašīnmācīšanās procesos, kā un kādēļ tās rodas, kā novērst un nepieļaut noslieču atkārošanos, kā arī praktiski pārbaudīt iegūtās zināšanas par nosliecēm mašīnmācīšanās procesos. Darbā tika izpētītas un apkopotas biežāk sastopamākās noslieces, tādas kā – atlases nosliece, pārskata nosliece, nereprezentēšanas nosliece un citas. Praktiski tika pārbaudīts, kā noteikt, vai atrastā datu kopa ir ar nosliecēm vai bez, kā saprast, ka datu kopā ir noslieces, un kā tās mazināt. Apskatītajā datu kopā bija gan mērķa atribūtu klases disbalanss, gan bija pārāk liela dzimumu nesabalansētība, tādēļ tika veidota datu priekšapstrāde līdz datu kopā bija vienāds skaits abu dzimumu un abu mērķa atribūtu klases. Datu apstrāde notika lietojumprogrammā Orange. Izpētītie galvenie mašīnmācīšanās procesu posmi, kuros var parādīties noslieces – datu ievākšana (no kādas respondentu grupas neievērošanas līdz datu nesabalansētībai), ievākto datu priekšapstrāde (trūkstošo datu ignorēšana) un algoritma izvēle (nepiemērota algoritma izvēle uzdevuma veikšanai). Darba apjoms - 68. lpp., 39 tabulas, 17 attēli un 0 pielikumi.
Keywords mākslīgais intelekts, mašīnmācīšanās, noslieces
Keywords in English artificial intelligence, machine learning, biases
Language lv
Year 2022
Date and time of uploading 30.05.2022 12:45:46