Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Mašīnmācīšanās modeļa izstrāde plaušu vēža priekšstāvokļu prognozēšanai ierobežotu datu apstākļos
Nosaukums angļu valodā Development of a Machine Learning Model for Predicting Lung Cancer Precursors Under Limited Data Conditions
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Arnis Kiršners
Recenzents Pēteris Grabusts
Anotācija Plaušu vēža diagnostikā būtiska nozīme ir savlaicīgai plaušās konstatēta veidojuma ļaundabīguma riska izvērtēšanai, jo tā var ietekmēt turpmāko izmeklējumu nepieciešamību un ārstēšanas taktikas izvēli. Šajā darbā pētītas mašīnmācīšanās metožu izmantošanas iespējas strukturētu pacientu datu analīzē, vēršot uzmanību uz ierobežota datu apjoma radītajiem izaicinājumiem. Darba mērķis ir izstrādāt un novērtēt klasifikācijas modeli, kas prognozē plaušu veidojuma piederību labdabīgai vai ļaundabīgai klasei. Pētījumā izmantota anonimizēta LU LZP 2022/1-0410 projekta "Bronhoalveolārās lavāžas ekstracelulāro vezikulu miRNS profila nozīme papildus klīnisko un ģenētisko biomarķieru datiem plaušu vēza agrīnajā̄ diagnostikā" pacientu datu kopa ar 69 ierakstiem un 27 atribūtiem. Datu kopa ietver informāciju par pacientu anamnēzi, izmeklējumu rezultātiem un plaušās konstatētā veidojuma pazīmēm. Modeļu izstrāde veikta Orange datizraces vidē, kur dati tika sagatavoti analīzei, apstrādājot trūkstošās vērtības, mērogojot skaitliskos atribūtus, atlasot informatīvākās pazīmes un salīdzinot vairākas validācijas pieejas. Pēc sākotnējo rezultātu izvērtēšanas tika pielāgoti arī perspektīvāko algoritmu hiperparametri. Klasifikācijas uzdevuma risināšanai salīdzināti pieci mašīnmācīšanās algoritmi: loģistiskā regresija, k tuvāko kaimiņu algoritms, atbalsta vektoru mašīna, nejaušo mežu klasifikators un Naivais Beijesa klasifikators. Iegūtie rezultāti parādīja, ka konkrētās datu kopas ietvaros augstāko kopējo klasifikācijas precizitāti sasniedza k tuvāko kaimiņu algoritms un nejaušo mežu klasifikators. Par piemērotāko risinājumu izvēlēts k tuvāko kaimiņu algoritms, jo tas nodrošināja līdzsvarotāku labdabīgo un ļaundabīgo gadījumu klasifikāciju. Bakalaura darbā ir 62 lappuses, 15 attēli, 10 tabulas un 48 informācijas avoti.
Atslēgas vārdi mašīnmācīšanās, plaušu vēzis, ierobežots datu apjoms, klasifikācija, strukturēti medicīniskie dati.
Atslēgas vārdi angļu valodā machine learning, lung cancer, limited dataset, classification, structured medical data.
Valoda lv
Gads 2026
Darba augšupielādes datums un laiks 22.05.2026 17:16:07