Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Information Technology
Title in original language Mašīnmācīšanās modeļa izstrāde plaušu vēža priekšstāvokļu prognozēšanai ierobežotu datu apstākļos
Title in English Development of a Machine Learning Model for Predicting Lung Cancer Precursors Under Limited Data Conditions
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Arnis Kiršners
Reviewer Pēteris Grabusts
Abstract Plaušu vēža diagnostikā būtiska nozīme ir savlaicīgai plaušās konstatēta veidojuma ļaundabīguma riska izvērtēšanai, jo tā var ietekmēt turpmāko izmeklējumu nepieciešamību un ārstēšanas taktikas izvēli. Šajā darbā pētītas mašīnmācīšanās metožu izmantošanas iespējas strukturētu pacientu datu analīzē, vēršot uzmanību uz ierobežota datu apjoma radītajiem izaicinājumiem. Darba mērķis ir izstrādāt un novērtēt klasifikācijas modeli, kas prognozē plaušu veidojuma piederību labdabīgai vai ļaundabīgai klasei. Pētījumā izmantota anonimizēta LU LZP 2022/1-0410 projekta "Bronhoalveolārās lavāžas ekstracelulāro vezikulu miRNS profila nozīme papildus klīnisko un ģenētisko biomarķieru datiem plaušu vēza agrīnajā̄ diagnostikā" pacientu datu kopa ar 69 ierakstiem un 27 atribūtiem. Datu kopa ietver informāciju par pacientu anamnēzi, izmeklējumu rezultātiem un plaušās konstatētā veidojuma pazīmēm. Modeļu izstrāde veikta Orange datizraces vidē, kur dati tika sagatavoti analīzei, apstrādājot trūkstošās vērtības, mērogojot skaitliskos atribūtus, atlasot informatīvākās pazīmes un salīdzinot vairākas validācijas pieejas. Pēc sākotnējo rezultātu izvērtēšanas tika pielāgoti arī perspektīvāko algoritmu hiperparametri. Klasifikācijas uzdevuma risināšanai salīdzināti pieci mašīnmācīšanās algoritmi: loģistiskā regresija, k tuvāko kaimiņu algoritms, atbalsta vektoru mašīna, nejaušo mežu klasifikators un Naivais Beijesa klasifikators. Iegūtie rezultāti parādīja, ka konkrētās datu kopas ietvaros augstāko kopējo klasifikācijas precizitāti sasniedza k tuvāko kaimiņu algoritms un nejaušo mežu klasifikators. Par piemērotāko risinājumu izvēlēts k tuvāko kaimiņu algoritms, jo tas nodrošināja līdzsvarotāku labdabīgo un ļaundabīgo gadījumu klasifikāciju. Bakalaura darbā ir 62 lappuses, 15 attēli, 10 tabulas un 48 informācijas avoti.
Keywords mašīnmācīšanās, plaušu vēzis, ierobežots datu apjoms, klasifikācija, strukturēti medicīniskie dati.
Keywords in English machine learning, lung cancer, limited dataset, classification, structured medical data.
Language lv
Year 2026
Date and time of uploading 22.05.2026 17:16:07