Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Computer Systems
Title in original language Teksta segmentēšana, izmantojot mašīnmācīšanos un dziļos neironu tīklus
Title in English Text Segmentation Using Machine Learning and Deep Neural Networks
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Gints Jēkabsons
Reviewer Artūrs Ardavs
Abstract 1. tips: Moderno risinājumu izpēte Šis pētījums analizē teksta segmentēšanu, izmantojot mašīnmācīšanos un dziļos neironu tīklus. Pētījuma autors uzsver teksta segmentēšanas nozīmi mācību, datu apkopošanas sfērā, pierādot, ka tā ir nepieciešama sastāvdaļa ikdienas darbā ar liela apjoma teksta dokumentiem. Bakalaura darba galvenais mērķis bija novērtēt un salīdzināt lielos valodas modeļus un dziļos neironu tīklus teksta segmentēšanā latviešu valodā. Galvenais teksta segmentēšanas uzdevums bija novērtēt teikumu pāru piederību vienai rindkopai. Eksperimentiem tika izmantoti trīs dziļo neironu tīklu modeļi kombinācijā ar BERT – MLP, BiLSTM un ABCNN, kas tika apmācīti ar autora izveidotu datu kopu latviešu valodā. Izmantotie lielie valodas modeļi bija ChatGPT 4o, Gemini un Copilot. Eksperimentos visaugstvērtīgākos rezultātus uzrādīja ChatGPT 4o no visiem pētītajiem modeļiem, pārspējot arī dziļo neironu tīklu modeļus, kas tika apmācīti ar šo datu kopu. Starp dziļo neironu tīklu modeļiem visaugstākos rezultātus uzrādīja ABCNN + BERT. Galvenais secinājums pēc bakalaura darba izstrādes ir, ka lielie valodas modeļi spēj konkurēt teksta segmentēšanas kontekstā ar dziļo neironu tīklu modeļiem, taču nepieciešams veikt papildus eksperimentus, lai pilnvērtīgi sagatavotu dziļo neironu tīklu modeļus eksperimentiem, un atkārtoti veikt eksperimentus ar jau labāk apmācītiem dziļo neironu tīklu modeļiem. Dati par darba apjomu – 52 lappuses, 7 attēli, 10 tabulas un 35 informācijas avoti.
Keywords Teksta segmentēšana, mašīnmācīšanās
Keywords in English Text segmentation, machine learning
Language lv
Year 2025
Date and time of uploading 27.05.2025 19:12:09