| Form of studies |
Bachelor |
| Title of the study programm |
Computer Systems |
| Title in original language |
Teksta segmentēšana, izmantojot mašīnmācīšanos un dziļos neironu tīklus |
| Title in English |
Text Segmentation Using Machine Learning and Deep Neural Networks |
| Department |
Faculty Of Computer Science Information Tehnology And Energy |
| Scientific advisor |
Gints Jēkabsons |
| Reviewer |
Artūrs Ardavs |
| Abstract |
1. tips: Moderno risinājumu izpēte
Šis pētījums analizē teksta segmentēšanu, izmantojot mašīnmācīšanos un dziļos
neironu tīklus. Pētījuma autors uzsver teksta segmentēšanas nozīmi mācību, datu
apkopošanas sfērā, pierādot, ka tā ir nepieciešama sastāvdaļa ikdienas darbā ar liela
apjoma teksta dokumentiem. Bakalaura darba galvenais mērķis bija novērtēt un
salīdzināt lielos valodas modeļus un dziļos neironu tīklus teksta segmentēšanā latviešu
valodā. Galvenais teksta segmentēšanas uzdevums bija novērtēt teikumu pāru piederību
vienai rindkopai.
Eksperimentiem tika izmantoti trīs dziļo neironu tīklu modeļi kombinācijā ar
BERT – MLP, BiLSTM un ABCNN, kas tika apmācīti ar autora izveidotu datu kopu
latviešu valodā. Izmantotie lielie valodas modeļi bija ChatGPT 4o, Gemini un Copilot.
Eksperimentos visaugstvērtīgākos rezultātus uzrādīja ChatGPT 4o no visiem pētītajiem
modeļiem, pārspējot arī dziļo neironu tīklu modeļus, kas tika apmācīti ar šo datu kopu.
Starp dziļo neironu tīklu modeļiem visaugstākos rezultātus uzrādīja ABCNN + BERT.
Galvenais secinājums pēc bakalaura darba izstrādes ir, ka lielie valodas modeļi
spēj konkurēt teksta segmentēšanas kontekstā ar dziļo neironu tīklu modeļiem, taču
nepieciešams veikt papildus eksperimentus, lai pilnvērtīgi sagatavotu dziļo neironu
tīklu modeļus eksperimentiem, un atkārtoti veikt eksperimentus ar jau labāk
apmācītiem dziļo neironu tīklu modeļiem.
Dati par darba apjomu – 52 lappuses, 7 attēli, 10 tabulas un 35 informācijas avoti. |
| Keywords |
Teksta segmentēšana, mašīnmācīšanās |
| Keywords in English |
Text segmentation, machine learning |
| Language |
lv |
| Year |
2025 |
| Date and time of uploading |
27.05.2025 19:12:09 |