Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Smart Computer Technologies
Title in original language Python bibliotēku salīdzinošā analīze liela apjoma teksta failu apstrādei
Title in English A Comparative Analysis of Python Libraries for Processing Large Text Files
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Aleksejs Jurenoks
Reviewer Marina Uhanova
Abstract Mūsdienās notiek aktīva visu cilvēku darbības sfēru digitalizācija, un pastāv nepieciešamība nodrošināt pēc iespējas ātrāku datu apstrādi kā arī labāku datorsistēmu resursu taupīšanu. Programmēšanas valoda Python tiek bieži pielietota datu apstrādes jomā. Šī darba mērķis ir izpētīt un veikt Python valodas bibliotēku pielietojuma salīdzinošu analīzi liela apjoma teksta failu apstrādē un piedāvāt metodoloģiju atbilstošās bibliotēkas izvēlei liela apjoma teksta failu apstrādei. Pētījuma gaitā tika salīdzināts Python bibliotēkas Dask, Pandas, Polars un Vaex pēc to datu apstrādes laika, izmantotā operatīvās atmiņas apjoma un noslodzes uz centrālo procesoru. Darba rezultātā tika secināts, ka vislabāko operatīvās atmiņas ietaupījumu nodrošina bibliotēka Dask, tomēr tās datu apstrādes laiks ir visilgākais. Visātrāko datu apstrādi nodrošina vai bibliotēka Polars vai bibliotēka Vaex atkarībā no konkrētā lietošanas scenārija. Bibliotēka Polars arī stabili rāda viszemāko noslodzi uz procesoru. Savukārt bibliotēka Pandas vispār nav piemērota liela apjoma datu apstrādei. Balstoties uz izdarītiem secinājumiem tika formulētas arī atbilstošas rekomendācijas Python bibliotēkas izvēlei lielā apjoma teksta failu apstrādei. Bakalaura darbs satur 60 lapaspuses, 18 tabulas, 7 attēlus, 49 informācijas avotus un 4 pielikumus.
Keywords Python bibliotēkas, lielie dati, teksta fails, ātrums, skaitļošanas resursi
Keywords in English Python libraries, big data, text file, speed, computing resources
Language lv
Year 2026
Date and time of uploading 25.05.2026 18:03:59