Graduate papers
  
Description of the graduate paper
Form of studies Bachelor
Title of the study programm Computer Systems
Title in original language Python bibliotēku salīdzinošā analīze liela apjoma teksta failu apstrādei
Title in English Comparative Analysis of Python Libraries for Processing Large Text Files
Department Faculty Of Computer Science Information Tehnology And Energy
Scientific advisor Aleksejs Jurenoks
Reviewer Gusts Linkevičs
Abstract Atslēgvārdi: Lielie dati, Python, teksta apstrāde, datu analīze, bibliotēkas Šis bakalaura darbs ir veltīts Python rīku salīdzinājumam, strādājot ar lieliem teksta failiem. Darba mērķi ir: noskaidrot, kura bibliotēka vislabāk darbojas ar lieliem teksta failiem un patiesībā ir visefektīvākā šajā ziņā, kā arī nodrošināt objektīvus šo bibliotēku salīdzinājumus. Četras izvēlētās bibliotēkas (Pandas, Dask, PySpark, smart_open) tiek salīdzinātas pēc to lejupielāžu biežuma, popularitātes GitHub, to veiktspējas, strādājot ar lieliem datiem, un aktīvo lietotāju skaita. Šie ir iegūtie rezultāti, un, pamatojoties uz dažādu programmatūras bibliotēku testēšanas rezultātiem, redzams, ka bibliotēka smart_open ieguva augstāko kopējo vērtējumu, apstiprinot tās efektivitāti un lietošanas ērtumu starp dažādajām bibliotēkām. Tomēr katrai no tām ir savas stiprās un vājās puses, un izvēle jāveic, ņemot vērā kontekstu, kurā tās tiks izmantotas. Secinājumu sadaļā ir norādīts, kā izvēlēties konkrētas bibliotēkas noteiktām datu apstrādes vajadzībām. Darbs satur 87 lapas, 1 attēlu, 21 tabulu, 46 informācijas avotus un 14 pielikumus.
Keywords Lielie dati, Python, teksta apstrāde, datu analīze, bibliotēkas
Keywords in English Big Data, Python, Text Processing, Data Analysis, Libraries
Language lv
Year 2024
Date and time of uploading 28.05.2024 23:12:53