Form of studies |
Bachelor |
Title of the study programm |
Information Technology |
Title in original language |
Lielo datu apstrādes tehnoloģiju analīze |
Title in English |
Analysis of Big Data Processing Technologies |
Department |
Faculty Of Computer Science Information Tehnology And Energy |
Scientific advisor |
Jūlija Petuhova |
Reviewer |
Olga Kotova |
Abstract |
Lielie dati tiek plaši izmantoti progresīvās nozarēs, lai virzītu zinātni uz priekšu
un tajā pašā laikā gūtu peļņu no informācijas. Šis darbs ir vērsts uz lielo datu apstrādi,
ko veic uzņēmumi. Pētījuma mērķis ir lielo datu apstrādes tehnoloģijas analizēšana un
tās pielietojums datizraces uzdevumu risināšanai. Darbā aplūkoti un aprakstīti lielu datu
apstrādes posmi: datu krātuves, datizraces, datu analītika, Datu vizualizācija. Kā arī tiek
apskatīti programmnodrošinājumi pielietojami lielo datu apstrādes posmos: : Apache
Hadoop, Splunk, PrestoDB, MongoDB un Looker. Pētījumā tika analizētas MS Excel
funkcijas lielo datu apstrādei, tādi kā Excel iebūvētas skaitļošanas funkcijas,
raksturtabulas, jaudas vaicājums, nosacītais formatējums, Makrosi, Excel iebūvētas
vizualizācijas funkcijas kā arī aprobētas uz reāliem mazumtirdzniecības uzņēmuma
datiem. Tāpat gandrīz visas šīs funkcijas tika ieviestas, izmantojot MongoDB un
Pandas. Rezultātā tika pamanītas gan priekšrocības, gan trūkumi, izmantojot Excel lielu
datu apstrādei, kā arī salīdzinājums ar MongoDB un Python kombināciju.
Darba apjoms - 64. lpp., 12 tabulas, 67 attēli |
Keywords |
datu krātuves, datizraces, datu analītika, datu vizualizācija, Apache Hadoop, Splunk, PrestoDB, MongoDB, Looker, MS Excel, Pandas |
Keywords in English |
data warehouses, data mining, data analytics, data visualization Apache Hadoop, Splunk, PrestoDB, MongoDB, Looker, MS Excel, Pandas |
Language |
lv |
Year |
2024 |
Date and time of uploading |
28.05.2024 18:59:37 |