Studiju veids |
bakalaura akadēmiskās studijas |
Studiju programmas nosaukums |
Informācijas tehnoloģija |
Nosaukums |
Lielo datu apstrādes tehnoloģiju analīze |
Nosaukums angļu valodā |
Analysis of Big Data Processing Technologies |
Struktūrvienība |
33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte |
Darba vadītājs |
Jūlija Petuhova |
Recenzents |
Olga Kotova |
Anotācija |
Lielie dati tiek plaši izmantoti progresīvās nozarēs, lai virzītu zinātni uz priekšu
un tajā pašā laikā gūtu peļņu no informācijas. Šis darbs ir vērsts uz lielo datu apstrādi,
ko veic uzņēmumi. Pētījuma mērķis ir lielo datu apstrādes tehnoloģijas analizēšana un
tās pielietojums datizraces uzdevumu risināšanai. Darbā aplūkoti un aprakstīti lielu datu
apstrādes posmi: datu krātuves, datizraces, datu analītika, Datu vizualizācija. Kā arī tiek
apskatīti programmnodrošinājumi pielietojami lielo datu apstrādes posmos: : Apache
Hadoop, Splunk, PrestoDB, MongoDB un Looker. Pētījumā tika analizētas MS Excel
funkcijas lielo datu apstrādei, tādi kā Excel iebūvētas skaitļošanas funkcijas,
raksturtabulas, jaudas vaicājums, nosacītais formatējums, Makrosi, Excel iebūvētas
vizualizācijas funkcijas kā arī aprobētas uz reāliem mazumtirdzniecības uzņēmuma
datiem. Tāpat gandrīz visas šīs funkcijas tika ieviestas, izmantojot MongoDB un
Pandas. Rezultātā tika pamanītas gan priekšrocības, gan trūkumi, izmantojot Excel lielu
datu apstrādei, kā arī salīdzinājums ar MongoDB un Python kombināciju.
Darba apjoms - 64. lpp., 12 tabulas, 67 attēli |
Atslēgas vārdi |
datu krātuves, datizraces, datu analītika, datu vizualizācija, Apache Hadoop, Splunk, PrestoDB, MongoDB, Looker, MS Excel, Pandas |
Atslēgas vārdi angļu valodā |
data warehouses, data mining, data analytics, data visualization Apache Hadoop, Splunk, PrestoDB, MongoDB, Looker, MS Excel, Pandas |
Valoda |
lv |
Gads |
2024 |
Darba augšupielādes datums un laiks |
28.05.2024 18:59:37 |