Noslēguma darbu reģistrs
  
Studiju darba apraksts
Studiju veids bakalaura akadēmiskās studijas
Studiju programmas nosaukums Informācijas tehnoloģija
Nosaukums Risinājumi lielo datu plūsmu apstrādei tuvu reālajam laikam
Nosaukums angļu valodā Solutions for Real-time Big Data Stream Processing in Near-real Time
Struktūrvienība 33000 Datorzinātnes, informācijas tehnoloģijas un enerģētikas fakultāte
Darba vadītājs Jānis Kampars
Recenzents Mg. sc. ing. Artis Ābolts
Anotācija Lielie dati ir savākto datu kopas, kuras ir tik apjomīgas un sarežģītas, ka to apstrādei tradicionālie datu apstrādes risinājumi nav derīgi. Lietu interneta veidotās bezgalīgas datu plūsmas ir izaicinājums mūsdienu datu apstrādes sistēmām, kad nepietiekamu skaitļošanas vai atmiņas resursu dēļ datu analīze apstājas, un līdz ar to dati noveco. Dati zaudē savu vērtību – tie vairs nespēj atspoguļot reālo situāciju. Bakalaura darba ietvaros tika apskatītas lielo datu apstrādes platformas, grafu datubāzes, grafu straumēšanas ietvari, mašīnmācības modeļi. Izvirzītais mērķis darba izstrādes laikā ir veikt reālā laika lielo datu plūsmu apstrādes risinājuma izstrādi. Mērķa sasniegšanai tika izvirzīti uzdevumi, pēc kuriem orientēties darba izstrādes laikā, tie ir: izvēlēties lietošanas gadījumu, kurā ir raksturīgs liels reālā laika datu apjoms un nepieciešamība strauji reaģēt uz datos identificētajām sakarībām, apskatīt pieejamo literatūru par jau pieejamiem risinājumiem lielo datu apstrādei tuvu reālam laikam, veikt reālā laika datu apstrādes risinājuma projektēšanu, veikt reālā laika datu apstrādes risinājuma ieviešanu, eksperimentāli novērtēt izstrādāto risinājumu. Bakalaura darba veiktā reālā laika datu apstrādes risinājuma ieviešanā tika izveidota sistēma, kura spēj apstrādāt IT infrastuktūras topoloģiju grafa formātā – fiksējot grafa topoloģijas izmaiņas reālā laikā, kā arī izveidots mašīnmācības modelis, kurš reālā laikā prognozē diska darbības vērtību pret sistēmas noslodzi. Darba apjoms - 62 lpp., 6 tabulas, 28 attēli un 1 pielikums.
Atslēgas vārdi Lielie dati, Lielo datu straumes apstrāde, Apache Spark, Apache Kafka, Neo4j, reāllaika
Atslēgas vārdi angļu valodā Big data, Big data streaming, Apache Spark, Apache Kafka, Neo4j, real-time
Valoda lv
Gads 2021
Darba augšupielādes datums un laiks 31.05.2021 17:37:32