Abstract |
Dažu pēdējo gadu laikā uzņēmumi ir pakāpeniski pārgājuši uz mākoņošanas platformu,
mikropakalpojumu arhitektūras un mašīnmācīšanās (ML) iespēju izmantošanu, lai veicinātu
ātrus, uz datiem pamatotus lēmumu pieņemšanas procesus. Atvērtā koda datu inženierijas rīki
piedāvā dažādas iespējas, kas pielāgotas dažādām vajadzībām. Starp tiem jāpiemin Apache
Airflow, Apache Kafka, Docker, MLflow. Turklāt ekosistēmā ir iekļautas nobriedušas ML bib-
liotēkas, piemēram, scikit-learn.
Turklāt tādi lielākie spēlētāji kā Amazon (AWS), Google (GCP) un Microsoft (Azure) piedāvā
visaptverošus risinājumu komplektus. Šie pilnībā integrētie pakalpojumi racionalizē uzlabotas
datu analīzes un ML lietojumprogrammu pieņemšanas un mērogošanas procesu dažādās orga-
nizācijās.
Šī darba teorētiskais segments ir saistīts ar izplatīto un unikālo īpašību, priekšnoteikumu un
šādu metodoloģiju piemērotības salīdzinošo pārbaudi ML operāciju jomā, kas ir īpaši pielāgotas
izmantošanai sabiedrības veselības pakalpojumos.
Šī darba praktiskā daļa satur plašu vadošo mākoņpakalpojumu sniedzēju analīzi un sniedz
aprakstus par notikumiem balstītas arhitektūras praktiskas izstrādes, izmantojot tādus rīkus kā
Apache Airflow un Apache Kafka, kas organizēti Google Cloud vidē un izvietoti uz Docker
konteineriem. Papildus šajā darbā ir izklāstīta trīs dažādu mikropakalpojumu arhitektūra un
projektēšanas principi. Šī pieeja cer parādīt tehnisko iespējamību šo tehnoloģiju integrēšanai
sabiedrības veselības vidē.
Tomēr pētījuma rezultāti liecina, ka funkciju sadalīšana tālāk, nekā nepieciešams risinājumā,
netīšām palielina sarežģītības līmeni. Šādas sarežģītības var nebūt sistēmā, kas uztur monolītu
arhitektūru. Ņemot vērā šajā pētījumā izklāstīto arhitektūras modeli, šķiet ticami, ka racionālāka
stratēģija nozīmētu tradicionāli aprīkota lokāla servera izmantošanu.
Maģistra darbs satur 95 lappuses, 15 attēlus, 12 tabulas, 109 informācijas avotus, 1 pielikumu |