Blog de Bismart: Últimes Notícies en Dades, IA i Business Intelligence

Azure Synapse Analytics | Arquitectura de dades cloud

Written by Núria Emilio | 12/12/2022 23:00:00

Cada vegada més empreses aposten per desplaçar la seva arquitectura de dades al núvol. Triar la plataforma i l'arquitectura adequades és primordial per a una transició al núvol fàcil i eficient. Azure Synapse Analytics ajuda a les empreses a agilitzar la gestió de la seva infraestructura cloud, cobreix les necessitats analítiques empresarials i soluciona la majoria de problemàtiques de la migració al núvol.

Les necessitats analítiques i d'obtenció d'insights per part de les empreses depenen de disposar una integració de dades eficient i consolidada per mesures de data quality, data management i data governance. Si bé aquest procés es pot dur a terme en sistemes d'integració físics propis de l'empresa —també coneguts com on-premise—, cada vegada més empreses aposten per les noves possibilitats dels serveis cloud, principalment pels seus avantatges de flexibilitat i escalabilitat

Quan una empresa decideix traslladar part de la seva infraestructura al núvol, ha de tenir en compte aspectes com la quantitat de càrregues de treball (workloads), bases de dades, plataformes, sistemes d'emmagatzematge, models de seguretat de dades, plataformes de gestió, etc.

La majoria de les organitzacions s'enfronten a problemes de complexitat a causa de les construccions desconnectades dels seus núvols o als equips de migració i se centren en les millors arquitectures de la seva classe i en les multinúvol. El primer pas per a abordar la seva complexitat és examinar totes les dades, serveis, càrregues de treball i plataformes. És important trobar maneres de gestionar-los utilitzant eines que suportin l'abstracció i l'automatització.

Per altra banda, una solució d'arquitectura en el núvol reeixit no sols depèn dels requisits tècnics, també dels econòmics i estratègics

En aquest sentit, Azure Synapse Analytics cobra rellevància, en la mesura en què proporciona una gestió de l'emmagatzematge de dades en el núvol ràpid, flexible i de confiança. A més, permet escalar, processar i emmagatzemar dades de manera flexible i independent, amb una arquitectura de processament paral·lel massiu.

Azure Synapse: per una analítica integrada

A mesura que creixen els actius de dades i l'interès per analitzar-les, les empreses solen requerir de dos tipus de bases de dades: els data warehouse i els data lakes, que atenen diferents propòsits.

Si bé tots dos sistemes d'emmagatzematge són crítics i haguessin d'estar totalment integrats, la realitat ens demostra que, en moltes ocasions, operen de manera independent, cosa que pot conduir a la presa de decisions no informades i dificultar el procés de presa de data-driven decisions.

Al mateix temps, les empreses necessiten desbloquejar la informació que resideix en totes les seves dades per a mantenir-se competitives. Azure Synapse és l'únic servei d'anàlisi en el núvol que tanca aquesta bretxa i proporciona l'agilitat que demanden les empreses, unint l'analítica, el enterprise data warehousing i el Big Data en un únic servei.

Concretament, es tracta d'un servei d'anàlisi il·limitada que reuneix l'emmagatzematge de dades empresarials i l'anàlisi de macrodades. D'aquesta manera, ofereix a les organitzacions la llibertat de consultar les dades com prefereixi, ja sigui a petició serverless (un tipus de desplegament que escala automàticament la potència sota demanda quan es disposa de grans quantitats de dades) per a l'exploració de dades i l'anàlisi ad hoc; o amb recursos aprovisionats, a escala.

 

Azure Synapse: emmagatzematge, integració i analítica en una única plataforma

El gran avantatge d'Azure Synapse Analytics és que reuneix la integració de dades, l'emmagatzematge de dades i l'anàlisi de dades i de macrodades en una única plataforma. Pel que fa a emmagatzematge i a integració, Azure Synapse Analytics disposa d'un model de dades consistent que incorpora apartats d'administració, de monitoratge i de gestió de metadades.

  • SQL Analytics: anàlisi basada en T-SQL complet que admet:
    - SQL pool (mitjançant pagament per DWU aprovisionada). Podent pausar el pool SQL quan no s'estigui utilitzant, la qual cosa deté la facturació dels recursos informàtics.
    - SQL a petició (pagament per TB processats).
  • Spark: Apache Spark totalment integrat.
  • Integració de dades: és possible abordar escenaris d'integració de dades híbrids, ja siguin on-premisemulti-cloud o entorns híbrids.
  • Azure Synapse Studio: Proporciona als professionals un únic espai de treball per a preparar i administrar les seves dades, així com per a gestionar les seves tasques de Big Data, intel·ligència artificialmachine learning. També disposa d'un entorn sense codi per a l'administració de pipelines.

Font: Bismart

Azure Synapse és compatible amb una gran quantitat de llenguatges de programació: SQL, Python, .NET, Java, Scala i R. Això ho converteix en un sistema molt adequat per a diferents càrregues de treball d'anàlisi i diferents perfils d'enginyers.

Azure Synapse Analytics també s'integra amb Power BI i amb Azure Machine Learning per a  potenciar el descobriment d'insights en les dades i per a l'aplicació de models d'aprenentatge automàtic a les aplicacions intel·ligents.

Quant a seguretat, està integrat amb Azure Active Directory i permet protegir, supervisar i administrar les solucions de dades i anàlisis, per exemple, amb inicis de sessió únics.

Amb tot això, Azure Synapse permet als professionals consultar tant dades relacionals com no relacionals a escala de petabytes i utilitzant un llenguatge SQL amb el qual ja estan familiaritzats. Per a càrregues de treball de missió crítica, poden optimitzar fàcilment el rendiment de totes les consultes mitjançant una gestió intel·ligent de càrregues de treball, aïllament de càrregues de treball i concurrència il·limitada.

Azure Synapse vs. Databricks?

Azure Synapse Analytics proporciona una eina única per a l'enginyeria de dades que admet l'aprovisionament de dades, d'informes i l'anàlisi de dades self-service.

En un projecte típic de gestió de dades basat en Azure, els enginyers de dades poden arribar a interactuar amb moltes eines diferents (Azure Data Factory, Azure Data Explorer, Azure Databricks, Azure SQL, Azure Analysis Services, Power BI, etc.). Cadascuna d'aquestes eines compta amb la seva pròpia interfície, el seu llenguatge i les seves particularitats. Per a tots aquests casos, Synapse simplifica dràsticament l'experiència d'ús, oferint la possibilitat de construir pipelines de dades d'extrem a extrem a través d'una sola eina de gestió unificada.

D'aquesta manera, la integració nativa d'Azure Synapse Analytics amb la resta de la plataforma Azure pot arribar a impulsar un control de la seguretat sense precedents i disparar la capacitat de fer proves de concepte (POC) per a trobar valor a nous projectes d'una forma més ràpida, per a després escalar amb eficàcia processos empresarials dins d'una sola eina.

No obstant això, per a aquells professionals que requereixen d'una escalabilitat addicional, Databricks proporciona transferències ràpides de dades entre serveis de dades i suport per a la transmissió de dades,  a més de les seves funcions de mapatge de fluxos de dades (Mapping Data Flow).

La bona notícia és que tant Azure Synapse com Azure Databricks poden executar anàlisi en les mateixes dades allotjades en un emmagatzematge Azure Data Lake. És a dir, en lloc de ser plataformes rivals, es podria dir que Azure Synapse continua la història iniciada per Databricks.

Azure Synapse: Casos d'ús

La multiplicitat de funcionalitats i de capacitats d'Azure Synapse Analytics pot dificultar a les empreses entendre què fa l'eina i, el més important, per a què poden utilitzar-la.

En aquest sentit, a continuació esmentem quatre casos d'ús habituals d'Azure Synapse: 

  • Data Warehousing a nivell empresarial: Azure Synapse és la solució idònia per als magatzems de dades empresarials en Azure. Ja sigui perquè estiguem migrant des d'un dispositiu legacy existent, o bé desenvolupant una nova solució en el núvol; Azure Synapse aporta l'escalabilitat, el rendiment i les capacitats necessàries per a executar les càrregues de treball empresarials més exigents.

  • Modernitzar càrregues de treball de missió críticaAzure Synapse permet optimitzar la migració de dispositius heretats a Azure Synapse, aprofitant capacitats innovadores com la conversió de codi.

  • Unificar l'emmagatzematge de dades empresarials i l'anàlisi de grans quantitats de dades: Azure Synapse Studio unifica l'emmagatzematge de Big Data amb l'analítica empresarial. Mitjançant un únic servei d'anàlisi, permet preparar, administrar i servir dades per a les necessitats immediates, tant de business intelligence com de machine learning.

  • Integrar Power BI i Azure Synapse: Aquesta integració porta les nostres solucions de business intelligence al següent nivell, proporcionant insights de valor amb un rendiment inferior al segon, mentre gestionem quantitats massives de dades.

 

En definitiva, Azure Synapse fusiona l'emmagatzematge amb l'analítica mitjançant una experiència unificada; habilitant la ingesta, preparació, gestió i l'accés a les dades i solucionant les necessitats immediates de business intelligence i de machine learning de les organitzacions.