El data governance i el data quality tenen punts en comú i diferències. Te'ls expliquem en aquesta entrada.
Les dades tenen un gran valor per a les empreses per la competitivitat i diferenciació que ofereixen. Tot i això, es troben en observació i anàlisi constant des d'un punt de vista legal per les regulacions a les quals estan sotmeses, que exigeixen seguretat, integritat i control. És evident que tota empresa que tracti amb dades ha de tenir una política de govern de dades o data governance que sigui la base per a una gestió de dades o data management que permeti solucionar problemes amb el flux de les dades i la confiança en elles.
El data governance podria definir-se com "l'exercici de l'autoritat, el control i la presa de decisions compartida sobre la gestió dels actius de dades". El data management, per la seva banda, consisteix en la posada en marxa de les polítiques de dades.
És important no confondre cap d'aquests conceptes amb el Master Data Management, que consisteix en aconseguir la integració de les dades mestres d'una organització perquè puguin fer-se servir a través de sistemes i departaments diferents.
Per què és important?
Moltes vegades, les polítiques de data governance apareixen a mesura que l'empresa creix i disposa de més dades que li permetin ser més competitiva, identificar punts de millora, desenvolupar productes, millorar l'experiència del client, etc., encara que les raons principals per desenvolupar una política de data governance son les regulacions i el risc, per la qual cosa l'empresa ha de comptar amb dades d'alta qualitat. De fet, moltes regulacions comproven el compliment fixant-se en l'aspecte de la seguretat de les dades.
Així doncs, l'objectiu de data governance és garantir la integritat dels actius de dades a través de processos i procediments, estandardització de sistemes i creació de polítiques de distribució de dades consistents.
Principis de data governance
1. Integritat. Que tots els processos als quals se sotmeten les dades tinguin com a un dels objectius mantenir la integritat de les dades.
2. Cicle de vida. Hem de poder seguir el rastre de les dades, des del seu origen, passant per tots els seus estats, processos i destí.
3. Seguretat. Hem de vetllar per la privadesa i confidencialitat de les dades definint nivells i perfils i per l'otorgament d'autoritzacions.
4. Qualitat. Cal definir, controlar i millorar els processos per mantenir intactes l'exactitud, consistència, conformitat, fiabilitat i unicitat de les dades.
5. Llinatge de dades. Hem de poder traçar les dades per augmentar la fiabilitat del business intelligence i minimitzar riscos.
6. Suport a la missió de govern de dades. El govern de les dades ha de comptar amb el suport de l'empresa al complet. Hem de garantir l'accessibilitat, disponibilitat, qualitat, coherència, verificabilitat i seguretat de les dades. Només així podrem garantir un control absolut sobre els actius de dades.
7. Establir regles aplicables a les dades fora de les bases de dades. Hem d'establir propietaris de dades que siguin responsables de la seva gestió i plans a curt, mitjà i llarg termini.
8. Data storage. Per maximitzar l'agilitat en les consultes, hem de de concretar l'emmagatzematge de les dades, tant pel que fa a ubicació, com a volum.
Estat actual de la situació
El passat 16 d'octubre es va celebrar a Madrid un esdeveniment centrat en el data management anomenat Data Management Summit. A l'esdeveniment es va dur a terme una taula rodona en què es va parlar de data governance. Els participants van relatar les seves experiències amb els projectes de data management i la seva visió del grau de maduresa de l'empresa espanyola en relació amb aquest tema. De les qüestions a mà alçada que es van plantejar a la taula rodona es van obtenir, entre altres conclusions, que encara que la direcció de les companyies ja està pensant en el govern de les dades, encara no hi ha gaire pressupost dedicat a aquest aspecte i tampoc s'ha implantat de manera general la cultura organitzativa necessària per executar els projectes amb èxit.
Què és data quality?
Les dades són de qualitat quan compleixen un seguit d'objectius: exactitud, rellevància, integritat i comprensió, però, sobretot, quan satisfan els requeriments de l'ús que se'ls farà. Així, les empreses disposen de dades de bona qualitat quan poden fer-los servir per determinar les necessitats dels clients i servir-los eficientment, si bé aquesta visió ja està quedant obsoleta. Ara les empreses estan començant a centrar-se en garantir la qualitat de les dades de manera transversal. A partir d'aquí, concloem que el data quality és l'estat de qualitat dels elements d'informació dels que disposa una empresa.
Per aconseguir dades de qualitat es poden dur a terme diversos processos, com:
- Neteja
- Estandardització
- Perfilat
- Geocodificació
- Monitorització
Relació amb el data governance
El data quality i data governance convergeixen en els processos que tenen com a objectiu garantir la credibilitat i integritat de les dades. A més, per poder complir la legislació i regulacions —cosa que forma part del data governance—, les dades han de ser d'alta qualitat.
El data quality posa el focus a les mateixes dades, en el seu ús i estat, mentre que el data governance es fixa en l'autoritat que els regeix i en mantenir-ne un control. Dit d'una altra manera, les preguntes que ens haurem de fer per determinar cadascuna d'aquestes qüestions seran diferents, perquè el seu punt de vista i enfocament sobre les dades difereixen. Per exemple, una possible pregunta per determinar l'estat de la política de data governance a l'empresa podria ser: "qui és responsable de quins aspectes de les dades?" i una altra per a data quality seria "com d'útils son les meves dades a l'empresa?".
Aquests dos conceptes difereixen en el marc en què se situen, encara que tots dos són essencials per a una posterior gestió de dades mestres necessària per aconseguir una integració transversal a l'organització.