Blog de Bismart: Últimas Noticias en Datos, IA y Business Intelligence

El data governance y su relación con el data quality

Escrito por Maria Gorini | 29-oct-2019 12:00:14

Los datos tienen un gran valor para las empresas por la competitividad y diferenciación que ofrecen. Sin embargo, se encuentran en constante observación y análisis desde un punto de vista legal, por las regulaciones a los que están sometidos, que exigen seguridad, integridad y control. Es evidente que toda empresa que trate con datos debe tener una política de gobierno de datos o data governance que sea la base para una gestión de datos o data management que permita solventar problemas con el flujo de los datos y la confianza en ellos.

El data governance podría definirse como “el ejercicio de la autoridad, el control y la toma de decisiones compartida sobre la gestión de los activos de datos”. El data management, a su vez, consiste en la puesta en marcha de las políticas de datos.

Es importante no confundir ninguno de estos conceptos con el Master Data Management, que consiste en conseguir la integración de los datos maestros de una organización para que puedan utilizarse a través de sistemas y departamentos distintos.

¿Por qué es importante?

Muchas veces, las políticas de data governance aparecen a medida que la empresa crece y dispone de más datos que le permitan ser más competitiva, identificar puntos de mejora, desarrollar productos, mejorar la experiencia del cliente, etc., aunque las razones principales para desarrollar una política de data governance son las regulaciones y el riesgo, por lo que la empresa debe contar con datos de alta calidad. De hecho, muchas regulaciones comprueban el cumplimiento fijándose en el aspecto de la seguridad de los datos.

Así pues, el objetivo de data governance es garantizar la integridad de los activos de datos a través de procesos y procedimientos, estandarización de sistemas y creación de políticas de distribución de datos consistentes.

Principios de data governance

1. Integridad. Que todos los procesos a los que se sometan los datos tengan como uno de los objetivos mantener la integridad de los datos.

2. Ciclo de vida. Debemos poder seguir el rastro de los datos, desde su origen, pasando por todos sus estados, procesos y destino.

3. Seguridad. Debemos velar por la privacidad y confidencialidad de los datos definiendo niveles y perfiles y a la atorgación de autorizaciones. 

4. Calidad. Deben definirse, controlarse y mejorarse los procesos para mantener intactas la completitud, exactitud, consistencia, conformidad, fiabilidad y unicidad de los datos.

5. Linaje de datos. Debemos poder trazar los datos para aumentar la fiabilidad del business intelligence y minimizar riesgos. 

6. Apoyar la misión de gobierno de datos. El gobierno de datos es algo que debe contar con el apoyo de la empresa al completo. Debemos garantizar la accesibilidad, disponibilidad, calidad, coherencia, verificabilidad y seguridad del dato. Solo así podremos garantizar un control absoluto sobre los activos de datos. 

7. Establecer reglas aplicables a los datos fuera de las bases de datos. Debemos establecer propietarios de datos que sean responsables de su gestión y planes a corto, medio y largo plazo.

8. Data storage. Para maximizar la agilidad en las consultas, debemos concretar el almacenaje de los datos, tanto en lo referente a ubicación, como en volumen. 

Estado actual de la situación

El pasado 16 de octubre se celebró un evento en Madrid centrado en el data management llamado Data Management Summit. En el evento se llevó a cabo una mesa redonda en la que se trató el data governance. Los participantes relataron sus experiencias alrededor de los proyectos de data management y su visión del grado de madurez de la empresa española en relación con este tema. De las cuestiones a mano alzada que se plantearon en la mesa redonda se obtuvieron, entre otras conclusiones, que, aunque la dirección de las compañías está pensando ya en el gobierno de datos, todavía no hay mucho presupuesto dedicado a este aspecto y tampoco se ha implantado de forma general la cultura organizativa necesaria para ejecutar los proyectos con éxito.

¿Qué es data quality?

Los datos son de calidad cuando cumplen una serie de objetivos: exactitud, relevancia, integridad y comprensión, pero, sobre todo, cuando satisfacen los requerimientos del uso que se le va a dar. Así, las empresas disponen de datos de buena calidad cuando pueden utilizarlos para determinar las necesidades de los clientes y servirles eficientemente, si bien es cierto que esta visión ya está quedando obsoleta. Ahora las empresas están empezando a centrarse en garantizar la calidad de los datos de forma transversal. A partir de aquí, concluimos que el data quality es el estado de calidad —o no— de los elementos de información de los que dispone una empresa.

Para conseguir datos de calidad, se pueden llevar a cabo varios procesos, como:

  • Limpieza
  • Estandardización
  • Perfilado
  • Geocodificación
  • Monitorización
Relación con el data governance

El data quality y el data governance convergen en los procesos que tienen por objetivo garantizar la credibilidad e integridad de los datos. Además, para poder cumplir con la legislación y regulaciones —lo cual forma parte del data governance—, los datos deben ser de alta calidad.

El data quality pone el foco en los datos mismos, en su uso y estado, mientras que el data governance se fija en la autoridad que los rige y en mantener un control sobre ellos. Dicho de otra forma, las preguntas que deberemos hacernos para determinar cada una de estas cuestiones son distintas, porque su punto de vista y enfoque sobre los datos son diferentes. Por ejemplo, una posible pregunta para determinar el estado de la política de data governance en la empresa podría ser "¿quién es responsable de qué aspectos de los datos?" y otra para data quality sería "¿cómo de útiles son mis datos en la empresa?". 

Estos dos conceptos difieren en el marco en el que se sitúan, aunque ambos son esenciales para una posterior gestión de datos maestros necesaria para conseguir una integración transversal en la organización