Consejos para que las empresas mejoren la calidad de sus datos (parte 2)

La calidad de los datos es algo por lo que cualquier organización debería preocuparse, y mucho. A diferencia del pasado, ahora confiamos en los datos de manera impensable hace 20 años. Si bien para que esta nueva mentalidad resulte efectiva, es prioritario que cualquier organización atienda a una serie de consejos que hemos desarrollado para Grupo NED en dos artículos. Analicemos ahora los tres últimos:

  1. Construir reglas de negocio de manera acumulativa

Cuando decida construir una nueva regla de negocio dirigida a la limpieza de datos, es mejor hacerlo sobre las reglas ya desarrolladas –hay que dejar que las reglas fluyan, y luego añadir cualquier nuevo requisito al final, si es posible-. También asegúrese de transportar los datos originales junto a los datos cualificados durante todo el proceso. Esto le ayudará a ubicar el lugar donde se ha producido cualquier cambio no deseado y revertirlo a una fase inicial del dato si fuera necesario.

Debería recordar dos aspectos: por un lado, si sus registros del data warehouse incluyen valores de sistemas operacionales, debería usar valores operacionales para emparejar procesos y no preocuparse de re-limpiar los datos operacionales; y, por otro, si va a colocar de vuelta los datos cualificados en sus sistemas operacionales, así como en sus data warehouses, asegúrese de que las reglas de limpiado pueden devenir o  no en datos.

  1. No dejar en manos del departamento de TI la gestión de los estándares de datos

Al menos dos departamentos de negocio de su compañía deberían velar porque los estándares que rigen sus datos sean aceptables. Si solo cuenta con uno, su CDO (Chief Data Officer) debería supervisar que los metadatos se encuentran correctamente gestionados y que las dimensiones se hayan estructuradas. Un alto nivel de supervisión beneficia a estándares del tipo formato, estandarización de incidentes, niveles jerárquicos, normas apropiadas para métricas, formatos de fechas y anotaciones monetarias.

Una vez que haya limpiado y estandarizado las dimensiones, publíquelas allá donde los departamentos de negocio puedan estudiarlas. El CDO debería anunciarlas para que todos los miembros del equipo usen versiones coherentes en materia de dimensionalidad.

  1. Conocer la diferencia entre limpiar y masterizar datos

Cuando su proyecto está orientado a objetivos, y no a fuentes, debe tener en cuenta que se está moviendo desde el proceso de limpieza de datos al de masterización. Existen muchos escalones que simulan la limpieza de datos pero que realmente son de gestión de datos maestros (MDM). Por ejemplo, si hay tres niveles de datos entrantes que operan como categorías de una marca de retail, ejecute el proceso de match-merge para encontrar los artículos perdidos y situarlos en la marca correcta. Se trata de un ejemplo de cómo mover los datos en el contexto de la estructura jerárquica para conseguir los resultados correctos.

También es importante comprender la jerarquía, el registro dorado, para determinar cómo se deberían organizar estas marcas, y cómo se deberían analizar las fuentes de datos, con objeto de afianzar esa determinación.

 

Manuel del Pino, manager preventa de Information Builders Ibérica

 

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *