La otra cara del `Self-Service Data Discovery´

 

Manuel del Pino, Presales Manager de Information Builders Ibérica  buena(2)

Una de las tendencias que más ha destacado en el universo del Business Intelligence durante los últimos cuatro años ha sido el ´self-service data discovery´. Se ha presentado a la industria como la solución a un amplio número de problemas: desde el análisis de grandes volúmenes de datos hasta la forma de aliviar la saturación en la que viven los departamentos de TI. Aunque el fenómeno del ´data discovery´ en modo auto-servicio parece sugerente, no es oro todo lo que reluce. Y, bajo nuestro punto de vista, adolece de tres inconvenientes principalmente:

El debate sobre el experto vs el coleccionista de tendencias

Conforme la burbuja del Big Data ha ido creciendo, numerosos especialistas se están planteando si la industria está defenestrando a los expertos del mundo de los datos, para apostar en cambio por herramientas muy básicas de `data discovery´ que exigen muy poca cualificación. Es cierto que progresivamente ha ido aumentando el número de usuarios que dentro de una organización cuentan con acceso a la información e incluso realizan ciertas labores de análisis con ella. Pero resulta fundamental que esas compañías tengan claro la formación que requieren sus empleados para afrontar actividades de analítica, sea cual sea su grado, antes de apostar por el ´self-service data discovery´. A la par, por fortuna en el mundo empresarial está emergiendo una nueva cultura en que las decisiones basadas en datos, en hechos, cada día gozan de más relevancia. Si bien, estas decisiones tienen su origen en el analista que, en los últimos años, no se está reciclando, ya que las nuevas herramientas de `data discovery´ no lo demandan. Y esto es un peligro.

El caso de los datos engañosos

La nueva era del BI y la analítica entronca con el conocido `storytelling´ de los datos. Y ya que los ´storyboards´ están sustituyendo paulatinamente a los cuadros de mando y a los reportes tradicionales, las empresas están hallando dificultades a la hora de encontrar narradores con talento. Las historias proporcionan una fórmula más simple para que las empresas puedan comprender la información que sustentan y explicar escenarios de una manera coherente.

Sin embargo, los datos también pueden arrojar explicaciones engañosas, a través de dos vías. Por un lado, cuando las correlaciones se entienden como causas. En lo relativo a los hábitos del consumidor, los falsos motivos y las inferencias de efecto generan confusión en torno al comportamiento del consumidor, y terminan incidiendo en el diseño erróneo de incentivos y promociones. ¿El resultado? Una inversión en marketing desperdiciada.

El segundo camino acontece cuando el usuario sólo tiene acceso a la información de manera limitada, pero de puertas afuera la organización afirma estar proporcionando toda la información necesaria para tomar decisiones con garantías. Como usuarios habitualmente nos olvidamos (consciente o inconscientemente) de la información limitada con la que contamos e ignoramos otras posibles opciones. Existe una errónea teoría que afirma que cuantos más datos tengamos, más probabilidades de éxito aunaremos. Un set muy extenso de datos puede contener sólo información parcial que no nos permitirá explicar el problema y que nos conducirá hacia una única teoría, aislando otras posibilidades.

La batalla entre datos mixtos y datos puros

Mezclar puede ser beneficioso en algunos aspectos. Habitualmente esta acción rebaja el valor del producto originario para obtener un resultado más económico. Pero cuando todo el mundo tiende a mezclar datos y se termina ignorando el origen y la fiabilidad de las mezclas, el resultado suele incidir en una reducción del conocimiento. Los estadistas que habitualmente combinan diversos activos de datos para su análisis saben que han de emplear una estricta documentación relativa a todas las fases del proceso, que facilite su verificación y reproducción conforme aterricen nuevos datos. Sin embargo, ¡el precio de este procedimiento es elevado! Los usuarios que deseen utilizar o incluso analizar los datos han de conocer la historia completa para interpretarlos correctamente.

En general, la mayoría de los inconvenientes del ´self-service data discovery´ provienen del error humano. El entusiasmo por la simplicidad es lícito, pero ésta suele conducir, por un lado, hacia una falta de formación palpable a la hora de afrontar los problemas en su completitud; y, por otro, hacia una relajación en la necesidad de respetar una serie de procesos. La aproximación al `data discovery´ basada en la individualidad genera silos analíticos. Para alcanzar una analítica más rápida y eficiente, las organizaciones han de conseguir que sus plataformas y herramientas sorteen todos estos obstáculos a través de estrategias de `self-service data discovery´ gobernadas y colaborativas.

Manuel del Pino, presales manager de Information Builders Ibérica

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *