🎯 Situación
El reporte de ingresos mensual de un cliente mostraba una discrepancia de $240,000 entre lo que reportaban ventas y lo que contabilizaba finanzas. Ambos equipos confiaban en sus cifras. Tres semanas de investigación después, la causa raíz: una cuenta de cliente había sido ingresada con dos IDs diferentes en el CRM — uno usado por el equipo de ventas, otro creado automáticamente por el sistema de facturación. Nadie era dueño de los datos maestros de clientes. Nadie notó el duplicado durante ocho meses.
⚠️ El reto
🔋 Las 4 fallas de calidad de datos más comunes
- Registros duplicados — mismo cliente, proveedor o producto en el sistema dos veces con nombres ligeramente diferentes
- Datos obsoletos — campos precisos cuando se ingresaron y nunca actualizados (dirección incorrecta, email viejo, precio cambiado)
- Valores faltantes — campos obligatorios dejados en blanco porque el formulario de entrada no los obligaba
- Formatos inconsistentes — fechas como DD/MM/AAAA en un sistema, MM-DD-AAAA en otro; ingresos en diferentes monedas
👥 Lo que 'propiedad' realmente significa
- Una persona o equipo es responsable de cada dominio de datos crítico (cliente, producto, proveedor)
- Definen cómo se ve lo 'correcto' — las reglas de negocio para datos válidos
- Reciben alertas cuando las métricas de calidad caen por debajo de los umbrales
- Tienen la autoridad para hacer cumplir los estándares de entrada y rechazar datos incorrectos
- Revisan un dashboard de calidad de datos semanalmente — no anualmente
🔍 Análisis
Un modelo de propiedad de datos asigna un 'data steward' a cada dominio de datos crítico. Este no es un rol de IT — es un rol de negocio. El data steward para datos de clientes generalmente es alguien en operaciones de ventas o éxito del cliente. Para datos de productos, generalmente es gestión de productos u operaciones. Para datos financieros, es finanzas.
El steward no ingresa cada registro él mismo. Define los estándares, monitorea el cumplimiento y resuelve disputas. Cuando dos equipos no están de acuerdo sobre los ingresos de un cliente, el data steward de datos de clientes es el árbitro.
✓️ Buena práctica
El marco de calidad de datos en 5 pasos:
- Definir los campos de datos críticos para cada dominio — no todos los campos importan igualmente. Un registro de cliente con número de teléfono incorrecto es malo. Un registro de cliente con dirección de facturación incorrecta es un problema de ingresos.
- Asignar un steward para cada dominio — una persona, con un nombre y una responsabilidad documentada en algún lugar. No un comité.
- Definir 'válido' para cada campo — ¿cómo es una fecha válida? ¿Un ID de cliente válido? ¿Un código de producto válido? Escribirlo.
- Construir un puntaje de calidad en SQL — porcentaje de registros que cumplen cada regla. Conectarlo a Power BI. Revisar semanalmente.
- Establecer alertas de umbral — si la tasa de duplicados supera el 2% o la completitud cae por debajo del 95%, alguien recibe una notificación el mismo día.
💡 Síntesis
La calidad de datos es el prerrequisito ingrato para todo lo demás. Las definiciones limpias de KPIs, los pipelines automatizados y los dashboards hermosos no valen nada si los datos subyacentes son inconsistentes, duplicados o faltantes. La propiedad es la solución — no la tecnología. Asignar un steward. Definir válido. Medir semanalmente.
👉 Ninguna herramienta arregla una mala propiedad de datos.
Asignar un steward. Definir válido. Medir semanalmente. Ese es todo el marco.