🎯 Situation
Le rapport de revenus mensuel d'un client montrait un écart de 240 000 $ entre ce que les ventes rapportaient et ce que la finance comptabilisait. Les deux équipes étaient confiantes dans leurs chiffres. Trois semaines d'investigation plus tard, la cause racine : un compte client avait été saisi avec deux identifiants différents dans le CRM — un utilisé par l'équipe commerciale, un créé automatiquement par le système de facturation. Personne ne possédait les données maîtres clients. Personne n'a remarqué le doublon pendant huit mois.
⚠️ Challenge
🔋 Les 4 défaillances de qualité des données les plus fréquentes
- Enregistrements en double — même client, fournisseur ou produit dans le système deux fois avec des noms légèrement différents
- Données obsolètes — champs exacts au moment de la saisie et jamais mis à jour (mauvaise adresse, vieux email, prix modifié)
- Valeurs manquantes — champs obligatoires laissés vides parce que le formulaire de saisie ne les imposait pas
- Formats incohérents — dates en JJ/MM/AAAA dans un système, MM-JJ-AAAA dans un autre ; revenus dans des devises différentes
👥 Ce que 'responsabilité' signifie vraiment
- Une personne ou équipe est responsable de chaque domaine de données critique (client, produit, fournisseur)
- Elle définit ce à quoi 'correct' ressemble — les règles métier pour des données valides
- Elle reçoit des alertes quand les métriques de qualité passent sous les seuils
- Elle a l'autorité pour faire appliquer les standards de saisie et rejeter les mauvaises données
- Elle consulte un dashboard de qualité des données chaque semaine — pas annuellement
🔍 Analyse
Un modèle de propriété des données assigne un 'data steward' à chaque domaine de données critique. Ce n'est pas un rôle IT — c'est un rôle métier. Le data steward pour les données clients est généralement quelqu'un dans les opérations commerciales ou le succès client. Pour les données produits, c'est généralement la gestion de produit ou les opérations. Pour les données financières, c'est la finance.
Le steward ne saisit pas chaque enregistrement lui-même. Il définit les standards, surveille la conformité et résout les litiges. Quand deux équipes ne sont pas d'accord sur le revenu d'un client, le data steward des données clients est l'arbitre.
✓️ Bonne pratique
Le cadre de qualité des données en 5 étapes :
- Définir les champs de données critiques pour chaque domaine — tous les champs n'ont pas la même importance. Un enregistrement client avec un mauvais numéro de téléphone est mauvais. Un enregistrement client avec une mauvaise adresse de facturation est un problème de revenu.
- Assigner un steward pour chaque domaine — une personne, avec un nom et une responsabilité documentée quelque part. Pas un comité.
- Définir 'valide' pour chaque champ — à quoi ressemble une date valide ? Un ID client valide ? Un code produit valide ? Le mettre par écrit.
- Construire un score de qualité en SQL — pourcentage d'enregistrements respectant chaque règle. Le connecter à Power BI. Réviser hebdomadairement.
- Définir des alertes de seuil — si le taux de doublons dépasse 2 % ou la complétude tombe sous 95 %, quelqu'un reçoit une notification le même jour.
💡 Synthèse
La qualité des données est le prérequis ingrat à tout le reste. Des définitions de KPIs propres, des pipelines automatisés et de beaux dashboards ne valent rien si les données sous-jacentes sont incohérentes, dupliquées ou manquantes. La responsabilité est la solution — pas la technologie. Assigner un steward. Définir valide. Mesurer chaque semaine.
👉 Aucun outil ne corrige un mauvais problème de responsabilité des données.
Assigner un steward. Définir valide. Mesurer chaque semaine. C'est tout le cadre.