"Bonjour à tous et bienvenue pour ce troisième épisode de Kézako.data.
Je me présente Stéphan Verdier, Directeur du Pôle Data Management de Kwanzeo.
Aujourd'hui, je vais vous parler de « Comment réussir un projet Master Data Management ».
Dans cet épisode, nous allons faire un rappel de l'épisode 2 sur le Master Data Management, aborder et détailler les quatre points suivants :
2. Où sont les données
3. La qualité des données
4. L'organisation du projet
5. La formalisation du besoin
1. Le Master Data Management
Dans cette partie, nous allons répondre aux questions suivantes :
> Qu'est-ce que le Master Data Management ?
> Quel est l'objectif du Master Data Management ?
> Quel est l'écosystème d'un Intelligent Data Hub ?
> Qu'est-ce que le Master Data Management ?
- Un MDM centralise toutes les Données de Référence en un point unique le GOLDEN RECORD !
- Un MDM propose des processus de standardisations, de normalisations, de consolidations, de nettoyage des doublons, de propagations et de traçage des données de référence pour une entreprise.
- Un MDM propose aussi des outils de reporting et de découverte de la donnée, de l´exposition de service de création, modification et consultation des données.
> Quel est l'objectif du Master Data Management ?
Son objectif est de :
- Centraliser, standardiser, réconcilier, publier une information qui correspond au business de l´entreprise ;
- Simplifier la prise de décision métier sur les nouveaux besoins et faciliter sa mise en place dans l´organisation.
Mais aussi simplifier la prise de décision côté équipe IT sur la rationalisation des échanges et l´homogénéisation des données.
- Enrichir l´information grâce à un processus de certification qui correspond aux besoins définis par le métier c'est-à-dire centralisation, standardisation, normalisation, vérification des informations, publication du Point de Vérité.
L´lntelligent Data Hub est le nouveau terme pour parler du Master Data Management.
> Quel est l'écosystème d'un Intelligent Data Hub ?
En formant un « Hub de données », l´outil permet de contrôler le flux de données de référence, de l´enrichir, d´améliorer sa qualité et
d'instaurer des moyens de gouvernance.
Le Hub permet de disposer d´une vision complète et coordonnée des données de référence au sein de l´organisation, de l´entreprise. Il offre les moyens de pouvoir diffuser et/ou d'orchestrer l´usage et l´actualisation de ses données.
L'ensemble des briques du SI (opérationnelles et décisionnelles) fourniront un service bien plus efficace !
2. Où sont les données ?
Dans cette partie nous allons répondre aux questions suivantes :
> Quel est le nombre d´application où la donnée est présente ?
> Quel est le nombre d´interaction de la donnée avec le Data Hub ?
> Quel est le type de la donnée ?
> Quelle est l´équipe en charge de la donnée ?
> Quel est le nombre d´application où la donnée est présente ?
- Si la donnée est présente dans une seule application, celle-ci ne doit pas apparaître dans le Data Hub car cela n´apporte aucune valeur ajoutée.
- Si la donnée est présente dans plusieurs applications. Celle-ci sera normalisée, standardisée, complétée, vérifiée, homogénéisée et centralisée par le Data Hub pour être diffusée au système d´information afin d´apporter de la valeur ajoutée.
> Quel est le nombre d´interaction de la donnée avec le Data Hub ?
- Si la donnée transite plusieurs fois par jour afin d´être stockée dans les applications ce n´est pas une donnée de référence et ne doit pas être présente dans le Data Hub.
- Si la donnée transite ponctuellement en cas de modification et que celle-ci est stockée dans plusieurs application alors la donnée doit être présente dans le Data Hub.
> Quel est le type de la donnée ?
- Si la donnée évolue ponctuellement alors c´est une donnée de référence.
- Si la donnée est volatile et évolue constamment alors c´est une donnée opérationnelle.
> Quelle est l´équipe en charge de la donnée ?
Une fois que les données de référence sont recensées, la connaissance d´une équipe garante est nécessaire et primordiale afin d´éviter des difficultés en cas d´arbitrage manuel à appliquer dans le Data Hub.
Quel que soit le type de règles ou de processus automatiques réalisés, en cas d´arbitrage, une action « humaine » devra être effectuée sur la donnée pour apprendre au système à évoluer.
3. La qualité des données
Dans cette partie nous allons répondre aux questions suivantes :
> Quand doit-être traitée la qualité de la donnée ?
> Qui doit qualifier la donnée ?
> Comment préparer les données ?
> Quand doit-être traitée la qualité de la donnée ?
Dès le démarrage du projet, la vérification des données qui seront présentes dans le Data Hub doivent être prises en compte.
La qualité de la donnée du système d´information avant le paramétrage du Data Hub donne des indicateurs sur l´hétérogénéité, la normalisation, l´accessibilité à l´information.
En fonction de ces indicateurs, la gouvernance de la donnée sera plus ou moins complexe à effectuer.
> Qui doit qualifier la donnée ?
- Qui connait le plus les données au sein de l´entreprise ?
1. Les utilisateurs
2. Les métiers
- La qualification de la donnée est une tâche qui incombe aux équipes métiers. Les équipes IT sont là pour les aider dans cette tâche.
- Les équipes peuvent s´appuyer sur des outils de découverte de la donnée présents dans le Data Hub ou des outils de reporting de Business Intelligence.
> Comment préparer les données ?
- Une fois les données recensées, les équipes métiers et IT doivent travailler conjointement :
1. Les équipes métiers écrivent les règles pour redresser les données
2. Les équipes IT réalisent les scripts et les patchs à appliquer sur les applications
- Ce travail entre les équipes métiers et IT est cruciale, prend énormément de temps en fonction de la qualité des données existante, du nombre d´application et de la disponibilité des équipes.
4. L'organisation du projet
Dans cette partie, nous allons répondre aux questions suivantes :
> Quelles sont les parties prenantes identifiées sur le projet ?
> Quelle est la capacité à faire de chaque partie prenante sur le projet ?
> Quelle est la méthode projet la plus adaptée à la mise en œuvre d´un Data Hub ?
> Quelles sont les parties prenantes identifiées sur le projet ?
Un Data Hub est un projet d´entreprise qui a pour but d´urbaniser, rationaliser et centraliser les informations à forte valeur ajoutée afin de pérenniser et d´augmenter le business de l´entreprise.
Il est important d´avoir si possible des personnes de chaque équipe.
- Sponsors métiers
- PMO
- Maîtrise d´ouvrage
- Assistance à maîtrise d´ouvrage
- Architecte fonctionnel
- Utilisateurs
- Sponsors DSI
- Maîtrise d´œuvre
- Assistance à maîtrise d´œuvre
- Architecte technique
- DevOps
- Infrastructure et Exploitation
> Quelle est la capacité à faire de chaque partie prenante sur le projet ?
La capacité à faire sur le projet de chacune des parties prenantes doit être estimée et connue par l´ensemble des équipes afin d´estimer les jalons.
Cette démarche va permettre d´avoir une vision claire à court et moyen terme :
- Moyens mis en place en termes de personne et de coût
- Avancement projet
- Arbitrage
- Indicateurs de suivi, reporting, KPI
> Quelle est la méthode projet la plus adaptée à la mise en œuvre d´un Data Hub ?
La méthode Scrum offre plusieurs avantages sur des projets d´entreprises :
1. Les cérémonies sont planifiées sur des jours exacts.
2. Un Stand Up Meeting est organisé par les équipes tous les jours.
3. Les Sprints (Itérations) sont de 2 à 3 semaines avec une démonstration du produit à livrer en fin de sprint.
4. Pendant les sprints, les équipes métiers avec leur Product Owner écrivent les user-stories (Fonctionnalités) qui seront implémentées par les équipes Scrum sur le sprint suivant.
La méthode Scrum donne de la visibilité à l´ensemble de l´organisation.
Si l´entreprise ne connait pas cette méthode, il est conseillé de faire appel à un Coach Agile.
(Voir schéma)
5. La formalisation du besoin
Dans cette partie, nous allons répondre aux questions suivantes :
> Qui formalise le besoin ?
> Qui implémente le besoin ?
> Qui recette le besoin ?
> Qui livre le besoin ?
> Exemple de planning pour un MVP
> Qui formalise le besoin ?
- La formalisation du besoin incombe aux métiers.
- La formalisation du cahier des charges, du pré-cadrage et du cadrage, des user-stories, des Backlogs incombe aux métiers.
- Les équipes IT accompagnent les équipes métiers en termes de recommandations et de faisabilités du besoin.
- La rédaction des documentations de mise en œuvre incombe aux équipes IT.
> Qui implémente le besoin ?
Les équipes Scrum composées des équipes IT et Infrastructure implémentent le besoin en fonction du Backlog, des sprints et des priorités fournis par le Product Owner.
> Qui recette le besoin ?
- Les équipes Scrum et les équipes métiers recettent le besoin;
- Les équipes Scrum recettent techniquement;
- Les équipes métiers recettent fonctionnellement.
> Qui livre le besoin ?
La livraison sur les environnements métiers et en production ne peut se faire sans l´accord du Product-Owner.
C´est l´équipe Scrum qui livre le besoin sur les environnements demandés.
> Exemple de planning pour un MVP
Cet exemple (cf. tableau) montre le Sprint 0 de 8 semaines pour réaliser et déployer le MVP en production.
Un MVP permet de mettre en production un périmètre restreint du projet afin d´éprouver le Data Hub dans son nouvel écosystème et ainsi adapter les différents paramétrages ou réglages pour le rendre plus optimum.
La durée du Sprint 0 peut varier en fonction des besoins en termes de workflows, d´interfaces utilisateurs et d´intégration des données.
Je vais détailler chaque tâche pour vous aider à les appréhender :
Dans la gouvernance MDM :
1. Etablir des objectifs et des rôles c´est :
- Définir les objectifs du projet ;
- Définir les rôles qui doivent être engagés dans le processus ;
- Définir l´équipe projet MDM ;
- Valider l´objectif avec la direction ;
- Trouver Le ou les sponsors.
2. Participation des parties prenantes c´est :
- Identifier les parties prenantes ;
- Définir les rôles de chacun ;
- Impliquer la direction ;
- Impliquer l´équipe projet ;
- Impliquer les équipes des applications sources ;
- Exprimer et Communiquer sur les facteurs-clé de réussite ;
- Créer l´équipe de Gouvernance de la donnée.
3. Gérer les activités et la gouvernance c´est :
- Mesurer les objectifs clés en fonction des réalisations ;
- Mettre en place des rapports précis sur les activités de MDM et des Master Data ;
- Identifier les Data Owners et les Process Owners ;
- Proposer des améliorations futures et planifier les prochaines itérations ;
- Gérer le backlog.
4. Communiquer les réalisations c´est :
- Informer les cadres et tous les membres de l'équipe ainsi que les consommateurs de données de l'état d'avancement du projet MDM ;
- Définir clairement les buts et les objectifs du projet ;
- Expliquer le retour sur investissement de la qualité des données à l'aide de métriques de performance clés ;
- Gagner en visibilité au niveau de l´entreprise.
Implémentation du MDM :
1. Mise en place et formation c´est :
- Créer les environnements de développement et de recette ;
- Planifier la création des environnements de qualification production ;
- Former les personnes sur xDM Semarchy.
2. Découverte des données c´est :
- Identifier les applications sources ;
- Identifier les entités sources et les relations ;
- Comprendre la sémantiques des attributs sources ;
- Profiler les données sources ;
- Déduire les données de référence, les listes de valeurs et les nomenclatures ;
- Identifier les processus de Consultation, Création, Modification, Suppression des sources de données ;
- Identifier les règles existantes sur les données (Validation, Enrichissement, Normalisation et Standardisation) ;
- Identifier les processus existants d'intégration et de circulation des données entre les applications ;
- Documenter tous les points cités.
3. Modélisation c´est :
- Concevoir les principales entités du MDM ;
- Clairement définir les listes de valeurs, les nomenclatures et les données de référence ;
- Définir les attributs minimums nécessaires dans MDM ;
- Mettre en place le dictionnaire de données ;
- Créer les relations et les cardinalités entre les entités du MDM ;
- Revoir les choix de la modélisation avec l'équipe de gouvernance de la donnée.
4. Paramétrage des règles c´est :
- Définir les règles de validation sur les attributs, les listes de valeurs, les nomenclatures, les clés primaires, les clés étrangères, les plug-ins ;
- Définir les règles d´enrichissement, de normalisation, de standardisation ;
- Définir les règles de rapprochement ; Définir les règles de survies (anciennement règles de consolidation) en fonction des applications ;
- Revoir les choix de la modélisation avec l'équipe de gouvernance de la donnée.
5. Paramétrage des workflows utilisateurs c´est :
- Définir les étapes de création des données de base (steppers) et les workflows utilisateurs dans MDM ;
- Définir les workflows collaboratifs pour les data owners des données sources ;
- Définir les étapes de gestion des données rejetées dans les workflows ;
- Identifier et Implémenter les règles d'attribution des tâches ;
- Implémenter les tâches ;
- Implémenter les tâches, les transitions et les comportements liés aux workflows.
6. Paramétrage des interfaces utilisateurs c´est :
- Définir et Implémenter les écrans de l´application ;
- Définir les accès hiérarchiques aux données (drill-down) ;
- Afficher les informations qui ont le plus de valeurs ajoutées pour l´entreprise ;
- Définir les actions autorisées pour les utilisateurs ;
- Définir la structure de l´application ;
- Appliquer le Branding de l´entreprise sur l´application.
7. Politique de sécurité et rôles c´est :
- Définir les rôles dans la plate-forme MDM ;
- Paramétrer les politiques d'accès aux données horizontales et verticales pour chaque rôle ;
- Identifier et se connecter à l'annuaire utilisateurs de l'entreprise.
8. Intégration des données sources c´est :
- Connecter l´ETL aux applications sources ;
- Implémenter le mapping entre les applications sources et le modèle de données MDM ;
- Définir et implémenter la transformation des données ;
- Implémenter le processus d´intégration (Job d´intégration) ;
- Mise en place d'une stratégie de programmation pour la collecte des données sources ;
- Implémenter chaque mécanisme de collecte des données sources.
9. Intégration des données cibles c´est :
- Identifier les applications qui vont consommer la donnée ;
- Concevoir les processus pour alimenter les applications consommatrices (ETL, Java APIs, RESTful web services, Export Microsoft Excel ou CSV).
10. Questions / Réponses / Déploiement du MVP c´est :
- Préparer le MDM pour les tests UAT ;
- Exécuter le plan de tests UAT, itérer et corriger les bugs ;
- Déployer les modèles sur les environnements de recette et qualification ;
- Déployer le MDM sur l´environnement de production ;
- Déployer les flux d´intégration des données des applications sources ;
- Déployer les flux d´intégration des données des applications cibles ;
- Célébrer la mise en production du MVP
Consulter l´éditeur, c´est être accompagné sur les points critiques du projet pour paramétrer le Data Hub dans les meilleures conditions.
Pour les prochains épisodes, je vais aborder quelles sont les erreurs à éviter sur un projet de Master Data Management (Episode 4).
Merci d'avoir suivi ce troisième épisode de Kezako.data MDM - Data Hub, n'oubliez pas de vous abonner à notre chaîne YouTube et pour toutes questions ou projets, contactez-moi par mail à : [email protected] ou en remplissant le formulaire.
Stéphan"