Kezako.data Découvrir le Master Data Management Episode 1. Glossaire
Transcription du Kezako.data :
Episode 1. Glossaire du Master Data Management
Présenté par Stéphan, Directeur du Pôle Data Management de Kwanzeo
Bonjour à tous et bienvenue pour ce premier épisode de Kezako.data.
Je me présente Stéphan Verdier, Directeur du Pôle Data Management de Kwanzeo. Aujourd’hui, je vais vous parler du glossaire autour du MDM.
Dans cet épisode, nous allons aborder et détailler les quatre points suivants :
- Le Master Data Management
- Le lexique du MDM
- Le lexique des objets
- Le lexique des contrôles
1. Le Master Data Management
Dans cette partie, nous allons répondre aux questions suivantes :
- Qu’est-ce que le Master Data Management ?
- Quel est l’objectif d’un Master Data Management ?
Qu’est-ce qu’un Master Data Management (MDM) ?
- Un MDM centralise toutes les données de référence en un point unique : le Golden Record.
- Un MDM propose des processus de standardisation, de normalisation, de consolidation, de nettoyage des doublons, de propagation et de traçage des données de référence pour une entreprise.
- Un MDM propose aussi des outils de reporting et de découverte de la donnée, de l’exposition de services, de création, modification et consultation des données.
Quel est l’objectif du Master Data Management ?
- Premièrement, centraliser, standardiser, réconcilier et publier une information qui correspond au business de l’entreprise.
- Deuxièmement, simplifier la prise de décisions métiers sur les nouveaux besoins et faciliter sa mise en place dans l’organisation. Mais aussi simplifier la prise de décisions côté équipe IT sur la rationalisation des échanges et l’homogénéisation des données.
- Troisièmement, enrichir l’information grâce à un processus de certification qui correspond aux besoins définis par le métier (standardisation, normalisation, vérification des informations, publications du point de vérité, …).
L’Intelligent Data Hub est le nouveau terme pour parler du Master Data Management.
2. Le lexique du Master Data Management
Dans cette partie, nous allons répondre aux questions suivantes :
- Qu’est-ce qu’un Golden Record ?
- Qu’est-ce qu’un Master Record ?
- Qu’est-ce qu’un Source Record ?
Qu’est-ce qu’un Golden Record ?
Le Golden Record est la vision Business de l’entreprise pour une activité.
On peut donc représenter un Golden Record comme un client, un fournisseur, un collaborateur, un contrat par exemple, …
Un Golden Record se caractérise par les éléments suivants :
- Le Golden Record est aussi appelé « Point de vérité » ou « Point unique de vérité ».
- Le Golden Record centralise les informations de référence qui seront propagées à l’ensemble du système d’information.
- Le Golden Record a pour but de fournir des données à forte valeur ajoutée afin de pérenniser et d’augmenter la productivité de l’entreprise.
- Le Golden Record est constitué d’un regroupement de Master Records.
Qu’est-ce qu’un Master Record ?
Un Master Record équivaut à la Vision Business consolidée de l’entreprise pour une activité d’une application.
On peut donc représenter un Master Record, là aussi, comme un client, un fournisseur, un collaborateur, un restaurant, un contrat par exemple… Mais cette fois-ci, nous sommes au niveau des informations consolidées des applications du Système d’Information.
J’entends par données consolidées, une donnée qui est passée par des enrichissements afin d’augmenter la qualité de l’information provenant des applications…
Un Master Record se caractérise par les éléments suivants :
- Le Master Record est aussi appelé « Donnée consolidée par application ».
- Le Master Record regroupe les informations de référence qui serviront à la constitution du Golden Record.
- Le Master Record contient des données standardisées, normalisées, enrichies et validées.
- Le Master Record est constitué d’un regroupement de Source Records rassemblés par application.
Qu’est-ce qu’un Source Record ?
Le Source Record équivaut à la Vision Business de l’entreprise brute pour une activité d’une application.
On peut donc représenter un Source Record comme un client, un fournisseur, un collaborateur, un contrat par exemple… Mais cette fois-ci, au niveau des informations brutes pour chacune des applications telles qu’elles sont dans le Système d’Information.
J’entends par donnée brute, une donnée qui n’a pas été traitée et qui correspond à 100% à la donnée de l’application.
Un Source Record se caractérise par les éléments suivants :
- Le Source Record est aussi appelé « Donnée brute par application ».
- Le Source Record regroupe les informations de référence qui serviront à la constitution du Master Record.
- Le Source Record contient des données hétérogènes, doublonnées, non-standardisées et non contrôlées.
- Le Source Record est constitué d’un ensemble d’informations provenant de plusieurs applications.
En résumé :
- Les Golden Records sont des points de vérité calculés en fonction d’un regroupement de Masters.
- Les Master Records correspondent aux données consolidées par application.
- Les Source Records correspondent à la donnée brute envoyée par les applications. À ce niveau, nous pouvons créer des enrichissements et des contrôles sur la donnée afin d’améliorer la qualité des informations.
Pour résumer, les Sources forment des Masters et un ensemble de Masters forment un Golden. Les informations du Golden seront diffusées au Système d’Information.
3. Le lexique des objets
Le lexique des objets qui sont utilisés dans un Master Data Management
Dans cette partie, nous allons répondre aux questions suivantes :
- Qu’est-ce qu’une entité ?
- Qu’est-ce qu’un attribut ?
- Qu’est-ce qu’une nomenclature ?
- Qu’est-ce qu’un transcodage ?
Qu’est-ce qu’une Entité ?
Une entité est une activité de l’entreprise… Un client, un fournisseur, un restaurant, un bénéficiaire, un contrat.
Une Entité se caractérise par les éléments suivants :
- Une Entité est une Vision Business de l’entreprise sur une activité.
- Une Entité a pour but de fournir des Golden Records à forte valeur ajoutée afin de pérenniser et d’augmenter la productivité de l’entreprise.
- Une Entité est un regroupement de Golden Record, de Master Record, et de Source Record.
- Une Entité historise toutes les modifications du domaine d’activité.
- Une Entité possède un ensemble d’attributs de référence.
Qu’est-ce qu’une Entité ? Il y a au minimum trois tables dans lesquelles l’Entité apparaît : les tables « Source », les tables « Master » et les tables « Golden ».
- Les tables « Source » :
Elles correspondent à la donnée brute envoyée par les applications. À ce niveau, nous pouvons créer des enrichissements et des contrôles sur la donnée afin d’améliorer la qualité des informations. - Les tables « Master » :
Elles correspondent aux données consolidées par application. - Les tables « Golden » :
Elles sont des Points de vérité qui sont calculées en fonction d’un regroupement de « Masters ».
Pour résumer, les Sources forment des Masters et un ensemble de Masters forme un Golden.
Les informations du Golden seront diffusées au système d’information.
Qu’est-ce qu’un Attribut ?
Un Attribut est une donnée de référence de l’Entité de l’entreprise : un siret, une raison sociale, une adresse, un moyen de communication, un nom ou un prénom, …
Un Attribut se caractérise par les éléments suivants :
- Un Attribut est une vision Business de l’entreprise sur un point de l’activité.
- Un Attribut a pour but de fournir une information à forte valeur ajoutée, pérenne, normalisée, enrichie et validée.
- Un Attribut historise toutes les modifications du Point d’activité qui lui sont propres.
- Un Attribut est une référence utilisée dans les entités.
- Un Attribut, au même titre qu’une entité, est présent au niveau Golden Record, Master Record et Source Record.
Qu’est-ce qu’une Nomenclature ?
Une Nomenclature est une classification de référence du Système d’Information.
Une Nomenclature se caractérise par les éléments suivants :
- Une Nomenclature est une information de classification dans le cadre de l’activité d’une entreprise.
- Une Nomenclature a pour but de normaliser les références de l’entreprise. Un pays, une catégorie, un échelon sont des exemples de Nomenclature.
Qu’est-ce qu’un Transcodage ?
Un Transcodage est une relation entre les différentes classifications du Système d’Information.
Un Transcodage sert à faire communiquer des informations hétérogènes dans le but de faciliter le dialogue. C’est comme un traducteur : au lieu de traduire une langue vers une autre, cela traduit des données vers d’autres données.
Un Transcodage se caractérise par les éléments suivants :
- Un Transcodage sert à faire communiquer des classifications hétérogènes du Système d’Information.
- Un Transcodage sert de pont entre les Nomenclatures du MDM et les applications qui communiquent avec lui.
4. Le lexique des contrôles
Le lexique des contrôles qui sont utilisés dans un Master Data Management.
Dans cette partie, nous allons répondre aux questions suivantes :
- Qu’est-ce qu’un Job d’intégration ?
- Qu’est-ce qu’une règle d’enrichissement ?
- Qu’est-ce qu’une règle de validation ?
- Qu’est-ce qu’une règle de rapprochement ?
- Qu’est-ce qu’une règle de survie ?
- Qu’est-ce qu’un Stepper ?
- Qu’est-ce qu’un jeu d’action ?
- Qu’est-ce qu’une vue ?
- Qu’est-ce qu’un workflow ?
Qu’est-ce qu’un Job d’intégration ?
Le Job d’intégration permet de certifier la donnée grâce à l’ensemble des règles qui auront été définies par les « Métiers » :
- Règle d’enrichissement
- Règle de validation
- Règle de rapprochement
- Règle de survie
Un Job d’intégration se caractérise par les éléments suivants :
- Un Job d’intégration déclenche une file de certification qui enrichira les données de référence afin de créer des Golden Records.
- Une file de certification est un ensemble d’étapes de certification de la donnée dans le but de propager une donnée à forte valeur ajoutée.
Voici un schéma simplifié de la file de certification :
- Les données arrivent dans les tables Sources.
- À ce niveau, on peut paramétrer des enrichissements.
- Ensuite, on passe dans les contrôles de validation.
- Si le contrôle passe, cela crée les Masters par application.
- Ensuite, le rapprochement entre les Masters se réalise, les règles de survie s’appliquent et si les informations sont validées on crée le « Golden ».
- Au niveau de ce « Golden », il est encore possible de réaliser un enrichissement.
Qu’est-ce qu’une Règle d’enrichissement ?
Un enrichissement sert à améliorer l’information.
C’est standardiser, normaliser, enrichir et obtenir des informations complémentaires.
Une Règle d’enrichissement se caractérise par :
- Une Règle d’enrichissement normalise, standardise, enrichit et complète une donnée de référence.
- Une Règle d’enrichissement s’applique au niveau des Source Records.
- Avant consolidation : se déclenche au niveau des Source Records.
- Après consolidation : se déclenche au niveau des Golden Records.
- Avant consolidation : se déclenche avant les règles de validation au niveau des Source Records.
- Après consolidation : se déclenche après les règles de validation au niveau des Golden Records.
Sur le schéma de la file de certification, nous voyons que les règles d’enrichissement se déclenchent au niveau des Source Records et des Golden Records.
Qu’est-ce qu’une Règle de validation ?
Une Règle de validation contrôle l’information et détermine si elle est valide pour poursuivre le traitement.
Une Règle de validation se caractérise par :
- Elle contrôle la donnée de référence et détermine si celle-ci est valide afin d’éviter de propager une donnée de mauvaise qualité.
- Elle s’applique au niveau des Source Records et à la constitution des Golden Records.
- Avant consolidation : se déclenche au niveau des Source Records (après les règles d’enrichissement).
- Après consolidation : se déclenche au niveau de la constitution des Golden Records (avant les règles d’enrichissement).
Sur le schéma de la file de certification, les règles de validation se déclenchent au niveau de la création des Master Records et des Golden Records.
Qu’est-ce qu’une Règle de rapprochement ?
Il existe deux types de Règle de rapprochement :
- Le rapprochement flou : permet de créer un Golden en fonction de plusieurs Attributs.
- Le rapprochement par ID : permet de créer le Golden en fonction d’un seul Attribut (par exemple un matricule).
Une Règle de rapprochement se caractérise par :
- Elle crée un Golden Record.
- Elle compare les Master Records deux à deux afin de créer un « groupe de Masters » qui constituera le Golden Record.
- Ce groupe est noté de 0 à 100.
- Des seuils paramétrables déterminent si un Master fait partie du Golden Record.
Sur le schéma de la file de certification, les règles de rapprochement se déclenchent à la création des Golden Records.
Qu’est-ce qu’une Règle de survie ?
Une Règle de survie permet de savoir quelle information afficher dans le Golden Record en fonction de ses Master Records.
Une Règle de survie se caractérise par :
- Elle détermine, attribut par attribut, ce qui est affiché dans le Golden Record en fonction des informations présentes dans les Master Records.
Sur le schéma de la file de certification, les règles de survie se déclenchent à la création des Golden Records.
Qu’est-ce qu’un Stepper ?
Un Stepper représente les différentes étapes à réaliser par un utilisateur pour créer ou modifier des informations.
Un Stepper se caractérise par :
- Il simplifie le processus de création ou modification en évitant d’afficher trop d’informations à l’écran.
- Il est utilisé dans des Workflows ou des Jobs d’intégration précis.
Qu’est-ce qu’un Jeu d’action ?
Un Jeu d’action se représente sous forme d’un menu d’opérations réalisables par l’utilisateur.
Un Jeu d’action se caractérise par :
- Il détermine les actions réalisables pour un utilisateur.
- Il déclenche des Workflows, des Steppers, des imports, des exports et des graphiques.
Qu’est-ce qu’une Vue ?
Une Vue permet de définir les transitions dans un formulaire (onglets ou informations sélectionnables) afin d’interagir avec d’autres entités du Master Data Management.
Une Vue se caractérise par :
- Elle est une transition entre les entités au niveau d’un écran utilisateur.
- Elle est une transition entre Golden Records, Masters Records et Source Records.
Qu’est-ce qu’un Workflow ?
Un Workflow est un parcours utilisateur pour créer des informations dans le MDM : c’est un processus métier.
Un Workflow se caractérise par :
- C’est un enchaînement de tâches pour créer ou modifier de la donnée de référence.
- Il contient des déclencheurs d’alertes et des notifications sur l’avancement du parcours métier.
Pour les prochains épisodes, je vais aborder l’Architecture au tour du Master Data Management (Episode 2) et comment réussir un projet Master Data Management (Episode 3).
Merci d’avoir suivi ce premier épisode de Kezako.data MDM – Data Hub, n’oubliez pas de vous abonner à notre chaîne YouTube et pour toutes questions ou projets, contactez-moi par mail à : [email protected] ou en remplissant le formulaire.
Stéphan