"Bonjour à tous et bienvenue pour ce premier épisode de Kezako.data.
Je me présente Stéphan Verdier, Directeur du Pôle Data Management de Kwanzeo. Aujourd'hui, je vais vous parler du glossaire autour du MDM.
Dans cet épisode, nous allons aborder et détailler les quatre points suivants :
1. Le Master Data Management
2. Le lexique du MDM
3. Le lexique des objets
4. Le lexique des contrôles
1. Le Master Data Management
Dans cette partie, nous allons répondre aux questions suivantes :
- Qu'est ce que le Master Data Management ?
- Quel est l'objectif d'un Master Data Management ?
Qu'est ce qu'un Master Data Management (MDM) ?
- Un MDM centralise toutes les données de référence en un point unique le Golden Record.
- Un MDM propose des processus de standardisation, de normalisation, de consolidation, de nettoyage des doublons, de propagation et de traçage des données de référence pour une entreprise.
- Un MDM propose aussi des outils de reporting et de découverte de la donnée, de l'exposition de services, de création, modifications et consultation des données.
Quel est l'objectif du Master Data Management ?
- Premièrement, de centraliser, standardiser, réconcilier, publier une information qui correspond au business de l'entreprise.
- Deuxièmement, de simplifier la prise de décisions métiers sur les nouveaux besoins et faciliter sa mise en place dans l'organisation ... mais aussi, simplifier la prise de décisions, côté équipe IT, sur la rationalisation des échanges et l'homogénéisation des données...
- Troisièmement, enfin d'enrichir l'information grâce à un processus de certifications... qui correspond aux besoins définis par le métier, c'est-à-dire standardisation, normalisation, vérification des informations, les publications du point de vérité, ...
L' Intelligent Data Hub et le nouveau terme pour parler du Master Data Management.
2. Le lexique du Master Data Management
Dans cette partie, nous allons répondre aux questions suivantes :
- Qu'est-ce qu'un Golden Record ?
- Qu'est-ce qu'un Master Record ?
- Qu'est-ce qu'un Source Record ?
Qu'est-ce qu'un Golden Record ?
Le Golden Record est la vision Business de l'entreprise pour une activité.
On peut donc représenter un Golden Record comme un client, un fournisseur, un collaborateur, un contrat par exemple, ...
Un Golden Record se caractérise par les éléments suivants :
- Le Golden Record est aussi appelé "Point de vérité" ou "Point unique de vérité".
- Le Golden Record centralise les informations de référence qui seront propagées à l'ensemble du système d'information.
- Le Golden Record a pour but de fournir des données à forte valeur ajoutée afin de pérenniser et d'augmenter la productivité de l'entreprise.
- Le Golden Record est constitué d'un regroupement de Master Records.
Qu'est-ce qu'un Master Record ?
Un Master Record équivaut à la Vision Business consolidée de l'entreprise pour une activité d'une application.
On peut donc représenter un Master Record, là aussi, comme un client, un fournisseur, un collaborateur, un restaurant, un contrat par exemple... Mais cette fois-ci, nous sommes au niveau des informations consolidées des applications du Système d'Information.
J'entends par données consolidées, une donnée qui est passée par des enrichissements afin d'augmenter la qualité de l'information provenant des applications...
Un Master Record se caractérise par les éléments suivants :
- Le Master Record est aussi appelé "Donnée consolidée par application".
- Le Master Record regroupe les informations de référence qui serviront à la constitution du Golden Record.
- Le Master Record contient des données standardisées normalisées, enrichies et validées.
- Le Master Record est constitué d'un regroupement de Sources Records rassemblées par application.
Qu'est-ce qu'un Source Record ?
Le Source Record équivaut à la Vision Business de l'entreprise brute pour une activité d'une application.
On peut donc représenter un Source Record comme un client, un fournisseur, un collaborateur, un contrat parexemple ... Mais cette fois-ci, au niveau des informations brutes pour chacune des informations applications telles qu'elles sont dans le Système d'Information, ...
J'entends par donnée brute, une donnée qui n'a pas été traitée et qui correspond à 100% à la donnée de l'application.
Un Source Record se caractérise par les éléments suivants :
- Le Source Record est aussi appelée "Donnée brute par application".
- Le Source Record regroupe les informations de référence qui serviront à la constitution du Master Record.
- Le Source Record contient des données hétérogènes, doublonnées, non-standardisées et non contrôlées.
- Le Source Record est constitué d'un ensemble d'informations provenant de plusieurs applications.
En résumé :
- Les Golden Records sont des points de vérité qui sont calculés en fonction d'un regroupement de "Masters"
- Les Master Records correspondent aux données consolidées par application.
- Les Source Records correspondent à la donnée brute envoyée par les applications. A ce niveau, nous pouvons créer des enrichissements et des contrôles sur la donnée afin d'améliorer la qualité des informations.
Pour résumer, les Sources forment des Masters et un ensemble de Masters forment un Golden. Les informations du Golden seront diffusées au Système d'Information.
3. Le lexique des objets
Le lexique des objets qui sont utilisés dans un Master Data Management
Dans cette partie, nous allons répondre aux questions suivantes :
- Qu'est-ce qu'une entité ?
- Qu'est-ce qu'un attribut ?
- Qu'est-ce qu'une nomenclature ?
- Qu'est-ce qu'un transcodage ?
Qu'est-ce qu'une Entité ?
Une entité est une activité de l'entreprise... Un client, un fournisseur, un restaurant, un bénéficiaire, un contrat.
Une Entité se caractérise par les éléments suivants :
- Une Entité est une Vision Business de l'entreprise sur une activité.
- Une Entité a pour but de fournir des Golden Records à forte valeur ajoutée afin de pérenniser et d'augmenter la productivité de l'entreprise.
- Une Entité est un regroupement de Golden Record, de Master Record, et de Source Record.
- Une Entité historise toutes les modifications du domaine d'activité.
- Une Entité possède un ensemble d'attributs de référence.
Qu'est-ce qu'une Entité ? Il y a au minimum trois tables dans laquelle l'Entité apparaît : les tables "Source", les tables "Master" et les tables "Golden".
- Les tables "Source" :
Elles correspondent à la donnée brute envoyée par les applications. A ce niveau, nous pouvons créer des enrichissements et des contrôles sur la donnée afin d'améliorer la qualité des informations.
- Les tables "Master" :
Elles correspondent aux données consolidées par application.
- Les tables "Golden":
Elles sont des Points de vérité qui sont calculées en fonction d'un regroupement de "Masters".
Pour résumer, les Sources forment des Masters et un ensemble de Masters forme un Golden.
Les informations du Golden seront diffusées au système d'information.
Qu'est-ce qu'une Attribut ?
Un Attribut est une donnée de référence de l'Entité de l'entreprise : un siret, une raison sociale, une adresse, un moyen de communication, un nom ou un prénom, ....
Un Attribut se caractérise par les éléments suivants :
- Un Attribut est une vision Business de l'entreprise sur un point de l'activité.
- Un Attribut a pour but de fournir une information à forte valeur ajoutée, pérenne, normalisée, enrichie et validée.
- Un Attribut historise toutes les modifications du Point d'activité qui sont propres à lui.
- Un Attribut est une référence utilisée dans les entités.
- Un Attribut au même titre qu'une entité est présent au niveau Golden Record, Master Record et Source Record.
Qu'est-ce qu'une Nomenclature ?
Une Nomenclature est une classification de référence du Système d'Information.
Une Nomenclature se caractérise par les éléments suivants :
- Une Nomenclature est une information de classification dans le cadre de l'activité d'une entreprise.
- Une Nomenclature a pour but de normaliser les références de l'entreprise. Un pays, une catégorie, un
échelon sont des exemples de Nomenclature.
Qu'est-ce qu'un Transcodage ?
Un Transcodage est une relation entre les différentes classifications du Système d'Information.
Un Transcodage sert à faire communiquer des informations hétérogènes dans le but de faciliter le dialogue, c'est comme un traducteur mais au lieu de traduire une langue vers une autre, cela traduit des données vers d'autres données.
Un Transcodage se caractérise par les éléments suivants :
- Un Transcodage sert à faire communiquer des classifications hétérogènes du Système d'Information.
- Un Transcodage sert de pont entre les Nomenclatures du MDM et les applications qui communiquent avec lui.
4. Le lexique des contrôles
Le lexique des contrôles qui sont utilisés dans un Master Data Management.
Dans cette partie, nous allons répondre aux questions suivantes :
- Qu'est-ce Job d'intégration ?
- Qu'est-ce qu'une règle d'enrichissement ?
- Qu'est-ce qu'une règle de validation ?
- Qu'est-ce qu'une règle de rapprochement ?
- Qu'est-ce qu'une règle de survie ?
- Qu'est-ce qu un stepper ?
- Qu'est-ce qu'un jeu d'action ?
- Qu'est-ce qu'une vue ?
- Qu'est-ce qu un workflow ?
Qu'est-ce qu'une Job d'intégration ?
Le Job d'intégration permet de certifier la donnée grâce à l'ensemble des règles qui auront été définies par les "Métiers" :
- Règle d'enrichissement
- Règle de validation
- Règle de rapprochement
- Règle du survie
Un Job d'intégration se caractérise par les éléments suivants :
- Un Job d'intégration déclenche une file de certification qui enrichira les données de référence afin de créer des Golden Records.
- Une file de certification est un ensemble d'étapes de certification de la donnée dans le but de propager une donnée à forte valeur ajoutée.
Voici un schéma simplifié de la file de certification :
- Les données arrivent dans les tables Sources.
- A ce niveau, on peut paramétrer des enrichissements.
- Ensuite, on passe dans les contrôles de validation.
- Si le contrôle passe, cela crée les Masters par application.
- Ensuite, le rapprochement entre les Masters se réalise, les règles de survie s'appliquent et si les informations sont validées ont créé le "Golden".
- Au niveau de ce "Golden", il est encore possible de réaliser un enrichissement.
Qu'est-ce qu'une Règle d'enrichissement ?
Un enrichissement sert à améliorer l'information.
C'est standardiser, normaliser, ... C'est enrichir et obtenir des informations complémentaires.
Une Règle d'enrichissement se caractérise par les éléments suivants :
- Une Règle d'enrichissement normalise, standardise, enrichie et complète une donnée de référence.
- Une Règle d'enrichissement s'applique au niveau des Source Records.
- Une Règle d'enrichissement avant consolidation se déclenche au niveau des Source Records.
- Une Règle d'enrichissement après consolidation se déclenche au niveau des Golden Records.
- Une Règle d'enrichissement avant consolidation se déclenche avant les règles de validation au niveau des Source Records.
- Une Règle d'enrichissement après consolidation se déclenche après les règles de validation au niveau des Golden Records.
Sur le schéma de la file de certification, nous voyons que les règles d'enrichissement se déclenchent au niveau des Source Records et des Golden Records.
Qu'est-ce qu'une Règle de validation ?
Une Règle de validation contrôle l'information et détermine si elle est valide pour poursuivre le traitement !
Une Règle de validation se caractérise par les éléments suivants :
- Une règle de validation contrôle la donnée de référence et détermine si celle-ci est valide pour poursuivre le traitement afin d'éviter de propager une donnée de mauvaise qualité.
- Une règle de validation s'applique au niveau des Source Records et à la constitution du Golden Records.
- Une règle de validation avant consolidation se déclenche au niveau des Source Records.
- Une règle de validation après consolidation se déclenche au niveau de la constitution des Golden Records.
- Une règle de validation avant consolidation se déclenche après les règles d'enrichissement au niveau des Source Records.
- Une règle de validation après consolidation se déclenche avant les règles d'enrichissement au niveau des Golden Records.
Sur le schéma de la file de certification, nous voyons que les règles de validation se déclenche au niveau de la création des Master Records et de la création des Golden Records.
Qu'est-ce qu'une Règle de rapprochement ?
Il existe deux types de Règle de rapprochement :
- Le rapprochement flou qui permet de créer un Golden en fonction de plusieurs Attributs
- Le rapprochement par ID qui permet de créer le Golden en fonction d'un seul Attribut... Un matricule par exemple !
Une Règle de rapprochement se caractérise par les éléments suivants :
- Une Règle de rapprochement crée un Golden Record.
- Une Règle de rapprochement compare les Master Records deux à deux afin de créer un "Groupe d'un Masters" ce qui constituera Golden Record. Ce groupe aura une valeur de 0 à 100.
- Divers seuils sont paramétrables par Règle de rapprochement afin de constituer un Golden Record.
Si la valeur est inférieure au seuil, le Master Record ne fera pas partie du groupe qui constituera le Golden Record.
Sur le schéma de la file de certification, nous voyons que les règles de rapprochement se déclenchent à la création des Golden Records.
Qu'est-ce qu'une Règle de survie ?
Une Règle de survie permet de savoir quelle est l'information a afficher dans le Golden Record en fonction de ses Master Records.
Une Règle de survie se caractérise par les éléments suivants :
- Une Règle de survie détermine Attribut par Attribut ce qui est affiché dans le Golden Record en fonction des informations présentes dans chacun des Masters Records.
Sur le schéma de la fille de certification, nous voyons que les règles de survie se déclenchent à la création des Golden Records.
Qu'est-ce qu'un Stepper ?
Un Stepper représente les différentes étapes à réaliser... par un utilisateur pour créer ou modifier des informations.
Un Stepper se caractérise par les éléments suivants :
- Un Stepper simplifie le processus de création ou de modification des informations en évitant d'afficher trop d'informations à l'écran.
- Un Stepper est utilisé dans des Workflows ou des Jobs d'intégration précis.
Qu'est-ce qu'un Jeu d'action ?
Un Jeu d'action se représente sous forme d'un menu d'opérations réalisables pour l'utilisateur.
Un Jeu d'action se caractérise par les éléments suivants :
- Un Jeu d'action détermine les actions réalisables pour un utilisateur.
- Un jeu d'action déclenche des Workflows, des Steppers, des imports, des exports et des graphiques.
Qu'est-ce qu'une Vue ?
Une vue permet de définir les transitions dans un formulaire, comme des onglets ou des informations sélectionnables qui permettent d'interagir avec d'autre en entité du Master Data Management.
Une Vue se caractérise par les éléments suivants :
- Une Vue est une transition entre les entités au niveau d'un écran utilisateur.
- Une Vue est une transition entre les Golden Records, les Masters Records et les Source Records au niveau d'un écran utilisateur.
Qu'est-ce qu'une Workflow ?
Un workflow est un parcours utilisateur pour créer des informations dans le MDM, c'est un processus métier !
Un Workflow se caractérise par les éléments suivants :
- Un Workflow est un parcours métier, un enchaînement de tâches pour créer ou modifier de la donnée de référence.
- Un Workflow contient des déclencheurs d'alertes et des notifications sur l'avancement du parcours métier.
Pour les prochains épisodes, je vais aborder l'Architecture au tour du Master Data Management (Episode 2) et comment réussir un projet Master Data Management (Episode 3).
Merci d'avoir suivi ce premier épisode de Kezako.data MDM - Data Hub, n'oubliez pas de vous abonner à notre chaîne YouTube et pour toutes questions ou projets, contactez-moi par mail à : [email protected] ou en remplissant le formulaire.
Stéphan"