Découvrir le Diagramme de Sankey dans Power BI

Vidéo Décryptage
Qu’est-ce qu’un Diagramme de Sankey ? Explications et démo par Chaimaa, Consultante Data Analyst Kwanzeo

Kézako.data – le Diagramme de Sankey dans Microsoft Power BI

Par Chaimaa, Consultante Data Analyst Kwanzeo

 

Transcription du Kézako.data

SOMMAIRE

  • Qu’est-ce qu’un diagramme de Sankey ?
  • Comment créer un diagramme de Sankey dans Microsoft Power BI ?
  • Démo : Comment transformer vos données et créer le Diagramme de Sankey ?

 

« Bienvenue sur Kézako.data, notre chaîne YouTube qui vous aide à mieux comprendre et à utiliser vos données.

Je suis Chaimaa, Consultante Data Analyst chez KWANZEO.

Aujourd’hui, nous allons découvrir ensemble le diagramme de Sankey dans Microsoft Power BI.

1. Qu’est-ce qu’un diagramme de Sankey ?

Un Diagramme de Sankey est un outil de visualisation de données puissant. Il permet d’illustrer les flux de données entre différentes catégories ou étapes d’un processus.

En un coup d’œil, il vous aide à comprendre comment des éléments comme des ressources, des transactions ou même des parcours clients se déplacent et se transforment à travers plusieurs phases.

2. Comment créer un Diagramme de Sankey dans Power BI ?

Pour créer un Diagramme de Sankey dans Power BI, il est important de bien préparer vos données.

 

Voici ce dont vous aurez besoin :

 

  • d’une colonne « source » pour indiquer l’origine du flux ;
  • d’une colonne « destination » pour montrer la destination du flux ;
  • d’une colonne « épaisseur » qui représente la quantité ou l’intensité du flux entre la source et la destination.

En structurant vos données de cette façon, vous êtes prêt à créer un Diagramme de Sankey qui reflète les mouvements dans votre processus.

3. Démo : Comment transformer vos données et créer un Diagramme de Sankey dans Power BI ?

 

Passons maintenant à un cas pratique dans Power BI.

 

 

Je  vais vous montrer comment transformer vos données et créer ce Diagramme pas à pas.

 

 

Restez avec moi et découvrons ensemble le potentiel de cet outil formidable.

 

Nos données brutes se composent d’un tableau qui comprend plusieurs colonnes telles que :

 

  • les identifiants des clients ;
  • les dates de réservation des croisières ;
  • le circuit et le sous-circuit choisis par chaque client.

Avec ces données, nous allons créer ce Diagramme de Sankey pour illustrer les parcours de navigation de nos clients (cf. la démo de la vidéo Kezako.data à partir de 1:35).

 

Par exemple, à ce niveau là le diagramme montre que certains clients ont choisi « Alaska », « Caraïbes » et « Europe » comme première destination.

 

Lors de leur deuxième voyage, tous ces clients ont choisi la même destination, à savoir le « Canada ».

 

Pour le troisième voyage, des clients sont retournés en « Europe » et d’autres en « Alaska ».

 

Revenons à Power Query :

 

 

L’objectif ici est d’identifier les colonnes « source » et « destination ».

 

 

Cependant, avant cela, nous devons extraire le premier, le deuxième et le troisième voyage de chaque client en regroupant le tableau par client et en ajoutant un index pour ordonner les voyages de chaque client par ordre croissant.

 

Alors, nous devons trier le tableau par client ID et date de réservation en ordre croissant. Ensuite, nous allons regrouper ce tableau par client ID tout en conservant toutes les lignes.

 

Après le regroupement, on doit ajouter une colonne ou bien un ID pour chaque sous-table pour identifier le premier, le deuxième et le troisième voyage pour chaque client.

 

Par exemple, pour ce client (3 :39), nous avons identifié son premier, deuxième et troisième voyage.

La prochaine étape consiste à développer toutes ces colonnes pour ces sous-tableaux afin de pouvoir créer une table pour chaque voyage.

 

Je vais commencer par créer une table pour le premier voyage.

Pour cela, nous allons créer une table de référence en la renommant « premier voyage » et filtrer la table pour ne garder que les données dont l’ID est égal à « 1 ».

 

A ce niveau là, nous avons donc uniquement les données relatives au premier voyage sélectionné par chaque client.

 

Pour cette table, nous devons conserver uniquement les colonnes « Client ID » et « Circuit ». Nous ajouterons également le préfixe « premier voyage » à la colonne « Circuit » en utilisant la « colonne personnalisée ».

 

Ensuite, on va suivre le même processus pour créer une table pour le deuxième et le troisième voyage.

 

Après avoir généré l’étape de chaque voyage, la prochaine étape est de créer les colonnes « source » et « destination ».

 

Pour ce faire, nous allons fusionner la table du premier voyage avec celle du deuxième voyage puis renommer les colonnes comme nécessaire.

 

Par exemple, pour ce client (5 :25),  il a commencé son voyage en choisissant le circuit des Caraïbes donc cette colonne doit être renommée en « source ».

 

Ensuite, sa destination suivante était l’Europe, cette colonne doit donc être appelée comme « destination ».

 

Ensuite, nous appliquerons le même processus pour fusionner les tables du deuxième et troisième voyage.

 

Alors, ce processus nous donne deux tables que je vais maintenant ajouter pour finaliser la transformation des données.

 

Ici, la deuxième table sera « Fusionner2 ».

 

Comme vous pouvez le voir, cette table est parfaitement adaptée pour créer un Diagramme de Sankey car nous avons la colonne « source », la colonne « destination » et la colonne « épaisseur » sera le nombre distinct identifiant de clients.

 

Enfin, nous pouvons visualiser nos données en utilisant le Diagramme de Sankey.

 

Nous allons d’abord ajouter la colonne « source » puis la colonne « destination » et pour la colonne « épaisseur », il faut sélectionner le nombre distinct des ID clients.

 

Comme vous pouvez le voir, cela crée un diagramme de Sankey multi-niveaux qui nous permet de suivre facilement les choix des clients et aussi de repérer les tendances.

 

Voilà, vous avez maintenant toutes les clés en main pour utiliser le Diagramme de Sankey dans Power BI et visualiser vos données de manière efficace.

 

Grâce à cette approche, vous pouvez suivre les flux de données, analyser les choix des clients et repérer des tendances importantes dans vos processus.

 

Si vous avez des questions, n’hésitez pas à m’envoyer un mail à [email protected]. Le message me sera transmis.

 

Merci et à très bientôt pour le prochain Kézako.data ! »

 

Plus d’exemples ici : https://learn.microsoft.com/fr-fr/power-bi/developer/visuals/samples

 

Si ce Kézako.data vous a plu, vous pourrez retrouver sur le site et sur la chaîne YouTube de Kwanzeo des vidéos explicatives sur les référentiels de données, le MDM ou encore sur les sujets suivants : Microsoft Power BI, Azure Data, DAX …

 

 

N’hésitez pas à nous contacter pour avoir plus d’informations sur nos missions réalisées et pour toutes questions ou projets Data Intelligence.