Interface d’un Notebook dans Microsoft Fabric, affichant du code, des visualisations et du texte explicatif.

Notebook dans Fabric

Le Notebook dans Microsoft Fabric est un outil permettant de développer des tâches Apache Spark et des expériences d’apprentissage automatique. Il sert d’environnement interactif basé sur le Web dans lequel les data scientists et les ingénieurs de données peuvent écrire du code, en utilisant des visualisations riches et du texte Markdown.
Les ingénieurs de données utilisent des Notebooks pour des tâches telles que l’ingestion, la préparation et la transformation des données.
Les data scientists les exploitent pour créer des solutions d’apprentissage automatique, notamment la création d’expériences, de modèles, le suivi et le déploiement.

Les Notebooks nous permettent d’écrire du code dans une variété de langages et de créer un commentaire à côté de notre code à l’aide de cellules interactives.
Ils sont également intégrés à Lakehouses et fournissent un système intégré de fichiers qui peut être utilisé pour stocker des fichiers arbitraires, associés d’une manière ou d’une autre au Notebooks.
Par ailleurs, ils sont constitués de cellules, qui sont des blocs individuels de code ou de texte pouvant être exécutés indépendamment ou en groupe.
Les Notebooks dans Fabric prennent actuellement en charge quatre langages Apache Spark :

  • PySpark (Python)
  • Spark (Scala)
  • Spark SQL
  • SparkR
Dans une définition simple et courte, Fabric Notebook est un endroit où écrire et exécuter des codes pour les ingénieurs de données et les data scientists.

Pourquoi choisir les Notebooks dans Fabric ?

En utilisant Notebook, les utilisateurs peuvent accéder et analyser rapidement les informations, travailler sur des projets avec d’autres et créer des documents avec un codage et des visualisations interactifs.
Microsoft Fabric Notebook permet également aux utilisateurs de partager facilement des documents avec d’autres personnes pour collaborer et formuler des commentaires. Grâce à sa facilité d’utilisation et à sa capacité à accéder et analyser rapidement les données, Azure Notebooks est un outil essentiel pour les data scientists, les développeurs et les chercheurs.

Avantages

  • Démarrez l’utilisation sans aucun effort de configuration.
  • Accédez facilement aux données stockées dans xLakehouses, Data Warehouses et Files.
  • Explorez et traitez facilement les données grâce à une expérience intuitive low-code.
  • Protégez vos données grâce aux fonctionnalités intégrées de sécurité d’entreprise.
  • Permet d’écrire des algorithmes complexes et d’automatiser les pipelines avec un contrôle total.
  • Analysez les données dans les formats bruts (CSV, txt, JSON, etc.) et les formats de fichiers traités (parquet, Delta Lake, etc.), à l’aide des puissantes fonctionnalités Spark.
  • Soyez productif grâce à des capacités améliorées de création et à la visualisation des données intégrée.
  • Limites des Notebooks dans Fabric

  • Nécessite des compétences en programmation : Contrairement à Dataflow, les Notebooks sont orientés code.
  • Temps de démarrage des clusters Spark : Le démarrage des clusters peut prendre quelques secondes, ce qui peut ralentir les petites analyses.
  • Gestion des erreurs : Les erreurs dans le code peuvent être complexes à diagnostiquer pour les non-développeurs.
  • Quand utiliser les Notebooks dans Fabric ?

  • Lorsque vous avez besoin de traitements avancés ou distribués sur de grandes quantités de données.
  • Pour les projets nécessitant des modèles de Machine Learning ou des analyses complexes.
  • Lorsque vous avez besoin de flexibilité maximale pour personnaliser les transformations de données.
  • Comment Créer un Notebook ?

    Dans Fabric, choisissez Data Engineering:

    Illustration représentant la première étape pour créer un Notebook dans Microsoft Fabric, mettant en avant la sélection de l’option "Data Engineering" dans l’interface.

    Des options vous seront présentées, telles que la création d’une nouvelle définition de Lakehouse, de Notebook ou de tâche Spark. Cliquez sur Notebook :

    Interface de Microsoft Fabric affichant plusieurs options, dont la création d'un Lakehouse, d'un Notebook ou d'une tâche Spark, avec un focus sur l’option Notebook.

    Le Notebook vide s’ouvrira :

    Interface de Microsoft Fabric affichant un Notebook vide, prêt à être utilisé pour l’écriture de code et l’analyse de données.

    Dans le coin supérieur gauche, vous pouvez modifier le nom du Notebook :

    Interface d’un Notebook vide dans Microsoft Fabric, avec la possibilité de modifier son nom en haut à gauche.

    Dans l’explorateur Lakehouse, vous pouvez ajouter un Lakehouse existant au Notebook ou en créer un nouveau :

    Interface de l’explorateur Lakehouse dans Microsoft Fabric, permettant d’ajouter un Lakehouse existant ou d’en créer un nouveau dans un Notebook.

    Lors de l’ajout d’un Exisiting Lakehouse, vous serez redirigé vers le hub de données OneLake, où vous pourrez choisir entre les Lakehouses existantes :

    Interface du hub de données OneLake affichant la sélection d’un Lakehouse existant à ajouter à un Notebook dans Microsoft Fabric.

    Une fois que vous avez choisi le Lakehouse, il sera ajouté au Notebook et vous pourrez afficher les tables, dossiers et fichiers existants dans l’explorateur Lakehouse :

    Interface de Microsoft Fabric montrant un Lakehouse ajouté à un Notebook, avec les tables, dossiers et fichiers visibles dans l'explorateur Lakehouse.

    Une autre option de créer un nouveau Notebook est disponible lorsque vous êtes à l’intérieur de Lakehouse. Vous pouvez créer un nouveau Notebook ou y ouvrir un existant :

    Interface de Microsoft Fabric affichant l'option de création ou d’ouverture d’un Notebook depuis un Lakehouse.