Kézako.data Les concepts de base de l'Intelligence Artificielle



Les concepts de base de l'Intelligence Artificielle
Episode 2 : Machine Learning et Deep learning

Décryptage de l'IA - Episode 2 : Le concept de Machine Learning et de Deep learning présenté par Amine, Consultant Data Intelligence Kwanzeo

Vidéo Décryptage

Les concepts de base de l'Intelligence Artificielle
Episode 2. Machine Learning et Deep learning


Par Amine, Consultant Data Intelligence Kwanzeo


Transcription du Kézako.data


Bonjour,

Bienvenue dans ce deuxième épisode de KEZAKO.IA, série de vidéos dédiée à la vulgarisation des Concepts d'Intelligence Artificielle. Je suis Amine, Consultant Data Intelligence KWANZEO.

Ce Kézako.IA est composé de 6 épisodes dont :

  • le 1er est consacré à l'histoire de l'Intelligence Artificielle ;
  • le 2e au concept de Machine Learning et Deep learning (épisode présenté ici) ;
  • le 3e au déroulement de projet d'intelligence artificielle ;
  • le 4e épisode, on abordera les outils de développement de ce type de projet ;
  • et enfin, on fera un focus sur le MLOps pour l'encadrement de ce type de projet avant de voir un cas concret sur la plateforme de Microsoft Data Fabrics.


  • Episode 2. Machine Learning et Deep learning


    Dans le premier épisode, nous avons vu quelle a été l´évolution de l´Intelligence Artificielle au cours du temps, l´objectif de ce nouvel épisode est de décrire les sous-domaines que l´on retrouve au sein même de cette science qui est en train de révolutionner tous les secteurs de l´ère moderne.

    Ce deuxième épisode sera axé sur les concepts de Machine Learning et de Deep learning
    Commençons par identifier les types d´Intelligence Artificielle qui existent

    Combien existe-t-il de types d´Intelligence Artificielle ?

    Ils existent deux types d´Intelligence Artificielle :
  • L´Intelligence Artificielle symbolique qui est basée sur un raisonnement, sur des formules logiques ou sur une base de faits connus. Généralement, ce fonctionnement est basé sur des conditions ou des symboles.
  • Ceux qui sont légèrement initiés à la programmation connaissent les principes des conditions.
  • L´Intelligence Artificielle connexionnistes quant à elle a la capacité d´apprendre et c´est ce qui rapproche le plus de l´intelligence humaine. Cette capacité est d´apprendre est généralement basée sur des données.

  • Lors de cet épisode, nous allons principalement nous intéresser à ce type d´Intelligence Artificielle.

    En effet, l´IA est un vaste domaine au sein duquel nous allons trouver du plus simple au plus complexe, plusieurs niveaux d´Intelligence Artificielle, on va parler de :
  • l´IA faible ou étroite ; le seul type d´intelligence artificielle que l´homme a réussi à produire à ce jour. On trouve de multiples applications telles que les assistants vocaux sur les ordinateurs ou les smartphones (comme Cortana, Siri, …) ou bien de la vision d´ordinateur (que l´on peut retrouver sur des voitures autonomes, la reconnaissance faciale, les systèmeq de recommandation qui vont nous proposer un meilleur contenu à chaque fois).
  • l´IA forte appelée également IA profonde, et est toujours au stade de concept, est une IA qui serait capable d'imiter les capacités cognitives d´un être humain. Elle serait capable d´appliquer les connaissances acquises par l'expérience pour améliorer l´efficacité de certaines tâches et serait capable également de discerner les émotions, les croyances, les besoins et même les processus de pensée d´êtres humains.
  • la Super Intelligence Artificielle, où la machine ne serait pas seulement capable d'imiter le comportement de l´être humain mais c´est l'hypothétique IA qui aurait conscience d'elle-même avec des capacités et intelligence dépassant celle de l´être humain.

  • Cela dit, l'IA est elle-même constituée de plusieurs sous-domaines, dont les principaux sont le Machine Learning et le Deep Learning.

    Qu´est-ce que le Machine Learning (ML) ?

    Le Machine Learning (ML) est un terme anglais et qui se traduit par “Machine à apprentissage" ou “apprentissage automatique”.
    C'est-à-dire, une machine capable d´apprendre et de comprendre un phénomène par "l´entraînement". En injectant des données à un modèle de Machine Learning, la machine est capable de détecter les différents patterns sans lui dire explicitement quoi détecter ou quoi apprendre. Les modèles en question sont des modèles dit d´Intelligence Artificielle (on discutera plus tard des types de modèles existants).

    Qu´est-ce que le Deep Learning (DL) ?

    Le Deep Learning (DL) veut dire “apprentissage profond”.
    Ce dernier vient pour résoudre des tâches beaucoup plus complexes que ce que le Machine Learning peut réaliser (tel que la reconnaissance d´image, la reconnaissance vocale etc.). Cela fait appel à des modèles plus complexes et se rapproche davantage de la façon dont l´être humain et la nature conçoivent l´intelligence. Les algorithmes de DL sont plus précisément des réseaux neuronaux comportant plusieurs couches où vont se faire les différents calculs afin d'atteindre en sortie le résultat escompté.

    En conclusion, tout modèle de Deep Learning est un modèle de Machine Learning mais l´inverse ce n´est pas vrai !

    Maintenant que nous avons parlé des concepts de l´IA, intéressons-nous de plus près au Machine Learning et à ses composantes. Le Machine Learning est à son tour composé de plusieurs sous-domaines, le Supervised Learning (l´apprentissage supervisé), et le Unsupervised Learning (l´apprentissage non supervisé) mais également le Reinforcement Learning ((l´apprentissage par renforcement).

    Qu´est-ce que le Supervised Learning ?

    La première composante du Machine Learning est le Supervised Learning. La spécificité des méthodes du Supervised Learning est qu´il nécessite des données labellisées étiquetées dont on comprend parfaitement la signification dans le monde réel (physique). Le Supervised Learning ou bien l´apprentissage supervisé est une tâche de l´apprentissage automatique qui permet aux modèles développés d´apprendre à partir de données étiquetées dans l´objectif de les classifier ou de prédire des données similaires.

    Qu´est-ce que le Unsupervised Learning ?

    L´apprentissage non supervisé et la tâche de l´apprentissage non supervisé qui consiste à identifier des modèles ou des structures cachés par le biais de données non-labellisées, non-étiquetées.
    A la différence de l´apprentissage supervisé, qui lui va chercher les relations mathématiques, linéaire ou non entre les variables des données, l´apprentissage non supervisé va s´intéresser aux liens et aux ressemblances qui peuvent exister au sein de la donnée elle-même.

    Qu´est-ce que le Reinforcement Learning (RL) ?

    Le Reinforcement Learning (RL), ou l´apprentissage par renforcement en français, est une branche de l'apprentissage automatique (Machine Learning) qui concerne l'apprentissage d'agents intelligents pour prendre des décisions séquentielles en interagissant avec leur environnement. Il s'agit d'une méthode d'apprentissage basée sur les récompenses positives ou négatives, inspirée par le comportement d'apprentissage des êtres vivants.

    Dans le Reinforcement Learning, un agent est placé dans un environnement et prend des actions pour maximiser une récompense cumulée au fil du temps. L'agent apprend à prendre les meilleures décisions en explorant différentes actions et en observant les conséquences de ses actions sur son environnement.

    Maintenant que nous connaissons les différentes branches du Machine Learning, regardons de plus près quel pourrait être leurs applications dans le monde réel :

  • Le Supervised learning, prenons pour notre exemple la régression, il existe plusieurs types de régression, mais dans l´exemple que l´on va prendre nous choisirons la régression linéaire pour sa simplicité.
  • Imaginons que l´on possède un jeu de données, comportant le poids et la taille de plusieurs individus. Mais que pour un individu, nous n´avons pas d´information sur son poids mais uniquement sa taille. En observant la courbe brute, on peut deviner que la taille est grossièrement proportionnelle au poids. On peut donc trouver une combinaison linéaire (c´est-à-dire une combinaison d´additions multiplications), une fonction affine permettant de trouver approximativement le poids de l´individu observé. Le tout étant de minimiser l'écart qui est appelé « erreur » entre les points du tracé brut et les points du tracé prédictif. Ici, nous connaissons la signification de la valeur « target » qui est le poids, et donc nous allons diriger notre modèle pour qu´il puisse prédire cette valeur là en fonction des données que l´on lui a injecté en amont d´où le nom apprentissage supervisé.

  • L´ Unsupervised Learning :
    Dans l´exemple que l´on va prendre, on va voir comment le Clustering peut nous aider dans la vie quotidienne ou la classification, comment peut-elle nous aider dans la vie quotidienne à résoudre des problèmes. Supposons que l´on ait un jeu de données concernant plusieurs ballons (avec comme information leurs poids, leurs volumes, leurs formes, leurs couleurs, …). Un algorithme de Clustering supervisé, après quelques paramétrages, saura les regrouper de par leurs caractéristiques similaires, sans pour autant savoir les nommer et jusqu´ici si nous remarquons, il n'y a pas de valeur « target » d'où le nom Unsupervised.

  • Enfin le Reinforcement Learning est la sous branche du Machine Learning où le modèle va apprendre directement dans son environnement qui est nécessairement dynamique. Le modèle est composé d´un agent qui peut directement prendre des décisions dans son environnement et améliorer sa décision en fonction de l´effet sur cet environnement.

  • Prenons par exemple les systèmes de recommandation sur les plateformes de streaming . Supposons que cette plateforme de streaming constitue l´environnement. Le but est de vous proposer de nouvelles vidéos aussi bien des films que des séries (que l´action va prendre l´agent) basée sur vos préférences qui sont et d´affiner vos préférences (observation). L´ajustement se fera au fur et à mesure que vous regardez où ignorer les vidéos proposées par l´agent c´est ce qu´on appelle la mise à jour de la politique (Policy).

  • Enfin, les Réseaux de Neurones (RN) :
  • Techniquement, tous les Réseaux de Neurones (RN) sont capables de réaliser toutes les tâches exécutées par un modèle de Machine Learning (ML). Le choix lui va se faire en fonction de l'efficience du modèle une fois placé dans son contexte. Mais, les Intelligences Artificielles (IA) les plus avancées de nos jours sont celles qui sont basées sur des réseaux de neurones profonds. Il existe de nombreuses architectures pour les modèles de Deep Learning (DL) , mais intéressons-nous aujourd´hui au fonctionnement d´un modèle basique.

    Comment se présente un modèle de Deep Learning (DL) ?

    Un modèle de DL de présente comme suit :
    Il prend en entrée des données brutes ou prétraitées. Ces données dépendent du domaine d'application et peuvent être sous plusieurs formes, cela peut être des images, des vidéos, du son, des données issues d´IOT,.... dans la majorité des cas elles sont prétraitées et sous forme numériques.

    Le modèle de DL va prendre en entrée ces données auxquelles nous allons affecter un poids de manière arbitraire puis seront propagées à travers les différentes couches du modèle de l´entrée jusqu´à la sortie où chaque couche effectuera une transformation linéaire suivie d´une fonction d´activation non-linéaire.

    Ces transformations successives à travers les couches du modèle permettent d'extraire les caractéristiques et les représentations de plus en plus abstraites des données.

    Les sorties du modèle sont comparées aux étiquettes, c´est-à-dire vérités du terrain, des données d'entraînement pour calculer une mesure d'erreur, généralement appelée fonction de perte (loss function) .

    Cette première étape que je viens de vous décrire s´appelle Feed-Forward ou bien la propagation avant.

    Qu´est ce que la propagation arrière ?

    Par la suite, la propagation arrière est l'étape qui lui succède. Elle vise à ajuster ces poids et les biais du modèle pour minimiser la fonction de perte et donc améliorer les performances du modèle.
    Le processus de propagation arrière est répété sur de nombreux lots de données d'entraînement, jusqu'à ce que le modèle atteigne une fonction de perte suffisamment faible.
    Enfin on va répéter ce cycle suffisamment de fois jusqu'à ce que le modèle atteigne des performances satisfaisantes. Il sera ensuite évalué par un ensemble de validation et testé sur des données réelles.


    Après ce deuxième épisode ou nous avons parlé du concept de Machine Learning et Deep learning. Nous allons aborder dans le prochain et 3 ème épisode, le déroulement d´un projet d'intelligence artificielle .

    Si ce Kézako.IA vous a plu, vous pourrez retrouver sur le site et sur la chaîne YouTube de KWANZEO des vidéos explicatives sur les référentiels de données ou encore Microsoft Power BI, Azure Data , …

    Merci beaucoup !