Hubert :
"Bonjour à tous,
On est là pour parler Data, pour parler des nouvelles architectures de données.
Cela a évolué ! Avant, on parlait de « Business Intelligence », maintenant on parle de « Data Intelligence ».
Ismaïl :
Tout à fait.
Hubert :
Est-ce que tu pourrais nous décrire un peu la chaîne d'une plateforme de données plus moderne ?
Ismaïl :
Avant, on parlait de "BI", de "Business Intelligence", aujourd'hui on parle de "Data Intelligence",
donc le facteur en commun c'est bien évidemment la Data qui a évolué.
Les sources deviennent multiples, diverses et variées.
On va s'attaquer aujourd'hui à des données qui sont soit structurées donc de format simple à interroger,
soit semi-structurées dans un format comme le JSON par exemple,
soit pas du tout structurées comme les vidéos, les images.
On peut avoir aujourd'hui des usages qui souhaitent attaquer justement ce genre de format.
Les plateformes d'aujourd'hui doivent répondre à ces objectifs.
J'ai besoin d'avoir la donnée là où elle se trouve, peu importe sa volumétrie, peu importe sa typologie car elle va m'aider à prendre la bonne décision pour demain.
Hubert :
Donc Les plateformes (Data) actuelles vont se connecter à des données extérieures. Il y a donc beaucoup plus de données, y compris dans l'entreprise.
On va prendre toutes les données qui pourraient être intéressantes pour prendre des décisions ou agir.
Et tout cela on arrive à le faire parce que l'infrastructure a changé.
Ismaïl :
Effectivement, ça c'est le cheminement classique. Avant, on prenait la donnée, on la déplaçait, on la traitait et on la stockait dans ce qu'on
appelle la Data Warehouse, un entrepôt de données.
Aujourd'hui, on va être plus à déplacer les données dans ce qu'on appelle un Data Lake.
Les Data Engineers vont ensuite agir en les transformant en les "triturant" pour pouvoir la transformer en données analytiques.
Les Data Scientists, eux, aiment bien garder les données qui sont brutes (à ce stade).
(Il y a donc) un seul emplacement pour différents usages.
Hubert :
Dans l'usage classique, on va déjà bénéficier (de cette Architecture Cloud) parce qu'on va aller plus vite.
Ismaïl :
La rapidité : on peut faire tourner un flux que l'on faisait tourner hier une (seule) fois par jour de manière nocturne,
maintenant, en temps réel ou en quasi-temps réel, en fonction du besoin.
On va aller chercher la donnée de manière plus simple via des Services qui sont dédiés à ça, Services plus performants aussi et qui sont (aussi) scalables.
Ils s'ajustent automatiquement à la charge, augmentent lorsqu'ils en ont besoin et rebaissent après de manière automatisée lorsque la charge diminue.
Hubert :
D'accord et donc ces plateformes pourront aussi bénéficier d'améliorations du côté de la visualisation de données, de la collaboration. Donc ça, c'est un premier usage.
On parle déjà depuis assez longtemps de la partie Machine Learning qui est sous-jacente à l'IA (Intelligence Artificielle).
Est-ce que tu peux me dire comment cela se crée ? Quelle est la complexité de ce type d'infrastructure Cloud ?
Ismaïl :
La Data Intelligence vient enrichir ce qu'on appelle la BI par un nouvel usage qui est la vue prédictive,
Avant, avec la BI, je ne regarde que ce qui s'est passé et j'améliore ma prise de décision pour mieux anticiper le futur.
Maintenant, avec la donnée prédictive et en fonction de mon patrimoine de données et de l'historique que j'ai en ma possession,
je vais pouvoir dire ce qui pourrait potentiellement se produire demain.
C'est en fait un modèle qui est entrainé (via des Services) et qui donne des indicateurs prédictifs pour prendre la bonne décision.
Hubert :
D'accord très bien donc c'est quand même un atout en plus car la plateforme peut tenter de prédire l'avenir
et si j'ai bien compris, c'est plus simple qu'avant. Cela existe déjà depuis un certain temps, mais c'est c'était (avant) quelque chose d'assez complexe.
Ismaïl :
Effectivement, c'était un mythe. à un moment donné, cela est devenu une réalité.
C'était réservé à une certaine population, les Data Scientists qui ont un "bagage" statistiques et mathématiques assez fort.
Aujourd'hui, on voit de plus en plus de Data Engineers le faire.
Pourquoi ? Parce que les Services deviennent plus simples, moins de code, plus d'usage et même l'utilisateur final commence à le ressentir
dans ses outils de tous les jours, comme avec Copilot par exemple.
Hubert :
En résumé, on peut aller chercher plus de données, on les stocke, ce sont des données plus variées.
On est capable de les analyser rapidement, de créer des systèmes de d'analyse de données, de visualisation des données, de collaboration.
Et en plus, on est capable de construire de la prédiction et de bénéficier des logiques d'IA.
Tout ces Services sont rendus par la même plateforme.
Ismaïl :
Effectivement, donc aujourd'hui la Data est démocratisée, on parle aussi de Self-service, mais il faut faire attention
parce qu'il faut l'accompagner de la bonne gouvernance, de stratégie de sécurité
pour dire qui a accès à quoi, selon quel périmètre (il y a plusieurs Services pour cela).
Hubert :
Super, merci beaucoup Ismaïl.
Ismaïl :
Merci à toi et merci à tous.
N'hésitez pas à prendre contact avec nous pour toutes questions liées à la Data Intelligence.