Snowflake Cortex AI : L’intelligence artificielle intégrée et évolutive dans Snowflake

Illustration de Cortex AI de Snowflake, la suite de services IA générative intégrée à la plateforme cloud.
Snowflake pousse l’intelligence artificielle cloud un cran plus loin avec Cortex AI, sa nouvelle suite de services intégrés d’IA générative. Cette couche intelligente embarque nativement des LLM Snowflake de pointe, issus de modèles large language externes comme Anthropic Claude ou OpenAI, rendus accessibles directement depuis la plateforme.

Concrètement, l’utilisateur peut exploiter une panoplie de fonctions prêtes à l’emploi pour l’analyse augmentée de ses données textuelles : résumé automatisé de documents, traduction multilingue, classification de texte, analyse de sentiment, ou extraction de réponses dans un texte. Il s’agit de simples appels SQL ou Python, sans avoir à entraîner soi-même de modèle, ce qui abaisse fortement la barrière d’entrée pour intégrer de l’IA dans les données.
Interface visuelle de Cortex LLM Playground de Snowflake permettant d’exploiter des modèles de langage sans coder.

Pour les cas plus sophistiqués, Snowflake propose le Cortex LLM Playground, une interface visuelle no-code (baptisée AI & ML Studio) où l’on peut expérimenter avec différents modèles de langage sur ses données et même affiner les prompts pour trouver le meilleur rendu, le tout sans écrire une ligne de code.

Mieux, la plateforme permet désormais le fine-tuning de modèles : il est possible d’ajuster un LLM pré-entraîné aux données spécifiques de l’entreprise afin d’obtenir des résultats sur-mesure.

Visualisation des fonctionnalités avancées de Cortex AI : génération d’embeddings vectoriels et extraction d’informations avec Document AI.

Côté technique, Snowflake Cortex AI fourni également des outils d’apprentissage profond avancés, comme la génération d’embeddings vectoriels pour représenter le sens des documents et en faire de la recherche sémantique à grande échelle. Par exemple, on peut convertir des milliers de documents en vecteurs numériques et les stocker dans Snowflake afin de réaliser des recherches par similarité ou du clustering thématique.

Document AI est une autre nouveauté phare : Snowflake utilise son modèle propriétaire Arctic pour extraire automatiquement les informations clés de documents non structurés (texte libre, PDF, images scannées), y compris le contenu visuel comme les logos ou l’écriture manuscrite. Les résultats extraits peuvent ensuite être exploités directement dans la base pour enrichir les analyses.

Illustration du Copilot SQL de Snowflake générant des requêtes à partir de requêtes en langage naturel.

En outre, Snowflake introduit un Copilot SQL, un assistant conversationnel piloté par LLM qui aide les utilisateurs à générer et optimiser des requêtes en langage naturel. Intégré dans l’interface, ce copilote comprend la demande en français ou en anglais et propose une requête SQL correcte pour obtenir le résultat voulu, évitant aux analystes d’écrire eux-mêmes du code.

L’ensemble de ces capacités s’inscrit dans une approche augmentée où l’IA est mise au service de la donnée. Snowflake Cortex IA privilégie notamment le principe du RAG (Retrieval Augmented Generation): les modèles génèrent du texte ou des insights en s’appuyant sur les données réelles de l’entreprise (recherchées via Cortex Search ou Analyst), garantissant des réponses pertinentes et fondées sur des faits plutôt que de simples générations hors contexte.


En synthèse, Cortex AI apporte à la plateforme Snowflake des outils d’analyse augmentée et de génération de texte Snowflake ultra-modernes, qui transforment le data cloud en un véritable moteur d’AI prêt à l’emploi pour les cas d’usages métiers.

Snowpark : Intégrez votre code directement dans Snowflake

Interface montrant l’exécution de code Pandas sur des données Snowflake via Snowpark.

L’environnement Snowpark de Snowflake s’est enrichi de nouveautés majeures pour les développeurs de données. Il supporte désormais pleinement Python dans Snowflake, avec notamment une API Snowpark Pandas qui permet d’exécuter du code Pandas existant directement sur les données hébergées dans la plateforme.

Concrètement, il suffit d’adapter quelques lignes et l’on retrouve la simplicité des DataFrames Pandas, mais bénéficiant de la puissance de calcul distribuée et de la sécurité du cloud Snowflake.
Cette avancée améliore significativement les performances de traitement : les transformations s’exécutent au plus près des données, sans extractions, et exploitent le moteur Snowflake pour analyser des volumes massifs bien plus rapidement qu’en local.

Illustration d’un pipeline de machine learning construit dans Snowflake avec Snowpark ML.
Résultat, on peut construire des pipelines data et de machine learning Snowflake de bout en bout directement dans l’entrepôt cloud, sans quitter l’environnement Snowflake. Avec Snowpark ML, la plateforme unifie le prétraitement, la feature engineering et l’entraînement des modèles au sein d’une même bibliothèque Python, tout en s’appuyant sur des outils familiers (API DataFrame, librairies scikit-learn, TensorFlow, etc.).

Les data scientists peuvent ainsi utiliser leurs compétences existantes pour créer des modèles ML dans Snowflake, profiter du traitement parallèle (par exemple pour accélérer l’optimisation d’hyperparamètres ou l’entraînement de multiples modèles) et déployer leurs algorithmes sous forme de fonctions UDF directement dans la base.
Diagramme illustrant l’intégration de Snowpark avec les Snowflake Native Apps et Container Services, incluant l'exécution de code dans des conteneurs sécurisés

Enfin, Snowpark s’intègre étroitement avec l’écosystème Snowflake élargi, notamment les Snowflake Native Apps et les Snowpark Container Services. Il devient possible d’encapsuler des traitements Snowpark au sein d’applications distribuables sur le Marketplace Snowflake, ou de faire tourner du code dans des conteneurs dédiés (y compris avec des GPU via le partenariat Snowflake–NVIDIA) directement sur la plateforme, de façon sécurisée et gouvernée.

En somme, ces innovations Snowpark API renforcent la capacité de Snowflake à gérer des pipelines data avancés et des workloads de data science sans friction, avec un langage accessible et des performances au rendez-vous.

Vous souhaitez former vos équipes, nous poser des questions ? 

Nos spécialistes sont à votre disposition via ce formulaire.