lundi , 1 septembre 2025

Pour Snowflake, quand la donnée va, tout va.

Intégration, Iceberg, Polaris, projets DBT, pandas… La plateforme Snowflake AI Data Cloud s’enrichit à tout va, selon Christian Kleinerman, son vice-président exécutif Produit.
Christian Kleinerman, vice-président exécutif Produit chez Snowflake
Christian Kleinerman, vice-président exécutif Produit chez Snowflake

Lors du Snowflake Summit 2025 (et par la suite), Christian Kleinerman, vice-président exécutif Produit chez Snowflake, a présenté des évolutions majeures concernant la gestion des données, l’intégration, les pipelines, et les outils destinés aux data analystes et développeurs.
Ainsi, Horizon Catalog avait été annoncé mi 2024, comme une couche logicielle native de gouvernance et de découverte, intégrée à la plateforme Snowflake AI Data Cloud. Ses fonctionnalités ont été étendues à l’interopérabilité avec les formats de tables ouverts Apache Iceberg et avec catalogues de données open source Apache Polaris (initialement développé par Snowflake). Sans oublier l’intégration avec Snowflake Cortex AI. Au passage, le moteur de recherche accessible en langage naturel Universal Search s’ouvre aussi à ces données externes à la plateforme. Autre nouveauté: avec l’assistant Copilot for Horizon Catalog, l’utilisateur peut adresser ses requêtes à Snowflake Horizon en langage naturel.
Afin de pousser l’intégration de données un cran plus loin, l’éditeur a lancé le service d’intégration Openflow (voir notre article) et annoncé de meilleures performances du streaming de données Snowpipe (ingestion de données serverless de Snowflake) ainsi qu’une optimisation de son tarif (plus prévisible).
Afin de simplifier encore la transformation des données, Snowflake a introduit (lors de son événement annuel début juin) Snowflake dbt Projects (en Public Preview). Puis, Dbt Fusion Engine a été intégré nativement au cœur de la plateforme Snowflake (annoncé fin juin). La gestion des projets DBT native dans Snowflake est accessible depuis la nouvelle interface Workspaces (environnements de développement intégré -IDE- dans l’interface web Snowsight).
Enfin, les spécialistes de la donnée apprécieront l’intégration de Pandas dans Snowflake (Python Pandas est une bibliothèque open source pour lire, nettoyer, transformer et analyser des données structurées). Pandas prend en charge les pipelines dans la plateforme, tandis que les Dynamic Tables servent à gérer “les pipelines externes”, et désormais les formats de tables ouverts (dont Iceberg). De plus, leurs performances ont été améliorées.
Ces technologies et solutions sont détaillées et expliquées dans ce long article didactique, avec illustrations à l’appui.

Rendre cet article en accès gratuit et visible par tous

500,00 HT

S’abonner pour accès illimité 1 an

250,00 HT

voir les détails

Acheter article à l’unité (format PDF)

10,00 HT

Ajouter au panier

Check Also

Sridhar Ramaswamy, CEO chez Snowflake, annonce le rachat de Crunchy Data

Contenu restreint