Tags AI Data Cloud Copilot for Horizon Catalog DBT dbt Fusion engine dbt Labs Dynamic Tables Horizon Catalog Projets DBT Python Pandas Snowflake AI Data Cloud Snowflake dbt Projects Snowflake Horizon Snowflake Horizon Catalog Snowflake Open Catalog Snowflake Summit 2025 Snowflake Summit 25 Snowflake Universal Search Universal Search
Pour Snowflake, quand la donnée va, tout va.
Lors du Snowflake Summit 2025 (et par la suite), Christian Kleinerman, vice-président exécutif Produit chez Snowflake, a présenté des évolutions majeures concernant la gestion des données, l’intégration, les pipelines, et les outils destinés aux data analystes et développeurs.
Ainsi, Horizon Catalog avait été annoncé mi 2024, comme une couche logicielle native de gouvernance et de découverte, intégrée à la plateforme Snowflake AI Data Cloud. Ses fonctionnalités ont été étendues à l’interopérabilité avec les formats de tables ouverts Apache Iceberg et avec catalogues de données open source Apache Polaris (initialement développé par Snowflake). Sans oublier l’intégration avec Snowflake Cortex AI. Au passage, le moteur de recherche accessible en langage naturel Universal Search s’ouvre aussi à ces données externes à la plateforme. Autre nouveauté: avec l’assistant Copilot for Horizon Catalog, l’utilisateur peut adresser ses requêtes à Snowflake Horizon en langage naturel.
Afin de pousser l’intégration de données un cran plus loin, l’éditeur a lancé le service d’intégration Openflow (voir notre article) et annoncé de meilleures performances du streaming de données Snowpipe (ingestion de données serverless de Snowflake) ainsi qu’une optimisation de son tarif (plus prévisible).
Afin de simplifier encore la transformation des données, Snowflake a introduit (lors de son événement annuel début juin) Snowflake dbt Projects (en Public Preview). Puis, Dbt Fusion Engine a été intégré nativement au cœur de la plateforme Snowflake (annoncé fin juin). La gestion des projets DBT native dans Snowflake est accessible depuis la nouvelle interface Workspaces (environnements de développement intégré -IDE- dans l’interface web Snowsight).
Enfin, les spécialistes de la donnée apprécieront l’intégration de Pandas dans Snowflake (Python Pandas est une bibliothèque open source pour lire, nettoyer, transformer et analyser des données structurées). Pandas prend en charge les pipelines dans la plateforme, tandis que les Dynamic Tables servent à gérer “les pipelines externes”, et désormais les formats de tables ouverts (dont Iceberg). De plus, leurs performances ont été améliorées.
Ces technologies et solutions sont détaillées et expliquées dans ce long article didactique, avec illustrations à l’appui.