Tags Clean Rooms Data Driven Databricks Databricks Clean Rooms Databricks Marketplace David Meyer Delta Lake Delta Sharing Hudi Iceberg Lakehouse Lakehouse Apps Lakehouse Collaboration Platform Parquet UniForm Universal Format
Databricks toujours dans le peloton de tête des plateformes de données?
Après le datawarehouse et le datalake, place au Lakehouse! Et avec des technologies assez proches chez les éditeurs de plateformes de données. Bonne nouvelle! En effet, ces plateformes seront le cœur des entreprises Data Driven et des applications Data Centric (désolé, c’est beaucoup moins joli, une fois traduit).
Traditionnellement, une application était développée et une base de données créée pour y stocker ses informations. Résultat: de multiples bases éparpillées, souvent sans cohérence globale.
Dans un système d’information Data Centric, une unique base de données est partagée par les applications: plus de cohérence, moins de copies -transferts et autres moulinettes, un meilleur contrôle, une sécurité plus maitrisée… Moins cher et plus performant. En bonus, les plateformes évitent de recopier les données qu’elles adressent via des métadonnées, y compris en temps réel.
L’éditeur Databricks (voir notre portrait en deux volets) illustre bien cette tendance avec ses évolutions récentes. Place de l’IT a eu l’opportunité d’assister à une présentation avec David Meyer, directeur Produit chez Databricks. L’occasion de revoir les évolutions de la plateforme au cours de ces derniers mois. Surtout à la suite du rachat du spécialiste de l’intelligence artificielle MosaicML pour 1,3 milliard de dollars en juin 2023.
Un article très illustré pour mieux appréhender toutes ces technologies.