- Place de l'IT - https://placedelit.com -

Jonathan Ellis, CTO DataStax: «Un juste équilibre entre commercial et open source»

DataStax

Création mars 2010
Siège Santa Clara (Californie)
Fondateurs Jonathan Ellis (CTO) et Matt Pfeil
Dirigeant Billy Bosworth (CEO, mai 2011)
Effectif 700+ personnes
Financement global 190 millions de dollars
Dernier financement 106 millions (sept 2014)

Pour comprendre la genèse de DataStax, il faut passer par Rackspace…Entre 2008 et 2009, Jonathan Ellis dirigeait l’équipe Cassandra (système de gestion de base de données NoSQL) chez le fournisseur américain de solutions d’hébergement et de services cloud Rackspace.
Très actif sur le projet open source, le manager le prend en main. A l’époque, de nombreuses grandes entreprises exprimaient le souhait de disposer d’un support spécialisé pour Cassandra. Jonathan Ellis s’associe donc avec Matt Pfeil (un autre employé de Rackspace) pour créer l’ossature de ce qui deviendra DataStax en mars 2010.
Son parcours professionnel se révèle dense: avant Rackspace, il s’était illustré chez le fournisseur de stockage en ligne Mozy (issu de Berkeley Data Systems puis racheté en octobre 2007 par EMC pour 68 millions de dollars puis cédé à Carbonite en mars 2018 pour 145 millions de dollars) en concevant une solution de stockage évolutive basée sur le code Reed Solomon.
Cofondateur et disposant des fonctions de directeur technique (CTO pour Chief Technical Officer), Jonathan Ellis aborde pour Place de l’IT l’actualité associée à DataStax: open source, cloud, AppStax Service…

Jonathan Ellis, cofondateur et directeur technique de DataStax
Jonathan Ellis, cofondateur et directeur technique de DataStax

Comment se situe aujourd’hui DataStax entre open source et solution commerciale?

Lorsque nous avons lancé DataStax en 2010, l’open source jouait pleinement son rôle de levier pour générer des opportunités commerciales («lead generation» en anglais). D’ailleurs, nous avons très rapidement atteint un chiffre d’affaires de plusieurs millions de dollars.
Le fait de proposer une distribution open source a facilité les argumentations des éditeurs comme Oracle entre autres qui ont fortement mis en avant le prétexte qu’ils réduisaient le «risque open source».
D’ailleurs, des sociétés comme Twitter ou Netflix, qui ont été parmi nos premiers supporters et plus généralement meneurs sur l’open source, ont toujours porté une attention particulière aux dérives possibles des informaticiens. En effet, l’efficacité de la «lead generation» repose fortement sur la manière avec laquelle l’entreprise crée ses services cloud: simplicité d’utilisation, de création, de mises à jour…
Puis, le paysage de notre économie a fortement évolué. Nous sommes dans une phase beaucoup plus dynamique, dans laquelle lorsqu’un projet open source apporte de la valeur, il rencontre forcément le succès.
Au passage, Amazon Web Services (AWS) adopte très rapidement des services reposant sur ces projets populaires, comme ce fut le cas avec Elastic Search ou Kafka. D’ailleurs, sans y avoir contribué la plupart du temps.
Enfin, il est possible de faire plus avec un modèle incluant des technologies propriétaires. Ainsi, DataStax propose une solution commerciale tout en contribuant à la communauté open source. Le modèle consiste aujourd’hui à conserver un juste équilibre entre commercial et open source que la plupart des communautés open source comprennent.

Trois services disponibles fin 2019 sur la plateforme Cloud DataStax
Trois services disponibles fin 2019 sur la plateforme Cloud DataStax

Sur quelles technologies repose votre future offre cloud? Et quand ces services seront-ils disponibles?

Sur le cloud, nous avons opté pour une approche «single tenant». En effet, les clients ne souhaitent pas forcément dépendre d’un moteur global et de ressources logicielles et/ou matérielles partagées.
Par ailleurs, on obtient ainsi un meilleur niveau d’isolation, tout en assurant une cohérence globale avec les mises à jour automatisées et autres avantages du cloud.
Constellation est notre portail sur AWS et sera bientôt disponible sur trois clouds ou plus. La prochaine étape consiste à combiner le cloud et les installations sur site.
Avant la fin de l’année, nous proposerons CaaS (Cassandra as a Service) sur AWS, Google Cloud, et Microsoft Azure. En 2020 arriveront les services Search (SolR), Analytics, Graph et Geo-spatial.

Avec une offre comme Cassandra as a Service, n’entrez-vous pas en concurrence avec les éditeurs de cloud?

Il s’agit plutôt d’un partenariat avec les clients qui peuvent utiliser leurs crédits chez Google pour déployer des services DataStax. Google a d’ailleurs décidé de compenser financièrement les revenus de ses commerciaux lorsqu’une entreprise fait le choix de la solution DataStax CaaS au détriment de Google Big Query. Une approche que nous souhaiterions généraliser à nos accords avec Amazon Web Services et Microsoft Azure.

CaaS sera-t-elle proposée en marque blanche?

C’est déjà le cas pour notre solution logicielle que nous proposons aux intégrateurs et prestataires. En ce qui concerne Cassandra as a Service (CaaS), nous ne proposons pas encore le service en marque blanche mais nous ne sommes pas fermés à ce type de discussion avec des fournisseurs de services en ligne.

Le futur service AppStax
Le futur service AppStax

Avec le futur AppStax Service, vous faîtes un pas vers la programmation. Jusqu’à quel point?

AppStax Service fait partie de Constellation. Les microservices générés sont déployables aussi bien sur site que sur le cloud.
À travers une interface intuitive, le développeur définit les données et les modèles d’accès dont il a besoin pour pouvoir se concentrer sur son application. AppStax prendre en charge tous ces aspects avec la meilleure gestion possible des données. Bien entendu, il est possible d’effectuer des itérations entre l’application et AppStax pour affiner les résultats et répondre avec agilité aux besoins de l’utilisateur.
AppStax expose alors les données via des API personnalisées et conformes aux conventions standards comme GraphQL ou Swagger REST. Au départ et pendant les itérations, il s’agit simplement d’une régénération via des fichiers Json.
L’objectif consiste pas à rivaliser avec des environnements de développement comme Visual Studio (Microsoft), mais plutôt de proposer des plug-in bidirectionnels pour simplifier et accélérer les développements.