- Place de l'IT - https://placedelit.com -

ThoughtSpot éclaire l’analytique pour illuminer la pensée de l’utilisateur métier

ThoughtSpot

Création juin 2012
Siège Sunnyvale (Californie)
Fondateurs Ajeet Singh, , Amit Prakash Sanjay Agrawal, Vijay Ganesan, Priyendra Deshwal, Abhishek Rai et Shashank Gupta
Dirigeant Sudheesh Nair (CEO)
Effectif 600+ employés (65 europe)
Financement 543,7 millions de dollars
Dernière levée 248 millions de dollars en août 2019
Investisseurs Lightspeed Venture Partners, ServiceNow, Lane Bess, Steve Sommer, Sudheesh Nair, Khosla Ventures, General Catalyst, Geodesic Capital, Quentin Clark, Hewlett Packard Pathfinder, Capital One Growth Ventures, Sapphire Ventures, Future Fund et Silver Lake Waterman.

Malgré la ribambelle de solutions disponibles en visualisation/exploration de données, les startups se sont multipliées sur ce segment de marché depuis quelques années. Toutefois, certaines sortent du lot, à l’exemple de ThoughtSpot. Une start-up qui a levé plus d’un demi-milliard de dollars, et séduit des clients comme Walmart, BT, Hulu, Daimler, PetCo, 7-Eleven, Tesco, Vodafone, Telecom Italia, Comcast, Verizon… Alors que la filiale française ouvre à peine ses portes, l’histoire de la société et un survol de sa solution permettent de comprendre pourquoi les investisseurs et les entreprises ont fait ce choix.
Imaginez: un spécialiste des architectures en clusters, des ingénieurs spécialisés dans la recherche et la donnée avec des années d’expérience chez Google, Microsoft, Amazon, Oracle ou encore Yahoo -entre autres. Et si ce groupe partait de rien pour concevoir une plate-forme mettant l’analyse de données à portée de clic de l’utilisateur métier?
Tel est le challenge relevé par ThoughtSpot, créée en 2012 à Palo Alto (Californie) par Ajeet Singh (cofondateur de Nutanix) et 6 autres ingénieurs: Priyendra Deshwal, Abhishek Rai, Sanjay Agrawal, Vijay Ganesan, Shashank Gupta, Amit Prakash.
«Dès l’origine, l’objectif consistait à créer un moteur de recherche pour trouver l’information à travers les données, aussi simple à utiliser que Google,» explique Benjamin Caller, EMEA Alliance Leader et Regional Vice-President chez ThoughtSpot. «Il est primordial que les utilisateurs métier puissent utiliser seuls des outils analytiques pour répondre en temps réel à des problématiques comme “Ai-je un problème d’approvisionnement?”, “Sur quels produits dans quels magasins?”. Et tout cela sans avoir à faire appel à un datascientist afin qu’il leur crée un rapport en quelques jours, suivis de quelques semaines pour affiner les réglages…»
En février 2014, la start-up annonce une première levée de fonds de 10,7 millions de dollars bouclée par Lightspeed Venture Partners, ServiceNow, Lane Bess Steve Sommer et Sudheesh Nair.
En juin 2014, Lightspeed Venture et Khosla Ventures augmentent le capital de 30 millions de dollars.

Ajeet Singh cofondateur et président de ThoughtSpot.
Ajeet Singh cofondateur et président de ThoughtSpot.

Les choses sérieuses commencent jusqu’à 2 milliards de dollars

En octobre 2014, la société annonce la disponibilité de sa solution ThoughtSpot, une appliance de “recherche relationnelle”, solution d’analyse de données en libre-service. En décembre 2015, ThoughtSpot 3 s’enrichit d’un machine learning (ML) évolué pour accompagner l’utilisateur, avec Datarank (le ML calcule des recommandations contextuelles pendant la saisie en langage naturel), AutoJoins (graphes et jointures automatiques) et PopCharts (calcul et affichage à la volée pendant la saisie).
En février 2016, l’entreprise inaugure son siège EMEA à Londres.
En mai 2018, une levée de fonds de 50 millions de dollars (serie C) est bouclée par Lightspeed,Khosla, General Catalyst, Geodesic Capital et Quentin Clark. En octobre, Hewlett Packard Pathfinder rejoint les invevtisseurs de Serie C, et noue un partenariat pour proposer ThoughtSpot sur des infrastructures HPE avec commercialisation par les deux sociétés.
En juillet 2017, la start-up ouvre un entre de recherche à Bangalore (Inde), et lève 60 millions de dollars en août 2017 auprès de Lightspeed Venture et Capital One Growth Ventures.
Après avoir obtenu 145 millions de dollars supplémentaires en mai 2018 (Khosla Ventures, Sapphire Ventures, General Catalyst, Future Fund et Lightspeed Ventures), Ajeet Singh devient président de ThoughtSpot, en juillet, et cède son poste de CEO à Sudheesh Nair, jusque-là président de Nutanix (après en avoir été directeur commercial).

Sudheesh Nair, CEO de ThoughtSpot.
Sudheesh Nair, CEO de ThoughtSpot.

ThoughtSpot 5 arrive en novembre 2018 avec SearchIQ, son traitement automatique du langage naturel (NLP ou Natural Language Processing) pour une interface vocale. Le moteur de recommandation SpotIQ “piloté par l’intelligence artificielle” affiche des constatations marquantes (pics, anomalies, tendances fortes) à la volée. La solution est certifiée pour Google Cloud Platform et Microsoft Azure (serveurs virtuels en mode IaaS), en plus d’AWS et VMware.
En mars 2019, le siège de la société Quitte Palo Alto pour Sunnyvale.
En juin 2019, Salesforce rachète Tableau le montant plus que surprenant de 15,7 milliards de dollars (évaluation finale), et Google s’empare de Looker pour 2,6 milliards de dollars (startup de la Valley créée en 2011 et Ayant levé plus de 280 millions de dollars). DAsn la foulée, en août 2019, une levée de 248 millions de dollars (Sapphire Ventures, Silver Lake Waterman et Lightspeed) porte l’évaluation de la ThoughtSpot à 1,95 milliard de dollars. En mars 2020, la filiale française ouvre à Paris.
ThoughtSpot a levé 543,7 millions de dollars en 7 ans!

L’architecture ThoughtSpot: ouverture, performance et haute disponibilité.
L’architecture ThoughtSpot: ouverture, performance et haute disponibilité.

Que se passe-t-il sous le capot?

La plateforme créée à partir d’une feuille blanche a directement intégré les technologies à l’état de l’art, sans s‘encombrer de l’existant.
Pour que la solution soit simple et accessible à tous, son infrastructure doit être automatisée et évolutive. C’est pourquoi son socle est un cluster distribué, avec un Distributed Cluster Manager permettant de gérer, superviser et faire évoluer simplement l’ensemble, appuyé par un tableau de bord en temps réel. ThoughtSpot précise que la distribution optimisée des charges de travail s’effectue sur un cluster multi-nœuds évolutif jusqu’à plusieurs téraoctets de données. Bien entendu, on retrouve la panoplie de la haute disponibilité: réplication, redondance, reprise sur incident d’un nœud, sauvegardes automatisées…
Pièce maîtresse, le moteur de calcul In-Memory Falcon peut avaler des milliards de lignes en quelques millisecondes, grâce à un traitement massivement parallèle (MPP) qui adresse les requêtes à des données en colonnes, dont le cache accélère les réponses en conservant les requêtes les plus demandées. Des résultats rendus possibles grâce à une organisation intelligente des données et de leur schéma favorisant les jointures rapides à grande échelle.

Des modules intégrés et complémentaires développés par ToughtSpot
Des modules intégrés et complémentaires développés par ToughtSpot

Un peu d’intelligence dans un monde de données brutes

Le BI & Vizualisation Sever traduit les termes saisis  ou dictés en une requête optimisée, et affiche le résultat dans le graphique le plus adapté au type de données (l’utilisateur peut le modifier en un simple clic). Ce serveur affiche les résultats pendant la saisie, en réalisant les calculs et les agrégations en temps réel. Les modèles logiques de données, combinant plusieurs sources de données, sont réutilisables. Les éléments graphiques à l’écran sont manipulables par l’utilisateur par simples glisser-déposer. Et chaque donnée ou illustration peut être détaillée jusqu’à la donnée primaire, si nécessaire.
«Parfois, le manque de granularité peut amener à des décisions bizarres…» souligne Benjamin Caller, EMEA Alliance Leader et Regional Vice-President chez ThoughtSpot. «Ainsi, un géant de la distribution américain constatant une baisse de 0,10 cents sur les boissons énergétiques, répercutait cette baisse sur tous ses produits équivalents aux États-Unis. Cependant, si le Redbull se vend bien dans une magasin, pourquoi en baisser le prix? En revanche, au même endroit il peut s’avérer intéressant de baisser le prix du Monster, moins populaire. Et réciproquement. Avec ThoughtSpot, cette entreprise peut désormais effectuer tout cela en temps réel et en toute connaissance de cause.»
Avec BI & Vizualisation Sever, il est aussi possible de définir des alertes et des planifications pour rapports et tableaux de bord.

Benjamin Caller, EMEA Alliance Leader et regional vice-president chez ThoughtSpot.
Benjamin Caller, EMEA Alliance Leader et regional vice-president chez ThoughtSpot.

En s’appuyant sur l’intelligence artificielle et le Machine Learning, SpotIQ détecte automatiquement les anomalies et les valeurs aberrantes, qui pourraient passer inaperçues à l’utilisateur. Les résultats sont générés en langage naturel sous forme de phrases, afin d’améliorer la compréhension. À partir des informations, des tendances et des anomalies, SpotIQ génère des aperçus graphiques dans la rubrique “Did you know?” sur l’écran. En mode interactif, SpotIQ utilise les réponses de l’utilisateur pour affiner sa compréhension des données. Ce module établit le lien entre les mots saisis et l’affichage à la volée. À noter: la fonction AI Inspector explique comment les résultats ont été générés en s’appuyant sur les requêtes requêtes, l’exploration en drill-down, et les divers calculs.
Reposant sur des algorithmes de traitement du langage naturel (NLP), SearchIQ apporte l’interrogation en mode vocal. L’éditeur assure que «l’utilisateur peut converser naturellement avec les données et obtenir des réponses précises en un temps record.» L’utilisateur peut examiner la façon dont les termes de recherche sont cartographiés, et ajuster le vocabulaire pour affiner sa recherche.
SearchIQ indexe les données et leur schéma dans le cache pour faciliter les requêtes et accélérer les résultats. En mode saisie assistée, il propose en temps réel des suggestions basées sur les données, les métadonnées, et les comportements de l’utilisateur. Il s’appuie aussi sur d’autres mécanismes recourant à l’intelligence artificielle: le “datarank” des données, les synonymes, les mots-clés détectés… Là encore, la fonction Search Inspector explique comment les termes de la recherche ont été traduits en requêtes SQL. Finie la boîte noire?…
Est-on réellement obligé de recopier toutes les données dans le cluster ThoughtSpot? «Absolument pas!» répond Benjamin Caller. «Depuis plusieurs mois, nous proposons notre solution Embrace pour envoyer les requêtes vers des sources de données, sans déplacer les données, et leur appliquer ensuite les analyses et visualisations de ThoughtSpot.» Embrace est déjà opérationnel avec Snowflake, Amazon Redshift, Google BigQuery et Microsoft Azure Synapse. Pour des temps de réponse de l’ordre de 200 ms sur ThoughtSpot, il faut calculer environ 400 ms si les données restent sur Snowflake, par exemple.

Le tarif de la solution est fixé sur le volume de données chargées dans le cluster (25 Go, 100 Go… 10 To…), quel que soit le nombre d’utilisateurs. Ce volume est calculé en nombre de lignes pour Embrace. L’éditeur propose des licences pour un, deux ou trois ans. Des accords spécifiques peuvent être passés avec des fournisseurs de services en ligne qui souhaiteraient revendre la solution sur des plus petits volumes.
La filière française vient juste d’ouvrir, mais l’éditeur était tout déjà présent sur le territoire. Néanmoins, il devra s’efforcer de développer rapidement des partenariats pour mettre sur pied un réseau d’intégrateurs et de partenaires, indispensable à la réussite de telles solutions.