Databricks, géant de l’analyse et de l’intelligence artificielle, a récemment annoncé l’acquisition de la société de gestion de données Tabular.
Selon CNBC, Databricks aurait déboursé plus d’un milliard de dollars pour cette transaction. Ryan Blue, cofondateur de Tabular, ainsi que Daniel Weeks et Jason Reid, rejoindront Databricks pour travailler à l’unification des bases de clients et des communautés des deux entreprises.
Tabular, fondée en 2021 par Blue, Weeks et Reid, propose des produits de gestion de données basés sur Apache Iceberg, un format open source haute performance pour les bases de données. Apache Iceberg, développé initialement par Blue et Weeks chez Netflix, optimise les tables de données pour le big data tout en permettant aux moteurs de données de travailler avec ces tables.
Lire aussi :
- Apple va-t-il sherlocker Arc Search avec ses nouvelles fonctionnalités IA ?
- Les startups espagnoles atteignent une valeur globale de 100 milliards d’euros en 2023
L’intégration des technologies Iceberg et Delta Lake
L’acquisition de Tabular par Databricks marque une étape cruciale dans la convergence des formats de data lakehouses. Historiquement, Iceberg et Delta Lake, le format de Databricks, étaient en concurrence. Bien qu’ils utilisent tous deux le format de stockage de données Apache Parquet, ils présentaient des incompatibilités clés.
Ryan Blue a annoncé que l’objectif est désormais d’améliorer le support d’Iceberg sur toute la plateforme Databricks. Cette intégration vise à offrir une meilleure interopérabilité, permettant ainsi aux utilisateurs de profiter du travail des deux communautés sans se soucier du format sous-jacent.
Un marché en pleine expansion
Le marché des data lakehouses est en pleine expansion, avec environ 74 % des organisations qui en possèdent un, selon le MIT Tech Review. Pour Databricks, l’acquisition de Tabular était un choix évident pour renforcer sa position. En réduisant le nombre de formats concurrents et en augmentant le support pour plusieurs formats, la plateforme de Databricks devient plus attractive pour les clients corporatifs, même si ces formats ne sont pas propriétaires.
Dans un billet de blog coécrit par Ali Ghodsi, PDG de Databricks, et Reynold Xin, architecte en chef, la société affirme son engagement envers les formats ouverts et les données open source dans le cloud. Cette acquisition met en lumière notre engagement envers les formats ouverts et les données open source dans le cloud, lit-on dans le billet. “C’est un long voyage, qui prendra probablement plusieurs années à réaliser au sein des communautés [de data lakehouse].”
Perspectives d’avenir
Avant son acquisition, Tabular, basée à San Jose, avait levé 37 millions de dollars en capital-risque auprès d’investisseurs tels qu’Andreessen Horowitz, Zetta Venture Partners et Altimeter Capital. Databricks prévoit de finaliser l’achat au cours du deuxième trimestre 2024, sous réserve des conditions habituelles de clôture.
Avec cette acquisition, Databricks renforce sa position de leader sur le marché des data lakehouses et s’engage dans une voie d’innovation et de collaboration ouverte. L’intégration des technologies Iceberg et Delta Lake promet de simplifier et d’améliorer la gestion des données pour les entreprises du monde entier, ouvrant ainsi de nouvelles perspectives pour l’analyse et l’intelligence artificielle.