Databricks, el gigante del análisis y la inteligencia artificial, adquirió la empresa de gestión de datos Tabular por una suma no revelada. (CNBC informa que Databricks pagado más de mil millones de dólares.)
De acuerdo a Según el cofundador de Tabular, Ryan Blue, él y los otros dos cofundadores de Tabular, Daniel Weeks y Jason Reid, se unirán a Databricks de alguna manera. Allí, trabajarán para unificar las comunidades y bases de clientes de Tabular y Databrick.
“Unirse a Databricks significa que habrá más contribuciones de nuestros nuevos colegas”, escribe Blue en una publicación de blog. “Mientras hacemos esto, nos aseguramos de que nuestro enfoque hacia [our community] no está cambiando”.
Tabular, fundada por Blue, Weeks y Reid en 2021, ofrece productos de gestión de datos basados en Apache Iceberg, un proyecto que Blue y Weeks desarrollaron mientras estaban en Netflix y luego donaron a la Apache Software Foundation. Iceberg es un formato de código abierto y de alto rendimiento para bases de datos que optimiza las tablas de las bases de datos para big data y al mismo tiempo permite que los motores de datos trabajen con las tablas.
Iceberg compitió con Delta Lake de Databricks en la guerra de formatos por lagos de datos: arquitecturas de datos creadas para almacenar grandes cantidades de datos sin procesar y al mismo tiempo proporcionar funciones de estructura y gestión. Si bien tanto Iceberg como Delta Lake utilizan el formato de almacenamiento de datos Apache Parquet, son incompatibles en aspectos clave.
Sin embargo, pronto Delta Lake y Iceberg convergerán en uno. Databricks y Tabular se comprometen a trabajar para lograr un estándar común a la luz de la noticia de la adquisición.
“[We will be] trabajando para mejorar el soporte de Iceberg en toda la plataforma Databricks”, dijo Blue. “Nuestro objetivo es mejorar la interoperabilidad para que puedas aprovechar el increíble trabajo de ambas comunidades y no tener que preocuparte por el formato subyacente”.
El mercado de los lagos de datos es enorme. de acuerdo a Según MIT Tech Review, alrededor del 74% de las organizaciones tienen uno y, por lo tanto, desde la perspectiva de Databricks, incorporar Tabular a su familia corporativa fue probablemente la opción clara. Después de todo, menos formatos competitivos de data lakehouse (o, alternativamente, plataformas con fuerte soporte para múltiples formatos) hacen que la plataforma de Databricks sea más atractiva para los clientes corporativos, incluso si esos formatos no son propiedad del proveedor.
en un entrada en el blog En coautoría del director ejecutivo de Databricks, Ali Ghodsi, y del arquitecto jefe Reynold Xin, Databricks dice que tiene la intención de “trabajar en estrecha colaboración” con las comunidades de Iceberg y Delta Lake para “aportar interoperabilidad a los formatos mismos”.
“Esta adquisición destaca nuestro compromiso con los formatos abiertos y los datos de código abierto en la nube”, se lee en la publicación del blog. “Este es un largo camino, que probablemente llevará varios años lograr en [the data lakehouse] comunidades”.
Antes de la adquisición, Tabular, con sede en San José, había recaudado 37 millones de dólares en capital de riesgo de inversores, incluidos Andreessen Horowitz, Zetta Venture Partners y Altimeter Capital. Databricks dice que espera que la compra se cierre en algún momento del segundo trimestre de 2024, sujeto a las condiciones de cierre habituales.