Inicio de la transformación de datos Tobiko Puede que aún no sea un nombre conocido, pero es posible que haya visto al cofundador y director ejecutivo Tyson Mao sobre “Beauty and the Geek” en el pasado y su cofundador, hermano y director de tecnología Toby Mao, en el circuito de speedcubing. (Ambos han tenido récords mundiales en el pasado y Tyson cofundó la World Cube Association). Desde entonces, los hermanos, junto con su cofundador Iaroslav Zeigerman Trabajó en una amplia variedad de empresas, desde Apple hasta Airbnb, Google y Netflix, donde Tyson y Zeigerman se conocieron.
Ahora, con Tobiko, pretenden reimaginar cómo los equipos trabajan con datos ofreciendo una compatible con dbt plataforma de transformación de datos, con la popular SQLMesh y SQLGlot proyectos de código abierto en su núcleo y una interfaz de usuario intuitiva de código bajo para crear transformaciones y canalizaciones de datos.
La compañía lanzará el martes su plataforma en la nube y anunciará un total de 21,8 millones de dólares en financiación, divididos entre una ronda inicial de 4,5 millones de dólares y una ronda Serie A de 17,3 millones de dólares liderada por Theory Ventures. 20Sales, el director ejecutivo de Fivetran, George Fraser, el director ejecutivo del censo, Boris Jabes, y el director ejecutivo de MotherDuck, Jordan Tigani, también invirtieron en la empresa.
Mientras estuvo en Airbnb, Toby dirigió la dirección de la empresa. proyecto minerva, la capa semántica de métricas internas de la empresa. Sin embargo, mientras trabajaba en eso, dice que se dio cuenta de que el verdadero poder de Minerva no era la semántica sino sus capacidades de transformación de datos.
“Los pasos para pasar de los datos sin procesar al valor real del negocio son muchas cosas que suceden allí”, me dijo. “Es mucho trabajo duro. Por eso queríamos construir eventualmente una empresa de semántica, pero primero queremos resolver la transformación. Entonces, en Airbnb, obtuve una demostración de las herramientas estándar de la industria, dbt, y eso me dio la inspiración para comenzar esto”.
Toby reconoció la popularidad y funcionalidad de dbt, que se ha convertido en una especie de estándar de la industria de la construcción. Pero argumentó que no es la solución adecuada para todas las empresas. “DBT fue realmente diseñado para acelerar las pilas de datos de las empresas de Serie A”, dijo. “Queríamos crear una plataforma de datos, una herramienta de transformación de datos, que pudiera funcionar en cualquier empresa, incluso al estilo FAANG. Así que tomamos nuestra experiencia, nuestro conocimiento colectivo y construimos un sistema que pudiera ampliarse con grandes cantidades de datos y grandes cantidades de personas”.
Como explicó Zeigerman, en el centro de esta plataforma moderna se encuentra SQLMesh, una herramienta de código abierto que permite a los desarrolladores crear canales de datos con herramientas integradas para la transformación, prueba y colaboración de datos. Aquí es también donde entra en juego la experiencia del equipo en semántica. “SQLMesh entiende SQL, en lugar de tratarlo como un fragmento de texto”, explicó. Y esa comprensión proviene de SQLGlot, que Toby creó durante su estancia en Airbnb. “Esta capacidad de comprender SQL desbloquea un montón de cosas que aumentan significativamente la velocidad de desarrollo y productividad de la ingeniería”.
![](https://techcrunch.com/wp-content/uploads/2024/06/tobiko.webp?w=680)
Esta herramienta permitió a Tobiko realizar comprobaciones de sintaxis en consultas SQL, por ejemplo, antes de enviarlas a la base de datos. También categoriza y rastrea todos los cambios que realizan los ingenieros en el proceso de desarrollo y les dice si rompen algo en relación con otros conjuntos de datos y transformaciones en el sistema.
“Realmente creemos que esta será una de las primeras herramientas de observabilidad que no sólo entenderá que algo se rompió, sino también por qué se rompió, porque entendemos su código, entendemos cada versión de cada código que haya escrito y “Podemos vincular cada fracaso con ese cambio”, dijo Tyson.
![](https://techcrunch.com/wp-content/uploads/2024/06/observer_dashboard.jpg?w=680)
Tobiko también ofrece a las empresas la posibilidad de crear lo que el equipo llama “entornos de datos virtuales” que los desarrolladores pueden utilizar durante la fase de desarrollo y luego reutilizarlos para otros proyectos (o incluso en producción).
El equipo me dice que en este momento se dirige principalmente a equipos de ingeniería de datos y que está trabajando con clientes de todos los tamaños, incluidas algunas nuevas empresas unicornio. Muchos de ellos están incorporando aplicaciones completamente nuevas al servicio, pero como es compatible con dbt, también hay varios usuarios de dbt que han hecho el cambio.