El cofundador y director ejecutivo de Rabbit, Jesse Lyu, no le teme a la muerte… al menos a la muerte de la empresa. Le dijo a TechCrunch que la compañía es una startup cuya suerte puede verse influenciada por los caprichos de rivales multimillonarios, pero esa no es razón para darse por vencido e irse a casa.
Apareciendo en el escenario de StrictlyVC LA, Lyu explicó su enfoque bastante filosófico ante la amenaza de que Google, Microsoft o Apple vengan a aplastarlos. (Las citas se han editado ligeramente para mayor claridad).
El r1 de Rabbit, el asistente de IA de bolsillo que atrajo un gran revuelo después de su debut en el CES, es sin duda una propuesta original. El dispositivo, que tiene la mitad del tamaño de un teléfono, actúa estrictamente como un asistente de voz, pero puede operar de forma remota sus aplicaciones y realizar acciones complejas, así como responder preguntas y mantener una conversación como ChatGPT. Describió las dos partes como “intención” y “acción”.
“Tuve esta visión hace muchos años, en realidad hace 10 años, pero la tecnología no estaba lista. Esta es la primera vez en la historia que un dispositivo como este es realmente posible”, dijo Lyu.
Explicó que le habían intrigado las capacidades de los LLM para comprender el lenguaje y la intención, y que con la aparente versatilidad de los sistemas basados en transformadores, era natural intentar que ellos también realizaran acciones.
“Inmediatamente intentamos usar superindicaciones para que este modelo de lenguaje hiciera cosas, y el resultado fue muy miserable”, recordó. “Hay una demostración de otra empresa que le gusta, use un LLM para ir al último video de YouTube del Sr. Beast y dejar un comentario. Sí, en teoría, los modelos de lenguaje pueden hacer eso. Pero haría que literalmente tuvieras que mirar tu pantalla haciendo eso paso a paso. Y se necesitan aproximadamente entre dos y tres minutos para terminar una tarea como esa. Simplemente no creemos que eso pueda convertirse en una buena experiencia para el usuario final”.
Su solución es el “modelo de acción grande”, que se entrena con horas y horas de usuarios reales interactuando con aplicaciones populares: “Spotify, Uber, Expedia, DoorDash, lo que sea. Tenemos el top 800 de aplicaciones de mayor frecuencia. Luego configuramos esta red neuronal simbólica y le pedimos a esta IA, que ahora llamamos modelo de acción grande, que revise esos clips, pero cuadro por cuadro. La idea es que, simbólicamente, la IA eventualmente será lo suficientemente inteligente como para extraer todos los botones, todos los elementos, y luego básicamente podremos construir una lógica para automatizar”.
La parte del lenguaje todavía se ejecuta en servicios LLM de terceros como Perplexity, que parece estar haciendo una apuesta por capitalizar el éxito de Rabbit, ofreciendo un año de servicio gratuito además de lo que ofrece r1. Sugerí que los costos de API y otras consideraciones podrían representar un peligro para la solvencia de la startup.
“En primer lugar, no estamos perdiendo dinero vendiendo r1, lo cual es un logro muy, muy, muy significativo, especialmente para nuevas empresas de generación 1. No vamos a arruinarnos vendiendo más unidades. Le doy todo el crédito a mi equipo de hardware, muchachos increíbles, por poder básicamente negociar las piezas y la lista de materiales. [bill of material] costos”, dijo. “Estamos muy cerca de los 100.000 pedidos. Dos días antes de la keynote II, le dije a mi equipo que sería realmente bueno si pudiéramos vender 500 unidades el primer día. Pero vendimos 18.000”.
En cuanto a la suscripción, Lyu simplemente no cree que funcione, especialmente cuando la tesis del dispositivo es barata y simple. Aunque mencionó que los usuarios podrán entrenar y vender sus propios modelos específicos de aplicaciones más adelante, y Rabbit tomaría una parte de eso, pero advirtió que este es un plan a largo plazo sin detalles específicos todavía.
Por último, cuando se enfrentó al hecho de que las empresas más grandes y ricas del mundo están gastando miles de millones para avanzar en IA, Lyu brindó una perspectiva casi zen sobre la perspectiva de ser aplastadas bajo el talón de Google, Microsoft o Apple (cuyo CEO Tim Cook acaba de decir que “abrirá nuevos caminos” en IA este año).
“No me hago ilusiones al pensar que no somos una startup. Somos una startup”, dijo. “Quiero decir, la primera lección que aprendí de Y Combinator hace dos años es que el 99% de las nuevas empresas morirán. Si tu mentalidad como emprendedor es: ‘Oh, tengo una idea genial y puedo garantizar que funcionará, sin importar lo que intenten todas estas grandes empresas tecnológicas…’ Quiero decir, estás delirando. No existe tal cosa. La realidad es que una startup es un juego de supervivencia y es mejor que dediques tu tiempo a concentrarte en tus propias cosas”.
“Ellos harán lo que van a hacer y yo haré lo que voy a hacer, ¿verdad? Tiene que haber algunos fundadores que, cuando se enteraron de que Apple estaba fabricando Apple Cars, se detuvieron, ¿verdad? Acaban de cancelar. ¿Ahora que? Creo que es bueno tener este nivel de competencia que sólo nos ayudará a crecer más rápido o morir más rápido, que es la naturaleza de las startups. Es o o… todavía no lo sé. Pero estoy haciendo lo mejor que puedo; como dije, es un juego de supervivencia”.
Puedes ver el panel completo a continuación.