El Ai humano Chapa y Rabbit de mano han captado bastante interés de la prensa por sus enfoques individuales para integrar la IA generativa con el hardware. Humane, en particular, presenta su dispositivo portátil como una mirada a la vida más allá del teléfono inteligente. Naturalmente, esto plantea la pregunta: ¿qué es exactamente lo que está mal con el teléfono inteligente? Si bien es cierto que el factor de forma se ha estancado, estos dispositivos todavía están en el mundo, en miles de millones de manos.
A principios de esta semana, me reuní con Jerry Yue en medio del ruido cacofónico del stand de Deutsch Telekom en el Mobile World Congress. Después de una demostración del producto y una conversación, admito que estoy impresionado con el Cerebro.ai (conocido alternativamente como Brain Technologies) la visión del fundador y director ejecutivo para el futuro de los teléfonos inteligentes. No iré tan lejos como para decir que estoy completamente convencido hasta que haya tenido la oportunidad de pasar más tiempo con el producto, pero ofrece una imagen absolutamente convincente de cómo la IA generativa podría ser fundamental para la próxima generación de dispositivos.
Todo el tema del “futuro de los teléfonos inteligentes” puede ser hiperbólico, pero al menos sospecho que algunos de los nombres más importantes del negocio están estudiando actualmente la forma en que la IA generativa propia forma efectivamente la columna vertebral del sistema operativo del producto. Pero si bien las compañías telefónicas pueden ver el futuro, la interfaz puede resultar más confusa para los consumidores. La implementación da un vuelco al paradigma actual del sistema operativo de teléfonos inteligentes, y requiere una demostración para comprender completamente en qué se diferencia y por qué es útil. Si bien admito que el campo no me convenció completamente, verlo en acción pone de relieve su eficacia.
El sistema operativo no está completamente desconectado del sistema operativo abierto de Google, sino sólo en el sentido de que está construido sobre el kernel de Android. Como hemos visto en el desarrollo de HarmonyOS de Huawei en la era Trump, es completamente posible crear algo distinto de Android usándolo como base. Aquí, la IA generativa está más que simplemente integrada en el sistema: es la base de la forma en que interactúa con el dispositivo, cómo responde y la interfaz que construye.
La noción de un “teléfono con IA” no es del todo nueva. De hecho, es una frase que vas a escuchar. mucho en los próximos años. Te garantizo que estarás harto de esto en diciembre. Elementos de IA/ML se han integrado en dispositivos de alguna forma desde hace varios años. Entre otras cosas, la tecnología es fundamental para la fotografía computacional, es decir, el procesamiento de los datos recopilados por el sensor de la cámara que se produce en el chip.
Sin embargo, a principios de este mes, Samsung se convirtió en una de las primeras grandes empresas en realmente apoyarse en la noción de un “teléfono con IA”. La distinción aquí es la llegada de la IA generativa, la tecnología detrás de programas como Google Gemini y ChatGPT. Una vez más, gran parte de la integración ocurre en el lado de las imágenes, pero está comenzando a filtrarse también en otros aspectos.
Dada la gran inversión que Google ha hecho en Gemini, es lógico que esta tendencia sólo aumente en los próximos años. Apple también ingresará a la categoría en algún momento a finales de este año. No clasificaría la IA generativa como un cambio total en estos dispositivos todavía, pero está claro que aquellas empresas que no la adopten ahora se quedarán atrás en los próximos años.
El uso de la tecnología por parte de Brain.ai es mucho más profundo que otras implementaciones actuales. Sin embargo, desde una perspectiva de hardware, es un teléfono inteligente estándar. De hecho, el acuerdo con Deutsch Telecom que encontró a Yue exhibiendo en el stand cargado de color magenta significa que el sistema operativo inicialmente verá la luz a través del dispositivo conocido como T-Mobile REVVL aquí en los Estados Unidos (conocido como “T Phone” en mercados internacionales como la UE). El modelo preciso, la fecha de lanzamiento y la naturaleza del acuerdo se revelarán “pronto”, según Yue.
La verdad, sin embargo, es que la interfaz Brain está diseñada para ser independiente del hardware y adaptarse al factor de forma en el que se ejecuta. Por supuesto, eso no quiere decir que el hardware no sea importante. En esencia, el T-Mobile REVVL Plus, por ejemplo, es un teléfono económico, con un precio de alrededor de $200. No es un buque insignia de ninguna manera, pero ofrece una buena relación calidad-precio, incluido un procesador Snapdragon 625 y una cámara trasera dual de 13 y 15 megapíxeles, respectivamente. Aunque 2 GB no es mucha RAM, Yue insiste en que el sistema operativo Brain.ai puede hacer más con menos. Además, nuevamente, no sabemos qué especificaciones específicas tendrá el dispositivo en el lanzamiento.
La interfaz comienza con una pantalla estática. A partir de ahí, puedes consultar las cosas con un mensaje de voz o de texto. En un ejemplo, Yue le pide al sistema que “recomiende un regalo para mi abuela, que no puede levantarse de la cama”. A partir de ahí, Brain se pone a trabajar obteniendo no la respuesta a la consulta, sino una interfaz específica para ella; en este caso, se trata de resultados agregados de comercio electrónico. La página resultante es básica desde una perspectiva de diseño: texto negro sobre un fondo blanco. Las oraciones se alternan con cuadros que muestran los resultados (en este caso, mantas y Kindles).
La consulta se encuentra en la parte superior. Esto, como gran parte de la interfaz, es interactivo. En este caso, puede tocar para modificar la búsqueda. Mientras tanto, al tocar una imagen, se agregará al carrito de compras del sitio de comercio electrónico de terceros y podrá realizar el pago desde allí. Debo señalar que todos los resultados de la demostración se obtuvieron directamente de Amazon. Yue dice que el sistema atraerá unos 7.000 sitios minoristas en el momento del lanzamiento, y usted puede priorizar los resultados según aspectos como los minoristas y el tamaño de la empresa (si prefiere apoyar a las empresas más pequeñas).
Ir de compras es el primer ejemplo que me muestra Yue, y muchos de los fundamentos se aplican en todos los ámbitos. Ciertamente hay coherencia en el diseño de todas las funciones. Esto se debe en gran parte al hecho de que el dispositivo en realidad no tiene aplicaciones de terceros. Esto representa un cambio masivo con respecto al panorama actual de teléfonos inteligentes durante los últimos 15 años.
“Desde una perspectiva de privacidad y seguridad, queremos brindar un nuevo nivel de control que la gente no tiene en este momento”, Yue. “La comprensión que la computadora tiene de usted, ahora está agregada en diferentes aplicaciones. Estos modelos de IA son cajas negras: máquinas de recomendación que explotan nuestra atención. Creemos en la IA explicable. Le explicaremos, en cada paso del camino, por qué hacemos una recomendación. Hay más personas propietarias de la IA y no de las grandes cajas negras de tecnología”.
La adaptabilidad es otro gran punto de venta. El modelo mejora las recomendaciones y se vuelve más personalizado para el usuario a medida que se ejecutan y modifican más consultas. Por supuesto, los terceros fueron la razón principal por la que las tiendas de aplicaciones revolucionaron la industria. De repente, pasó de ser una sola empresa que creaba todas las experiencias de su teléfono a un sistema que aprovecha la inteligencia y la creatividad de innumerables desarrolladores. La experiencia de Brain será una combinación de lo que su equipo de 100 personas puede producir y lo que el modelo de IA puede imaginar. A medida que el modelo mejore, también lo hará su funcionalidad. Brain.ai confía en su propio modelo para la interfaz principal, pero recurrirá a terceros como OpenAI y Google cuando determine que están mejor equipados para responder una consulta específica.
Existen limitaciones en cuanto a lo que uno puede descubrir en una demostración como esta, por lo que, como ocurre con muchos otros elementos, tendré que esperar hasta tener un producto de envío en mis manos para evaluar realmente la experiencia. Estoy especialmente interesado en cómo maneja ciertas aplicaciones, como las imágenes. Vale la pena señalar que la línea REVVL no tiene excelentes cámaras, por lo que, a menos que haya una gran actualización, este no será el dispositivo para quienes priorizan las fotos y los videos.
La cámara también jugará un papel importante en la búsqueda. Un ejemplo que comentamos es el de tomar una fotografía de un menú en un país extranjero. No sólo traducirá (a lo Google Lens), también ofrecerá recomendaciones de comida basadas en tus gustos. Yue también demostró brevemente la generación de imágenes del sistema con una simple petición acorde con nuestro entorno: hacer zapatillas magenta. Lo hizo rápidamente, siendo el único obstáculo real la velocidad de conexión del centro de convenciones (irónico, dada la configuración).
La conectividad es de vital importancia aquí. El procesamiento de IA se realiza fuera del dispositivo. Hablé sobre la posibilidad de agregar algo de procesamiento en el dispositivo, pero Yue no pudo confirmar cómo se vería en el lanzamiento. Tampoco obtuve una respuesta del todo clara sobre la experiencia fuera de línea. Sospecho que una gran parte de la razón por la que Deutsch Telekom está tan interesada en el producto es que no podría existir de la misma manera sin 5G. Recuerda el desafortunado Firefox OS de Mozilla y los primeros días de Chrome OS, o cualquier otro número de ejemplos de un producto que pierde una funcionalidad significativa cuando está fuera de línea.
Yue fundó Brain en 2015 y siguió siendo su único empleado hasta que contrató a un CTO al año siguiente (Yue sigue siendo el único fundador). Nacido en China, se conectó por primera vez con la tecnología a través del amor por la robótica y la participación en el torneo de fútbol robótico RoboCup. A los 18 años fundó la aplicación social china Friendoc. Dos años más tarde, cofundó Benlai.com, que ahora es una de las aplicaciones de entrega de alimentos más grandes del país. Desde entonces, Yue regresó al Área de la Bahía para administrar Brain.ai a tiempo completo. Hasta la fecha, la empresa ha recaudado 80 millones de dólares.
Después de casi una década, la interfaz Brain está casi lista para su lanzamiento y llega en el momento perfecto. El espíritu de la época está muy centrado en la forma de IA generativa que impulsa la experiencia, desde dispositivos independientes como Rabbit y Humane Ai Pin hasta gigantes tecnológicos como Samsung que lanzan sus propios “teléfonos con IA”.