Hay mucho en juego en el discurso de apertura de la WWDC 2024 de la próxima semana. Lo que está en juego en la presentación es mucho mayor que los movimientos habituales del mercado posteriores al evento. La presión para que Tim Cook y su equipo entreguen los productos es, en un sentido muy real, incluso mayor que antes del anuncio de Vision Pro del año pasado.
El lunes, Apple presentará sus planes de inteligencia artificial. El tema ha sido un enorme signo de interrogación que se cierne sobre Cupertino durante los últimos años, a medida que competidores como Google y Microsoft han adoptado la IA generativa. Existe un amplio consenso en la industria de que los sistemas impulsados por grandes modelos de lenguaje como ChatGPT y Gemini afectarán profundamente la forma en que interactuamos con nuestros dispositivos.
Se espera que Apple anuncie una asociación con OpenAI que llevará la inteligencia de la empresa al iPhone y Mac. La estrategia a corto plazo de Apple es una integración profunda entre las propiedades existentes y la IA generativa, con Siri en el centro. Desde su debut en 2011, Apple ha presionado para que el asistente de voz sea una parte integral de todos sus sistemas operativos.
Sin embargo, en los 13 años transcurridos, Siri no ha logrado la revolución que Apple prometió. Hay muchas razones para esto, aunque la principal es la capacidad. El concepto de un asistente de voz artificial es anterior a Siri en décadas, pero nadie lo descifró por alguna razón. A medida que los fabricantes de teléfonos y los desarrolladores de aplicaciones han transformado los teléfonos inteligentes en dispositivos de todo, los trabajos de estos asistentes se han vuelto cada vez más complejos.
Tan impresionante como el Instituto de Investigación de Stanford Como estaba el trabajo, la tecnología necesaria para una experiencia sin fricciones simplemente no estaba lista. Norman Winarsky, cofundador de Siri se dirigió a la problema subyacente en 2018, señalando que el plan inicial de Apple era un asistente mucho más limitado que manejaba cosas como entretenimiento y viajes. “Estos son problemas difíciles, y cuando eres una empresa que trata con hasta mil millones de personas, los problemas se vuelven aún más difíciles”, señaló Winarsky en ese momento. “Probablemente estén buscando un nivel de perfección que no pueden alcanzar”.
La IA generativa tampoco está en ese nivel de perfección, al menos no todavía. Las alucinaciones siguen siendo un problema. Precisamente por eso, incluso después del revuelo masivo de los últimos años, todavía parece que estamos en la fase de pequeños pasos. En todo caso, diría que Google, por ejemplo, ha sido demasiado agresivo en algunos lugares. El mejor ejemplo de esto es la decisión de la compañía de mostrar los resultados de Gemini en la parte superior de las búsquedas.
Cuando algo tiene prioridad por encima de los recursos confiables en el motor de búsqueda dominante en el mundo, es necesario hacer las cosas bien tanto como sea humanamente posible, y no, ya sabes, decirle a la gente que comer pegamento. Google etiqueta los resultados de Gemini como un producto de sus “laboratorios de búsqueda”, pero seguramente la mayoría de los usuarios no entienden lo que eso significa en términos de madurez del producto, ni se molestan en hacer clic para obtener más información.
En los últimos años, he conocido a varios investigadores que han utilizado el término “magia” para describir los resultados de la “caja negra” que rodea a los grandes modelos de lenguaje. Esto no es un golpe a todo el increíble trabajo que se está realizando en el espacio, sino más bien una comprensión de que todavía hay mucho que no sabemos sobre la tecnología.
Arthur C. Clarke lo expresó mejor: “Cualquier tecnología suficientemente avanzada es indistinguible de la magia”.
Sin embargo, un lugar en el que Google ha sido más intencional es en la integración de Gemini en Android. En lugar de reemplazar completamente al Asistente, Google ha estado integrando su plataforma de inteligencia artificial generativa en diferentes aplicaciones. Los usuarios también pueden optar por hacer de Gemini su valor predeterminado asignándolo al botón Asistente en los dispositivos Pixel. Esta implementación requiere una acción deliberada por parte del usuario al menos hasta el momento.
Si bien Gemini aún no ha conquistado completamente Android, Google está señalando claramente que un día en un futuro no muy lejano reemplazará al Asistente por completo. Casi esperaba un anuncio similar en I/O el mes pasado, aunque me alegro de que finalmente haya optado por darle a Gemini más tiempo para hornear.
Que el nombre de Asistente se mantenga es, en última instancia, una decisión de marca. Por su parte, Apple está muy apegada al nombre Siri. Después de todo, ha pasado más de una década promocionando el producto a los consumidores. Sin embargo, más temprano que tarde, la IA generativa se comerá el espacio de los asistentes inteligentes.
Los asistentes de voz en general están pasando por un momento existencial. Los parlantes inteligentes tienen un referente más amplio para plataformas como Siri, Alexa y Google Assistant. Los envíos han disminuido, después del calentamiento durante la pandemia. Es injusto caracterizar la categoría como condenada al fracaso, pero lo estará a largo plazo, sin el impulso adecuado.
La IA generativa está preparada para ser el sucesor lógico, pero la primera ronda de dispositivos de hardware construidos alrededor de estos modelos, incluidos Humane Ai Pin y Rabbit R1, solo han sido testimonios de hasta dónde tiene que llegar la categoría antes de que pueda considerarse consistente. experiencia para los usuarios convencionales.
Apple finalmente mostrará su mano el lunes. Si bien los rumores apuntan a que la compañía hará la transición de varios empleados a operaciones de IA generativa luego de la implosión de su automóvil eléctrico, todas las señales apuntan a que Apple ha cedido una ventaja significativa a la competencia. Como tal, su jugada más lógica es una asociación con una potencia reinante como OpenAI.
Poco después de que se anunciara la adquisición de Siri, le preguntaron a Steve Jobs si la compañía estaba tratando de vencer a Google en su propio juego. “Es una empresa de inteligencia artificial”, señaló Jobs. “No vamos a entrar en el negocio de las búsquedas. No nos importa. Otras personas lo hacen bien”.
El enfoque de la empresa hacia la IA generativa se encuentra actualmente en el mismo lugar. En esta etapa, Apple no puede vencer a OpenAI en su propio juego, por lo que se está asociando. Pero incluso los mejores modelos actuales tienen un camino por recorrer antes de que estén listos para reemplazar completamente la generación actual de asistentes inteligentes.