Los chatbots ocupan un espacio complicado para los usuarios: tienen que ser un motor de búsqueda, una herramienta de creación y un asistente al mismo tiempo. Esto es especialmente cierto para un chatbot proveniente de Google, que cuenta cada vez más con la inteligencia artificial para complementar su motor de búsqueda, su asistente de voz y casi todas las herramientas de productividad de su arsenal.
En este momento, la versión definitiva de la IA de Google es Gemini Advanced, que se lanzó la semana pasada para usuarios dispuestos a pagar 20 dólares al mes por el privilegio, el mismo precio que cobra OpenAI por su ChatGPT Plus actualizado. Así que gasté $20 y decidí ver cómo Gemini Advanced resistía al servicio rival.
El Géminis mayor ya era bastante bueno. Podría resumir a Shakespeare, dar recomendaciones de té y crear una receta de pastel de chocolate algo aceptable. Pero no podía brindarte una foto de un caballo majestuoso, al menos hasta hace poco, y puede tardar más en responder que ChatGPT.
Ahora, Gemini Advanced promete hacer más que simplemente responder preguntas o dar un resumen de libros de Cliffs Notes. Gemini Advanced se ejecuta en un modelo de IA más potente, Gemini Ultra, que se supone que le permite traducir texto, manejar múltiples instrucciones en una oración y generar imágenes a partir de indicaciones más complejas.
Al final, descubrí que Gemini Advanced funciona según lo prometido, pero algunas de esas cosas no son tan buenas. Su competidor, ChatGPT Plus, logra generar fotografías menos horripilantes gracias a su integración DALL-E 3. Pero Gemini Advanced, incluso más que Gemini, es mejor para informar a los usuarios sobre eventos actuales y, gracias a Google Maps, incluso brinda mejor información sobre las empresas que la gente busca. El Géminis pagado suele ser mejor para realizar este tipo de “tareas de Google” que las de IA generativa.
Todavía queda mucho trabajo por hacer para obtener resultados consistentes y precisos de estos chatbots, y las personas deben seguir usándolos para que los bots aprendan cómo responder mejor a las preguntas. Aquí hay algunas pruebas que realicé para ver cómo se comportaron.
ChatGPT Plus frente a Gemini Advanced
Hazme un dibujo de un garabato dorado blanco corriendo por un campo de margaritas con el sol brillando.
Curiosamente, tal vez debido a la especificidad del mensaje, ambos chatbots arrojaron imágenes generadas muy similares. La foto del perro de Gemini Ultra, sin embargo, suscitó lo que otros Borde Los miembros del personal lo describieron como “horror menor”. Su perro tiene dos lenguas y una extremidad extra. Enfatizó demasiado la textura del pelaje, por lo que simplemente se ve… mal. No sé si un perro así todavía estaría feliz retozando en un campo de margaritas. Mientras tanto, ChatGPT llama a DALL-E 3 para generar sus imágenes. Su perro no provoca horror corporal, pero aun así se ve que es una fotografía digital.
Traducir esto: Panatang makabayan, iniibig ko ang Pilipinas, tahanan ng aking lahi
Google dijo que Gemini Ultra fue creado para manejar “tareas altamente complejas”, así que le pregunté a Gemini Advanced cuáles eran estas tareas. El chatbot respondió: “Traducción”. Entonces le pedí a Gemini Advanced que tradujera las primeras líneas del Juramento Patriótico de Filipinas. Es un juramento bastante oscuro, especialmente porque la versión que conozco ha sido cambiada varias veces en los últimos 20 años.
Inmediatamente, Gemini Advanced respondió que si bien está “entrenado para responder en un subconjunto de idiomas”, no podía ayudarme con mi solicitud. Le pregunté qué idiomas admite, pero el chatbot se negó a responder y dijo que no puede darme una lista definitiva de los idiomas que puede entender. Luego le pregunté a Gemini Advanced si sabía filipino y respondió positivamente. Aunque oficialmenteGoogle no incluye el filipino en los 40 idiomas que Gemini admite actualmente.
Cambia el fondo de esta foto a un fondo rosa liso.
Atormentado por la imagen de perros mutados corriendo entre campos de flores, necesitaba limpiar mi paladar. Así que subí una foto del perro de mi amiga, Sundae, para que pareciera que estaba en una sesión de fotos. Les pedí a ambos chatbots que eliminaran el fondo existente y lo reemplazaran por uno rosa. Este fue uno que probé con ChatGPT Plus, ya que se supone que DALL-E 3 puede editar fotos simplemente. Es posible que sin darme cuenta haya roto ambos chatbots, ya que ninguno pudo darme lo que solicité. En cambio, Gemini rehizo la foto anterior de un garabato dorado con margaritas, pero esta vez con un fondo rosa. ChatGPT no pudo generar nada, indicando que analizar el mensaje tomó demasiado tiempo.
¿Cuál es un buen restaurante filipino en Nueva York? ¿Cuál es un buen restaurante etíope en Nueva York?
Gemini Advanced puede aprovechar otros productos de Google, lo que funcionó a su favor cuando recurrió a Google Maps para ambas preguntas. Devolvió un resumen de varios restaurantes filipinos y etíopes en la ciudad de Nueva York, adjuntando coordenadas de Google Maps para cada uno.
Hace unos días, le pedí recomendaciones de restaurantes a ChatGPT Plus (no para esta prueba, solo estaba buscando nuevos restaurantes) y los resultados fueron inexactos. Los nombres de los restaurantes eran correctos (eran establecimientos que existen), sin embargo, ninguna de las ubicaciones era correcta. Volví a solicitar ChatGPT Plus para esta prueba y obtuve ubicaciones mucho más precisas pero una lista más pequeña de restaurantes. Entonces, en este caso, Géminis claramente funcionó mejor para esta solicitud.
Resume estos párrafos y luego escribe un artículo de 150 palabras al respecto.
Una de las principales razones por las que alguien como yo usaría un chatbot es para resumir artículos complicados. Le di a Gemini Advanced dos párrafos de El artículo reciente de Apple sobre la edición de imágenes con IA. El artículo me dio dolor de cabeza la primera vez que lo leí, así que pensé que sería fácil para Géminis al menos darme la esencia. Para probar completamente sus nuevas capacidades, también quería ver cómo el chatbot encadena las dos instrucciones diferentes. Uno pedía resumir; la otra es hacer que genere texto.
El resumen fue… pasable. Realmente me dio un resumen de los conceptos discutidos en esos dos párrafos, pero no los “tradujo” a un lenguaje sencillo. Probablemente debería haberlo provocado. Luego, Géminis pasó a escribir el artículo que le pedí, ¿y sabes qué? Esas 150 palabras explicaban las cosas mucho mejor que el resumen que pedí.
Gemini Advanced es capaz. No se puede negar que funciona mucho mejor que el Gemini de nivel inferior. Definitivamente funciona mejor cuando se integra con otros productos de Google como Búsqueda y Maps. Pero para solicitudes multimodales más obviamente “creativas” (cosas que involucran imágenes, por ejemplo), Gemini tiene un largo camino por recorrer. El chatbot comprende cadenas de instrucciones más largas, pero una vez que agregas las fotos, probablemente sea mejor elegir un modelo de IA diseñado específicamente para tomar fotografías.