La actualización de Google a Gemini 1.5 Pro le da oídos al modelo. El modelo ahora puede escuchar archivos de audio cargados y generar información de cosas como llamadas de ganancias o audio de videos sin la necesidad de consultar una transcripción escrita.
Durante su evento Google Next, Google también anunció que pondrá Gemini 1.5 Pro a disposición del público por primera vez a través de su plataforma para crear aplicaciones de inteligencia artificial, Vertex AI. Gemini 1.5 Pro se anunció por primera vez en febrero.
Esta nueva versión del Gemini Pro, que se supone que será el modelo de peso medio de la familia Gemini, ya supera en rendimiento al modelo más grande y potente, el Gemini Ultra. Gemini 1.5 Pro puede comprender instrucciones complicadas y elimina la necesidad de ajustar los modelos, afirma Google.
Gemini 1.5 Pro no está disponible para personas sin acceso a Vertex AI. En este momento, la mayoría de las personas encuentran modelos de lenguaje Gemini a través del chatbot Gemini. Gemini Ultra impulsa el chatbot Gemini Advanced y, si bien es potente y también capaz de comprender comandos largos, no es tan rápido como Gemini 1.5 Pro.
Gemini 1.5 Pro no es el único modelo grande de IA de Google que recibe una actualización. Imagen 2, el modelo de generación de texto a imagen que ayuda a potenciar las capacidades de generación de imágenes de Gemini, también agregará pintura interna y externa, lo que permitirá a los usuarios agregar o eliminar elementos de las imágenes. Google también puso a disposición su función de marca de agua digital SynthID en todas las imágenes creadas a través de los modelos Imagen. SynthID agrega una marca de agua invisible para el espectador en las imágenes que marca su procedencia cuando se ven a través de una herramienta de detección.
Google dice que también está probando públicamente una manera de conectar sus respuestas de IA con la Búsqueda de Google para que respondan con información actualizada. Esto no siempre es un hecho con las respuestas producidas por modelos de lenguaje grandes, a veces intencionalmente; Google ha impedido intencionalmente que Gemini responda preguntas relacionadas con las elecciones estadounidenses de 2024.