Google Photos está recibiendo una infusión de IA con el lanzamiento de una función experimental, Ask Photos, impulsada por el modelo Gemini AI de Google. La nueva incorporación, que se lanzará a finales de este verano, permitirá a los usuarios buscar en su colección de Google Photos utilizando consultas en lenguaje natural que aprovechan la comprensión de la IA del contenido de sus fotografías y otros metadatos.
Si bien antes los usuarios podían buscar personas, lugares o cosas específicas en sus fotos, gracias al procesamiento del lenguaje natural, la actualización de la IA hará que encontrar el contenido correcto sea más intuitivo y menos un proceso de búsqueda manual, anunció Google el martes en su Google I anual. /O conferencia de desarrolladores 2024.
Por ejemplo, en lugar de buscar algo específico en tus fotos, como “Torre Eiffel”, ahora puedes pedirle a la IA que haga algo mucho más complejo, como encontrar la “mejor foto de cada uno de los parques nacionales que visité”. La IA utiliza una variedad de señales para determinar qué hace que la foto sea la “mejor” de un conjunto determinado, incluidos aspectos como la iluminación, la borrosidad, la falta de distorsión del fondo y más. Luego puede combinar eso con su comprensión de la geolocalización de un conjunto de fotografías o fechas para recuperar solo aquellas imágenes tomadas en parques nacionales de EE. UU.
Esta función se basa en el reciente lanzamiento de Photo Stacks en Google Photos, que agrupa fotos casi duplicadas y utiliza IA para resaltar las mejores fotos del grupo. Al igual que con Photo Stacks, el objetivo es ayudar a las personas a encontrar las fotografías que desean a medida que crecen sus colecciones digitales. Según Google, se cargan más de 6 mil millones de imágenes diariamente en Google Photos, para darle una idea de la escala.
Además, la función “Preguntar fotos” permitirá a los usuarios hacer preguntas para obtener otros tipos de respuestas útiles. Más allá de pedir las mejores fotos de unas vacaciones o de algún otro grupo, los usuarios pueden hacer preguntas que requieren una comprensión casi humana de lo que hay en sus fotos.
Por ejemplo, un padre podría preguntar a Google Photos qué temas habían usado para las últimas cuatro fiestas de cumpleaños de su hijo, y podría devolver una respuesta simple junto con fotos y videos sobre los temas de sirenas, princesas y unicornios que se usaron anteriormente y cuándo.
Este tipo de consulta es posible porque Google Photos no solo comprende las palabras clave que ingresaste, sino también los conceptos del lenguaje natural, como “fiesta de cumpleaños temática”. También puede aprovechar las capacidades multimodales de la IA para comprender si hay texto en una foto que pueda ser relevante para la consulta.
Otro ejemplo mostrado a la prensa por el CEO Sundar Pichai antes de la conferencia de desarrolladores Google I/O de hoy mostró a un usuario pidiendo a la IA que le mostrara el progreso de natación de su hijo. La IA reunió fotos y vídeos destacados del niño nadando a lo largo del tiempo.
Otra característica nueva aprovecha el uso de la búsqueda para encontrar respuestas a partir del texto de las fotos. De esa manera, podrías tomar una foto de algo que quisieras recordar más adelante (como tu matrícula o número de pasaporte) y luego pedirle a la IA que recupere esa información cuando la necesites.
Si la IA alguna vez se equivoca y usted lo corrige (tal vez marcando una foto que no es de una fiesta de cumpleaños o una que no destacaría de sus vacaciones), recordará esa respuesta para mejorar con el tiempo. Esto también significa que la IA se vuelve más personalizada para usted cuanto más interactúa con ella.
Cuando encuentre fotos que esté listo para compartir, la IA puede ayudar a redactar un título que resuma el contenido de las fotos. Por ahora, este es un resumen básico, aunque no ofrece la opción de elegir entre diferentes estilos. (Pero considerando que está usando Gemini bajo el capó, un mensaje escrito de manera inteligente podría funcionar para devolver un cierto estilo si lo intenta).
Google dice que implementará medidas de seguridad para no responder en ciertos casos (¿quizás no pedirle a la IA los “mejores desnudos”?). Tampoco incluyó contenido potencialmente ofensivo al entrenar al modelo. Pero la función se lanza como un experimento, por lo que es posible que sea necesario agregar controles adicionales con el tiempo a medida que Google responde a cómo la gente la utiliza.
La función Preguntar fotos inicialmente será compatible en los EE. UU. en inglés antes de implementarse en más mercados. Por ahora, también será solo una función basada en texto, similar a hacer preguntas a un chatbot de IA. Sin embargo, con el tiempo, podría integrarse más profundamente con Gemini ejecutándose en el dispositivo, como en Android.
La compañía dice que los datos personales de los usuarios en Google Photos no se utilizan para anuncios. Los humanos tampoco revisarán las conversaciones de IA ni los datos personales en Ask Photos, excepto “en casos excepcionales para abordar abusos o daños”, dice Google. Los datos personales de las personas en Google Photos tampoco se utilizan para entrenar ningún otro producto de IA generativa, como Gemini.