La compañía anunció que las capacidades de Gemini Nano llegarán a la función de accesibilidad de la compañía. Replicar. Este es un gran ejemplo de una empresa que utiliza IA generativa para abrir su software a más usuarios.
Gemini Nano es la versión más pequeña de la plataforma LLM de Google, diseñada para ejecutarse completamente en el dispositivo. Eso significa que no requiere una conexión de red para funcionar. Aquí el programa se utilizará para crear descripciones auditivas de objetos para usuarios ciegos y con baja visión.
En la ventana emergente anterior, TalkBack se refiere a la prenda de vestir como “Un primer plano de un vestido de cuadros blanco y negro. El vestido es corto, con cuello y manga larga. Se ata a la cintura con un gran lazo”.
Según la empresa, los usuarios de TalkBack encuentran alrededor de 90 imágenes sin etiquetar al día. Al utilizar LLM, el sistema podrá ofrecer información sobre el contenido, eliminando potencialmente la necesidad de que alguien ingrese esa información manualmente.
“Esta actualización ayudará a completar la información que falta”, señaló el presidente del ecosistema Android, Sameer Samat, “ya sea más detalles sobre lo que hay en una foto que enviaron familiares o amigos o el estilo y corte de la ropa cuando se compra en línea”.
El dispositivo llegará a Android a finales de este año. Suponiendo que funcione tan bien como en la demostración, esto podría cambiar las reglas del juego para las personas ciegas y con baja visión.