El modelo más nuevo de Stability AI para la generación de imágenes es Cascada estable promete ser más rápido y más poderoso que su predecesor líder en la industria, Stable Diffusion, que es la base de muchas otras herramientas de inteligencia artificial de generación de texto a imagen.
Stable Cascade puede generar fotografías y ofrecer variaciones de la imagen exacta que creó, o intentar aumentar la resolución de una imagen existente. Otras funciones de edición de texto a imagen incluyen pintura interna y externa, donde el modelo editará solo una parte específica de la imagen, así como Canny Edge, donde los usuarios pueden crear una nueva foto simplemente usando los bordes de una imagen existente.
El nuevo modelo está disponible. en GitHub para investigadores pero no para uso comercial, y ofrece más opciones incluso cuando empresas como Google e incluso Apple lanzan sus propios modelos de generación de imágenes.
A diferencia de los modelos emblemáticos de Difusión Estable de Stability, Stable Cascade no es un modelo de lenguaje grande: son tres modelos diferentes que se basan en el arquitectura würstchenLa primera etapa, la etapa C, comprime las indicaciones de texto en latentes (o fragmentos de código más pequeños) que luego se pasan a las etapas A y B para decodificar la solicitud.
Dividir las solicitudes en bits más pequeños comprime la solicitud para requerir menos memoria (y menos horas de entrenamiento en esas GPU difíciles de encontrar) y ejecutarse más rápido. al mismo tiempo que funciona mejor “tanto en pronta alineación como en calidad estética”. Se necesitaron unos 10 segundos para crear una imagen, en comparación con los 22 segundos del modelo SDXL que se utiliza actualmente.
Stability AI ayudó a popularizar el método de difusión estable y también ha sido objeto de varias demandas que alegan que Stable Diffusion se entrenó en datos protegidos por derechos de autor sin el permiso de los titulares de derechos; está previsto que una demanda de Getty Images en el Reino Unido contra Stability AI vaya a juicio en diciembre. Comenzó a ofrecer licencias comerciales a través de una suscripción en diciembre, que según la compañía era necesaria para ayudar a financiar su investigación.