Pronto podrás probar tú mismo el dinámico generador de texto a video de OpenAI. En una entrevista con El periodico de Wall Streetla directora de tecnología de OpenAI, Mira Murati, dice que Sora estará disponible “este año” y que “podrían tardar unos meses”.
OpenAI mostró por primera vez a Sora, que es capaz de generar escenas hiperrealistas basadas en un mensaje de texto, en febrero. Para empezar, la compañía solo puso la herramienta a disposición de artistas visuales, diseñadores y cineastas, pero eso no impidió que algunos videos generados por Sora llegaran a plataformas como X.
Además de poner la herramienta a disposición del público, Murati dice que OpenAI tiene planes de incorporar “eventualmente” audio, lo que tiene el potencial de hacer que las escenas sean aún más realistas. La compañía también quiere permitir a los usuarios editar el contenido de los videos que produce Sora, ya que las herramientas de inteligencia artificial no siempre crean imágenes precisas. “Estamos tratando de descubrir cómo utilizar esta tecnología como una herramienta con la que la gente pueda editar y crear”, dice Murati al Diario.
Cuando se le preguntó qué datos utilizó OpenAI para entrenar a Sora, Murati no fue demasiado específico y pareció esquivar la pregunta. “No voy a entrar en detalles de los datos que se utilizaron, pero estaban disponibles públicamente o estaban autorizados”, dice. Murati también dice que no está segura de si utilizó videos de YouTube, Facebook e Instagram. Ella sólo confirmó a la Diario que Sora utiliza contenido de Shutterstock, con el que OpenAI tiene una asociación.
Murati también le dijo al Diario que a Sora le sale “mucho más caro” el poder. OpenAI está intentando que la herramienta esté “disponible a costos similares” a DALL-E, el modelo de IA de texto a imagen de la compañía, cuando se lance al público. Puedes ver aún más ejemplos de qué tipos de videos puede producir esta herramienta en el DiarioEl informe, que incluye un toro animado en una tienda de China y una sirena que critica un teléfono inteligente.
A medida que nos acercamos a las elecciones presidenciales de 2024, las preocupaciones sobre las herramientas de inteligencia artificial generativa y su potencial para crear información errónea no hacen más que aumentar. Cuando sea liberado, Murati dice que Sora probablemente no podrá producir imágenes de figuras públicas, similar a las políticas de DALL-E. Los vídeos también tendrán una marca de agua para distinguirlos de los reales, pero como señala mi colega Emilia David, las marcas de agua no son una solución perfecta.