En el vídeo, una multitud ruge en un abarrotado festival de música de verano. Cuando comienza a sonar un ritmo en los parlantes, el artista finalmente sube al escenario: es el Joker. Vestido con su traje rojo, cabello verde y pintura facial característica, el Joker levanta el puño y baila por el escenario, saltando por una pasarela para acercarse aún más a su mar de fanáticos. Cuando llega el momento de empezar a rapear, el Joker flexiona las rodillas y se impulsa del suelo, rebotando hacia arriba y hacia abajo antes de realizar un giro de 360 grados sobre un pie. Parece fácil y, sin embargo, si intentaras la maniobra, te caerías de bruces. El Joker nunca ha sido tan genial.
Luego hay otro vídeo, donde NBA All-Star Joel Embiid sale del backstage para saludar a la multitud antes de realizar esos mismos movimientos de baile. Entonces, es la estrella de “Curb Your Enthusiasm” Larry David. Pero en cada una de estas escenas, algo está un poco fuera de lugar: ya sea el Joker, Joel Embiid o Larry David, el cuerpo del actor tiembla, mientras que sus expresiones faciales nunca cambian.
Por supuesto, todo esto es generado por IA, gracias a una empresa llamada viggle.
El vídeo original muestra al rapero Lil Yachty subiendo al escenario del Summer Smash Festival de 2021; según el título de un vídeo de YouTube con más de 6,5 millones de visitas, esta entrada es “la salida MÁS DIFÍCIL NUNCA.“Esto se convirtió en un formato de meme de tendencia en abril, cuando la gente insertó a sus celebridades favoritas, o a sus favoritos. villanoscomo Sam Bankman-Fried, en el vídeo de Lil Yachty subiendo al escenario.
Las ofertas de inteligencia artificial de texto a video se están volviendo terriblemente buenas, pero no puedes escribir “sam bankman frito como lil Yachty en el éxito de verano de 2021” y esperar que Sora sepa exactamente a qué te refieres. Viggle funciona de manera diferente.
En el servidor Discord de Viggle, los usuarios suben un vídeo de alguien haciendo algún tipo de movimiento (a menudo un baile de TikTok) y una foto de una persona. Luego, Viggle crea un video de esa persona replicando los movimientos del video. Es obvio que estos videos no son reales, aunque no dejan de ser entretenidos. Pero después de que el meme de Lil Yachty se volvió viral, Viggle se puso caliente y el revuelo no ha disminuido.
“Nos estamos centrando en construir lo que llamamos el modelo de generación de vídeo controlable”, dijo a TechCrunch el fundador de Viggle, Hang Chu. “Cuando generamos contenido, queremos controlar con precisión cómo se mueve el personaje o cómo se ve la escena. Pero las herramientas actuales sólo se centran en la conversión de texto a vídeo, donde el texto en sí no es suficiente para especificar toda la sutileza visual”.
Según Chu, Viggle tiene dos tipos principales de usuarios: mientras algunas personas crean memes, otras utilizan el producto como herramienta en el proceso de producción para el diseño de juegos y VFX.
“Por ejemplo, un equipo de ingenieros de animación podría tomar algunos diseños conceptuales y convertirlos rápidamente en recursos de animación aproximados pero rápidos”, dijo Chu. “El objetivo es ver cómo se ven y se sienten en el boceto del plan final. Por lo general, esto les lleva días, o incluso semanas, configurarlo manualmente, pero con Viggle, esto básicamente se puede hacer de manera instantánea y automática. Esto ahorra toneladas de trabajo de modelado tedioso y repetitivo”.
En marzo, Discord de Viggle tenía unos miles de miembros. A mediados de mayo, había 1,8 millones de miembros y, a pocos días de junio, el servidor de Viggle ha aumentado a más de 3 millones de miembros. Eso lo hace más grande que los servidores de juegos como Valorant y Genshin Impact juntos.
El crecimiento de Viggle no muestra signos de desaceleración, excepto que la alta demanda de generación de video ha hecho que los tiempos de espera sean demasiado largos para los usuarios impacientes. Pero como Viggle está tan centrado en Discord, el equipo de desarrolladores de Discord ha trabajado directamente con Viggle para guiar a la startup de dos años a través de su rápido crecimiento.
Afortunadamente para Viggle, Discord ya ha pasado por esto antes. MidJourney, que también opera en Discord, tiene 20,3 millones de miembros en su servidor, lo que la convierte en la comunidad individual más grande de la plataforma. En general, Discord tiene alrededor de 200 millones de usuarios mensuales.
“Nadie está preparado para ese tipo de crecimiento, por lo que en esa etapa de viralidad, comenzamos a trabajar con ellos, porque no están preparados”, dijo a TechCrunch el vicepresidente de producto de Discord, Ben Shanken. “Tenemos que estar preparados, porque una gran parte de los mensajes que se envían en este momento son Viggle y MidJourney, y gran parte del consumo y uso en Discord es en realidad IA generativa”.
Para empresas emergentes como Viggle y MidJourney, crear sus aplicaciones en Discord significa que no tienen que crear una plataforma completa para sus usuarios; en cambio, están alojadas en una plataforma que ya tiene una audiencia conocedora de la tecnología, además de Herramientas de moderación de contenido integradas. Para Viggle, que sólo cuenta con quince empleados, el apoyo de Discord es crucial.
“Podemos centrarnos en construir el modelo como servicio backend, mientras que Discord puede utilizar su infraestructura en el front-end y, básicamente, podemos iterar más rápido”, dijo Chu.
Antes de Viggle, Chu fue investigador de inteligencia artificial en Autodesk, un gigante de las herramientas 3D. También realizó investigaciones para empresas como Facebook, Nvidia y Google.
Para Discord, actuar como una empresa SaaS accidental para nuevas empresas de IA podría tener un costo. Por un lado, estas aplicaciones atraen una nueva audiencia a Discord y probablemente sean buenas para las métricas de los usuarios. Pero alojar tanto vídeo puede ser difícil y costoso desde el punto de vista tecnológico, especialmente cuando otros usuarios de la plataforma transmiten videojuegos en vivo, realizan videochats y hacen llamadas de voz. Sin embargo, sin una plataforma como Discord, es posible que estas nuevas empresas no puedan crecer al mismo ritmo.
“No es fácil para ningún tipo de empresa escalar, pero Discord está diseñado para ese tipo de escala y podemos ayudarlos a absorberlo bastante bien”, dijo Shanken.
Si bien estas empresas pueden simplemente adoptar las propias pautas de contenido de Discord y usar sus aplicaciones de moderación de contenido, siempre será un desafío asegurarse de que 3 millones de personas se comporten bien. Incluso esos memes de salida de Lil Yachty violan técnicamente las reglas de Viggle, que alientan a los usuarios a evitar generar imágenes de personas reales, incluidas celebridades, sin su consentimiento.
Por ahora, la gracia salvadora de Viggle podría ser que su producción aún no es cien por ciento realista. La tecnología es realmente impresionante, pero sabemos que no es así. Esa loca animación del Joker definitivamente no es real, pero seguro que es divertida.