La plataforma de audio Pocket FM, respaldada por Lightspeed Ventures, anunció que se ha asociado con la empresa de clonación de voz ElevenLabs para convertir rápidamente contenido de texto, como guiones, en series de audio utilizando IA.
Pocket FM, que recaudó 103 millones de dólares en fondos de la Serie D en marzo, dijo a TechCrunch en ese momento que ya estaba experimentando con la capacidad de convertir contenido de texto en audio utilizando la tecnología de ElevenLabs. Ahora, la empresa con sede en India ha ampliado la asociación para que la herramienta de conversión esté disponible para todos los creadores durante las próximas semanas.
En la fase de prueba, Pocket FM ya produjo 30.000 horas de series de audio utilizando la tecnología de inteligencia artificial de ElevenLab. Con el nuevo lanzamiento, la startup espera triplicar su biblioteca de contenido de más de 100.000 horas de contenido de audio este año. Pocket FM también dijo que durante la fase experimental, las herramientas impulsadas por IA le ayudaron a reducir el costo de producción de audio en un 90%.
El cofundador y director de tecnología de Pocket FM, Prateek Dixit, le dijo a TechCrunch durante una llamada que con esta asociación, la compañía quiere facilitar a los escritores la conversión de sus escritos en series de audio.
“Tenemos más de 250.000 escritores (incluidos los de la plataforma de escritura Pocket Novel de la compañía) y esta asociación reduce el costo de configuración y grabación de audio para ellos”, dijo.
“Incluso con una buena configuración de herramientas y equipos de grabación, los escritores pueden producir aproximadamente 30 minutos de contenido de audio de alta calidad por día. Con las herramientas de IA, esta producción puede ser 10 veces mayor”, añadió.
Pocket FM ha creado una herramienta que integra la tecnología de ElevenLabs, a través de la cual ofrece 50 voces para escritores que quieran convertir su contenido. El cofundador de ElevenLabs, Mati Staniszewski, dijo que la herramienta de su empresa comprende el contexto de la escritura e infiere emociones a través de la voz de forma automática.
“Al trabajar con Pocket FM, estamos implementando nuestros modelos más nuevos que comprenden el género de escritura y son más emocionales”, dijo Staniszewski.
Dixit señaló que, basándose en los datos de la participación de los usuarios con este tipo de contenido, la plataforma también planea sugerir voces que funcionen bien para escritores de un género en particular.
Pocket FM no es la única plataforma de series de audio que experimenta con herramientas impulsadas por IA. Kuku FM, respaldada por Google, está utilizando GPT-4, Claude, BandLab e incluso ElevenLabs para ayudar a sus escritores en diferentes etapas de la creación, incluido refinar el guión, generar miniaturas, agregar efectos de sonido y convertir texto en audio.
Kuku FM le dijo a TechCrunch que también está experimentando con el uso de herramientas de generación visual como Midjourney y Runway para crear anuncios relacionados con el contenido.
Calidad del contenido e impacto en los artistas.
La promesa de las herramientas impulsadas por IA es generar más contenido más rápido, pero eso no significa que el contenido sea bueno. La respuesta de Pocket FM para ayudar al descubrimiento y mostrar contenido de calidad es hacer que su algoritmo de descubrimiento sea sofisticado y experimentar con la participación del usuario.
“Si un escritor publica una serie de audio, mostramos ese contenido a un número selecto de usuarios y observamos las métricas de participación. Si estas métricas son positivas, las propagaremos aún más”, dijo Dixit.
Kuku FM dijo que está trabajando con su equipo de control de calidad para garantizar que solo se promueva contenido de alta calidad en su aplicación, incluso si los creadores han utilizado IA en el proceso.
“Nos dimos cuenta de la importancia de tener un equipo humano de Control de Calidad en el centro de nuestra toma de decisiones cuando se trata de producción de contenido de audio. Hemos desarrollado un equipo central de productores de contenido que tienen un alto nivel de propiedad y autoridad sobre los estándares artísticos”, dijo el cofundador y director ejecutivo de la compañía, Lal Chand Bisu.
El uso de IA podría generar resultados más rápidos y una biblioteca de contenido más grande para estas plataformas, pero también reducirá las funciones de los locutores que trabajan con ellas. La Asociación de Artistas de Locución de la India (AVA) ha expresado su preocupación por la llegada de la IA.
“Si la IA toma el control, estamos acabados. Como locutores, necesitamos establecer alguna regulación para proteger nuestro sustento”, Amarinder Singh Sodhi, secretario general de la asociación, dijo a la publicación india Scroll.
Sodi también le contó a Scroll sobre incidentes en los que locutores fueron llamados al estudio para grabar muestras para entrenar IA sin obtener su consentimiento ni informarles.
“A nivel emocional me da miedo. Al utilizar la IA, esencialmente se está diluyendo la experiencia humana de contar historias. Se pierde una conexión emocional”, dijo a TechCrunch el locutor Aditya Mattoo, radicado en Delhi.
Añadió que dar acceso a voces premium a personas que no tienen el gusto y la habilidad para producir contenido de calidad provocará que el mercado se inunde de contenido deficiente.
Artistas de voz en otras partes de todo el mundo también han expresado su preocupación por el impacto de la IA en sus trabajos. Y a pesar de trabajar con algunas de las empresas de inteligencia artificial, se sienten incómodos con la alteración de sus voces.
Cuando preguntamos sobre el impacto de la generación de voz impulsada por IA en Pocket FM, la compañía no respondió directamente a la pregunta. Sin embargo, Dixit señaló que la interacción con el contenido generado por IA en sus experimentos es “tan buena como la producción de voz en off humana”. En particular, la empresa también está trabajando en tecnología para incorporar múltiples voces en una salida de audio.
Actualmente, tanto Pocket FM como Kuku FM no etiquetan su contenido para indicar si se ha utilizado IA en el proceso de creación.