TELEVISIÓN

Jesse Shemen de Papercup: Las nuevas voces de IA tienen toda la calidez, entonación y expresividad de las reales

23 de mayo de 2023

Flor Antonia Singer

Jesse Shemen Papercut

Papercup combina el aprendizaje automático o machine learning de última generación con traductores profesionales para doblar. En opinión de su CEO, Jesse Shemen, “las nuevas voces de IA tienen toda la calidez, entonación y expresividad de las reales, lo que garantiza que los videos traducidos sean tan buenos como los originales”.

La empresa, basada en Londres, ha patentado su tecnología y utiliza datos generados por ellos mismos o encargados a terceros, para generar audio de alta calidad que no se puede distinguir del habla humana. Una prueba de la efectividad de la herramienta está en el doblaje que hicieron de 30 temporadas que suman 120 horas de contenido del programa Bob Ross: The Joy of Painting de Cinedigm. Les tomó solo 15 semanas completarlo.

“Un estudio de doblaje que use actores de doblaje doblaría una película en alrededor de 16 semanas. No es una comparación similar, pues una película tiene múltiples actores y requiere niveles más altos de expresividad, pero la velocidad con la que localizamos a Bob Ross permitió a Cinedigm lanzarlo en plataformas de transmisión en tiempo récord” comenta Shemen. “Fue un momento de orgullo para nosotros poder llevar una serie tan icónica a las audiencias de habla hispana por primera vez. También es testimonio de la calidad del doblaje que la versión en español del programa fue aceptada en dos de los servicios FAST más grandes del mundo: Roku y Tubi”.

Si bien el contenido factual, como noticias y documentales, sigue ocupando su mayor volumen de trabajo, Papercup está trabajando para implementar sus herramientas de IA en drama y entretenimiento. Parte de su cartera de clientes incluye además de Cinedigm, Bloomberg, Sky News, Insider, BBC y el chef británico Jamie Oliver.

EXPERTOS EN EL ESTUDIO
Papercup ha llamado su sistema de trabajo human-in-the-loop. “Esto significa que los traductores profesionales verifican la precisión de todas nuestras traducciones y luego usan nuestra plataforma de edición interna para modificar (alterar la pronunciación, el tono, etc.) las nuevas voces dobladas según sea necesario” explica Shemen.

La empresa ha sumado a su equipo a algunos de los expertos e investigadores más destacado en el mundo del machine learning como Simon King, profesor de procesamiento del habla y director del Centro de Investigación de Tecnología del Habla de Edimburgo, y Mark Gales, profesor de Ingeniería de la Información en el Laboratorio de Inteligencia de Máquinas de Cambridge.

VENTAJAS Y DESAFÍOS
El mayor beneficio de usar IA para la localización, dice Shemen, es que es una solución escalable gracias a los tiempos de respuesta, lo que permite a los dueños de contenido monetizar rápidamente sus productos y aumentar exponencialmente su alcance y sus ingresos.

Los costos del trabajo con IA abren el mercado a más contenido. El ejecutivo se apoya en dos datos para augurar larga vida a estas herramientas. El primero es que se espera que los ingresos generados por los mercados FAST globales crezcan 122% durante los próximos cuatro años, lo que llevará a las plataformas a competir para ofrecer las mejores ofertas posibles. El segundo es mucho más prometedor. “El 99% del contenido de video del mundo actualmente está atrapado en un solo idioma. Con herramientas de inteligencia artificial como Papercup, finalmente tenemos la oportunidad de reducir esa cifra a 0”.

El deepfake y la clonación de voces de actores y oradores reconocidos, con todas las implicaciones éticas que tiene, es uno de los principales desafíos al que enfrenta el uso expansivo de las herramientas de IA en el negocio de la localización.

“Debemos priorizar el abordaje de los desafíos en torno a la creación de voces con IA que suenen humanas a escala, especialmente aquellas que emulan la verdadera emoción. Para los propietarios de contenido, el mercado y los consumidores, el mejor enfoque es simplemente crear voces nuevas y de alta calidad”.