Audiobox la IA de meta para clonar voces ¿Cómo funciona?

Audiobox la IA de meta para clonar voces ¿Cómo funciona?

Meta ha dado un paso más allá de la Inteligencia Artificial y ha sido capaz de crear un programa para clonar tu propia voz en cuestión de segundos. Audiobox es la herramienta que está creada por Meta para poder hacer algo tan increíble, ya que sus resultados son bastante realistas. Detallaremos algunos aspectos de Audiobox la IA de meta para clonar voces ¿Cómo funciona? analizaremos algunos detalles.

Según sus desarrolladores, este programa es el resultado de varios años de investigación y de muchas horas de trabajo. Ahora se puede utilizar en España, con algunas funcionalidades de generación de voz, edición, estilización y muestreo. Su forma puede dar un poco de miedo, ya que existen polémicas como la utilización de voces de actores de doblaje.

¿Cómo funciona Audiobox para clonar voces?

Su funcionamiento llega a resultar más sencillo de lo que parece. La propia Meta tiene listo dentro de su página web, una explicación o tutorial para explicarte todo lo necesario para comenzar a utilizar su herramienta.

Clonando la voz

Explica dentro de su tutorial cómo se pueden crear voces desde cero y para ello, lo puedes aplicar grabando tu propia voz, o la voz de otra persona mientras está leyendo un texto que aparece en la pantalla. También ofrece la posibilidad de utilizar otras voces que contiene el programa.

Aunque este programa parezca increíble, en realidad no es muy apto para utilizarse en doblajes, ya que los diálogos no se pueden sincronizar con los labios de los actores, aunque lo hable en otro idioma. Tampoco puede utilizar expresiones simpatizando con las emociones o entonaciones naturales.

También se ha ofrecido otro dato, ya que los resultados son asombrosos, aunque todavía se nota que las voces suelen denotar en un tono robótico. Su finalidad es impecable  y cada vez se acerca más a lo que queremos, pero no podemos poner la voz de alarma, ya que todavía no se puede suplantar la identidad de otra persona por la voz.

Algunas funciones que nos presta Audiobox

Entre las funciones que puede presentar Audiobox, podemos encontrar algunas funciones que nos pueden interesar:

  • Se pueden crear sonidos como el mar, el agua del río, pájaros cantando, una tormenta…bastará pedir a la Inteligencia Artificial estos parámetros para que los representen.
  • Mezclar audios específicos en otros medios o tonos. Por ejemplo, se puede pedir a la IA que represente una voz con eco.
  • Se puede ralentizar una voz, hacerla más deprisa o hacer que suene muy alta.

Programa para clonar voces

¿Cómo podemos utilizarlo?

Se puede acceder a una prueba gratuita de este programa. Podemos utilizar nuestra propia voz para generar una grabación, o podremos utilizar otra voz que nos interese. Después, solo queda utilizarlo, tan solo descargaremos la voz generada y la aplicaremos a dónde lo necesitemos.

  • Entre otras ideas que nos presta, es la generar una voz a partir de una pequeña muestra de audio.
  • Crear una voz con una entonación y estilo personalizado, aunque no lo hará muy de forma natural.
  • Podemos hacer mezclas de voces para rediseñar una sola.
  • Crear efectos de sonido, algunos específicos y muy representativos, como los descritos anteriormente.
  • Reemplazar partes de audios por nuevos sonidos.
  • Incluso, se puede borrar el ruido de una pista de audio.

Meta avisa del mal uso de su programa Audiobox

La compañía está ofreciendo programas para un uso comedido. Sim embargo, toda transparencia en su utilización se está creando con fines de investigación. En España se puede utilizar, pero muchas de las partes de su programa están escritas en inglés. En Estados Unidos, este programa no es apto por sus leyes, por lo que no se puede acceder. Pero, no va a ser un problema, ya que poco a poco se irá incorporando con un código abierto.

Audiobox la IA de meta para clonar voces ¿Cómo funciona?

En nuestro país, se puede utilizar, pero Audiobox advierte de que no se puede utilizar con fines nocivos. Todos los audios vienen con marcas de agua, para que puedan ser rastreados con dichos datos y conocer de dónde proceden. Para muchas personas, este distintivo o señal, es algo que es imperceptible para el oído humano, pero para sus desarrolladores es una forma fácil. Tienen las herramientas suficientes para encontrar estos segmentos de audios generados por Inteligencia Artificial.

La marca de agua que genera dicho programa no impide que se puedan hacer pódcast u otros servicios dónde se requiera el audio, ya que al oído es casi inexistente. Pero, es una medida de seguridad que se crea para que se pueda detectar rápidamente a algún culpable.

Por lo tanto, la marca de agua no supone un problema en el audio, para que así pueda emplearse en pódcast u otros servicios de escucha. No obstante, en caso de un ataque, se puede detectar rápidamente al culpable.

El fin de la creación de este programa, es hacerlo participativo para las personas que lo necesitan. Se intenta clonar la voz de forma sencilla y natural, pero no se intenta hacer que se cree en contra de la voluntad de la persona afectada. Como se puede observar, el mensaje cambia con subidas y bajadas de entonación, siendo a veces rápido e irregular para parecer natural, por lo que es complicado agregar la voz de otra persona con audio pregrabado.


Sé el primero en comentar

Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

*

  1. Responsable de los datos: Actualidad Blog
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.