Descubre Audibox, la IA de Meta para clonar voces de una forma impresionante. La verdad, en estos últimos meses hemos visto una gran cantidad de herramientas fascinantes basada en inteligencia artificial, lo que estoy seguro seguiremos viendo.
Meta, la casa matriz de Facebook, Instagram, WhatsApp, entre otras, se ha enfocado en desarrollar novedades. Inicialmente, su proyecto del metaverso, el cual no ha tenido el mejor de los éxitos, ahora se enfocan en inteligencia artificial. Esta es una sola de las funciones que se pueden lograr.
Si quieres conocer un poco más sobre Audiobox, la IA de Meta para clonar voces, entonces esta nota te encantara. Seguramente, esta herramienta seguirá desarrollándose a pasos agigantados, lo que posiblemente me haga actualizar esta nota muy pronto.
Qué es Audiobox
Se puede afirmar que el sonido es parte importante de la vida de las personas, lo que va mucho más allá de un simple sonido. Basado en esto, Meta se ha enfocado en desarrollar de forma completa el audio a gran escala, desglosando música, sonidos, voz y otros elementos que forman parte del espectro auditivo.
Audiobox, su herramienta digital en línea, busca emular, estudiar y procesar diversos niveles auditivos. Uno de sus aspectos más destacables es la imitación de voces, elemento trabajado digitalmente de gran forma. Actualmente, esta herramienta funciona como un demo, pero en donde puedes probarla.
Su funcionamiento, de una forma muy generalizada, se basa en el desarrollo de modelos, que van mucho más allá de simples voces, pues gestiona también el entorno en donde se genera. Estos modelos requieren de apoyo del usuario, dejando el trabajo pesado al motor de inteligencia artificial.
En cuanto a la generación de voces, se requiere de una transcripción de lo que se emitirá como audio. Adicionalmente, a esto, permitirá entrenar al procesador de inteligencia artificial a dar una mayor similitud.
De una forma muy abierta, esta herramienta permite emular diversas voces en distintos ambientes, todo mediante inteligencia artificial. La idea es permitir nuevas funciones auditivas en un futuro, aprovechando el trabajo profundo de la IA.
Si deseas conocer de primera mano de que se trata, puedes visitar su paper en el siguiente enlace. Lamentablemente, todo el contenido está en inglés, pero puedes leerlo con apoyo de un traductor web.
Cómo usar Audiobox para clonar tu voz
Antes de empezar, es importante entender de que se trata clonar la voz. La verdad es lo que te estás imaginando, el proceso de reproducir audios con tu voz, pero con palabras que no has pronunciado.
Esto se basa en obtener tu timbre de voz, acentuación de palabras y posteriormente, con ayuda de un generador de texto, introducir lo que quiere que se diga. Posiblemente, esto pueda ser un problema futuro con el tema de falsificaciones y estafas, pero ya Meta tiene en cuenta estos elementos.
Paso a paso para clonar voces con Audiobox
Este es solo una de las múltiples funciones que encontrarás, pero por algo hay que empezar. El proceso que debes seguir para clonar tu voz, es el siguiente:
- Ingresa al sitio web de Audiobox.
- En el cintillo superior de del sitio web, encontrarás diversas opciones, siendo de nuestro interés para esta ocasión, “Capabilities”. Pulsa sobre este.
- Acepta los términos de servicios.
- Elige la opción “Your Voice”, la cual viene regularmente predefinida.
- El primer paso es obtener una muestra de voz. Para ello, baja en la misma página hasta que aparezca la opción de grabar tu voz y luego el texto a clonar.
- Graba tu voz leyendo el párrafo que verás a continuación.
- Una vez hayas aceptado la grabación, escribe el texto a clonar.
- Pulsa el botón “Generate”.
- Después de esperar algunos segundos, la plataforma te presentará dos opciones de reproducción.
- Si estás de acuerdo con el resultado, puedes ayudar a la IA a aprender, dándole un pulgar arriba si te gustó o un pulgar bajo si no fue lo mejor.
- Descarga el resultado. Para ello, pulsa sobre el botón con una flecha hacia abajo. Lo encontrarás a la derecha del audio.
Ten en cuenta un elemento muy importante, al ser un demo, únicamente tiene un solo idioma de entrada y salida, como te imaginarás, es el inglés. Esperemos que, próximamente, tengamos una versión internacional que contenga el español.
Otra herramienta interesante de Audiobox
Además de clonar voces, Audiobox, cuenta con otras herramientas interesantes, logrando resultados realmente llamativos. Un ejemplo claro de lo que se puede hacer, lo encontrarás en la opción “Audiobox Maker”.
Existen varios ejemplos en los cuales se cuentan historias cortas, las cuales poseen efectos de sonidos. Lo interesante es que tanto la generación de audios, efectos de sonido o incluso la mezcla, se realizan desde el portal.
Entre las opciones de Capabilities, puedes ver las siguientes opciones para crear audio:
- Your Voice: traducido como tu voz, sirve para clonar tu voz y generar audios a partir de contenido escrito. Este fue el módulo que usamos anteriormente.
- Described Voice: permite generar un audio novela, ingresando el contenido y como deseamos que sea la voz de quien habla. Es una excelente opción para narrar en redes sociales.
- Restyled Voices: permite generar contenido con base en voces grabadas, dándole un nuevo estilo auditivo, cambiando entonación, énfasis o incluso pausas.
- Sound Effects: permite generar efectos de sonido, fundamentados en descripciones escritas u órdenes. Es el complemento perfecto para las audionovelas.
Existen otras opciones interesantes de edición de audios ya grabados anteriormente, las cuales te muestro a continuación:
- Magic Eraser: permite eliminar ruidos en la grabación. Ideal para quienes desean enviar audios limpios y nítidos.
- Sound Infilling: permite quitar e introducir porciones de sonido dentro de un audio.
Como puedes ver, Audiobox es mucho más que una herramienta para clonar voces. Puedo afirmar que estamos ante una plataforma de inteligencia artificial dedicada 100% a audio, edición y creación.
De momento, estamos únicamente ante un demo, esperemos que el grupo Meta siga desarrollándola y creando una pieza única. De momento, estamos a la expectativa de una versión en español.
Recuerda, que, si tienes alguna duda, puedes dejarla en los comentarios. Aún hay mucho que desarrollar. Nos leeremos en una próxima oportunidad.