Transformación de voz

Transformación de voz (también conocida como transformación de voz y conversión de voz) es la alteración generada por software de la voz natural de una persona. El propósito puede ser agregar efectos de audio a la voz, ocultar la identidad de la persona o hacerse pasar por otra persona.

El software de transformación de voz que altera una voz para que suene como un individuo objetivo es la tecnología más sofisticada y la más difícil de crear. El proyecto CUED de la Universidad de Cambridge explica: 

Básicamente, hay tres problemas interdependientes que deben resolverse antes de construir un sistema de transformación de voz. En primer lugar, es importante desarrollar un modelo matemático para representar la señal de voz de modo que la voz sintética pueda regenerarse y la prosodia pueda manipularse sin artefactos. En segundo lugar, se deben identificar y extraer las diversas señales acústicas que permiten a los humanos identificar a los hablantes. En tercer lugar, se debe decidir el tipo de función de conversión y el método de entrenamiento y aplicación de la función de conversión.

En el Laboratorio Nacional de Los Alamos en Nuevo México, los investigadores desarrollaron tecnología de transformación de voz que les permitió crear representaciones convincentes de las voces de varios generales de los Estados Unidos. En 1999, los investigadores de Los Alamos replicaron patrones de habla de una grabación de 10 minutos del general Carl W. Steiner y le transmitieron un mensaje al general: "¡Caballeros! Los hemos reunido para informarles que vamos a derrocar al gobierno de los Estados Unidos. " Otros clones de voz incluyeron a Colin Powell diciendo "Mis captores me tratan bien". 

Hay varias aplicaciones de transformación de voz para consumidores disponibles. Una aplicación para iPhone llamada Voice Morphing ofrece modos que incluyen helio, gángster, robot y alienígena. Los efectos de transformación de voz de Second Life incluyen techie, masculino, femenino, aterrador y diminuto.