1. Phase vocoder
Un vocoder (nombre derivado del inglés voice coder), o un codificador de voz, es
un analizador y sintetizador de voz, fue desarrollado en la década de 1930 como
un codificador de voz para las telecomunicaciones. Su primer uso fue la seguridad
en radiocomunicaciones, donde la voz tiene que ser digitalizada, cifrada y
transmitida por un canal de ancho de banda estrecho.
Es una herramienta utilizada para realizar time-stretching y pirch-shifting de
sonidos grabados. Utiliza un conjunto de filtros pasa bajos de banda en paralelo a
través de muchas bandas de frecuencia, para analizar con crudeza y reconstruir el
habla, a diferencia del codificador de voz clásico se baja en filtros de paso de
banda, el vocoder de fase se baja en una transformada de Fourier a corto plazo
STFT una transformada de Fourier a cabo de forma secuencial en segmentos
cortos de sonido más largo. El Phase vocoder fue considerador un tipo de
codificador de voz debido a que la transformada de Fourier devuelve un conjunto
de valores de ampliturd para un conjunto de bandas de frecuencia a distancias
iguales en el espectro del sonido de forma similar a la del codificador de voz
conjunto mayor de filtros de paso de banda. Por supuesto, el phase vocoder, como
su nombre sugiere, no solo tiene en cuenta la amplitud de estas bandas de
frecuencia, sino también la fase de cada banda.
Repasemos el diseño de phase vocoder STFT y básico. A corto plazo Fourier
transformada es una serie de transformaciones de Fourier, por lo general
uniformemente espaciadas en el tiempo:
2. Muchos vocoder usan un gran número de canales, cada uno en una frecuencia.
Los diversos valores de esos filtros no son almacenados como numero, que están
vasados en la frecuencia original, si no por una serie de modificaciones que el
fundamental necesita para ser modificado en la señal vista en el filtro, durante la
reproducción esos números son enviados de vuelta a los filtros y entonces
modifican con el conocimiento de que el habla varia típicamente entre esas
frecuencias. El resultado es habla inteligible, aunque algo mecánica, los vocoders
a menudo incluyen también un sistema para generar sonidos sordos, usando un
segundo sistema para generar sonidos sordos consistente en un generador de
ruido en lugar de una frecuencia fundamental.
El vocoder examina el habla encontrando su onda básica, que es la frecuencia
fundamental, y midiendo como cambian las características espectrales con el
tiempo grabando el habla. Esto da como resultado una serie de números
representando esas frecuencias modificadas en un tiempo particular a medida que
el usuario habla. Al hacer esto, el vocoder reduce en gran medida la cantidad de
información necesaria para almacenar el habla. Para recrear el habla, el vocoder
simplemente revierte el proceso, creando una frecuencia fundamental en un
oscilador electrónico y pasando su resultado por una serie de filtros basado en la
secuencia original de símbolos.
El vocoder está relacionado con el algoritmo Phase Vocoder, o vocoder de fase,
aunque esencialmente es diferente de este, una phase vocoder, es un tipo de
vocoder que permite escalar una señal de audio tanto en el dominio de la
frecuencia como en el dominio del tiempo usando información de fase. El
algoritmo permite la modificación del espectro de una señal de audio, mediante lo
cual es posible realizar efectos tales como compresión o expansión temporal y
desfase de alturas (pitch shifting).
El phase vocoder basa en la transformada de Fourier de tiempo corto, o STFT. La
STFT genera una representación combinada de tiempo y frecuencia de sonido, o
lo que se denomina un sonograma, a través de sucesivas FFT en intervalos de
tiempo relativamente cortos. En cada frame es posible modificar la información de
amplitud o fase de la FFT, para luego resintetizar el sonido, generando de manera
variaciones espectrales.
¿Qué es channel vocoder?
El channel vocoder funciona como un banco de filtros que rompe dos fuentes de
sonido entrantes (portador y modulador) en regiones de frecuencias compatibles,
la envolvente dentro de cada sub-banda del modulador impone en la sub-banda
3. apropiada de la portadora, y los sonidos resultantes se suman. Como se muestra
a continuación la no linealidad rectificación, seguido de un filtro de paso bajo se
aproxima a la envolvente del sonido dentro de la banda, el canal codificador de
voz se puede utilizar para generar una voz robotica-clasica, cuando modula el
habla y se ha encontrado un amplio uso como un efecto especial en Hollywood.
El codificador de voz puede ser interpretado como un banco de filtros que impone
la envolvente de un sonido (el modulador) en la forma de otro (el portador). La
operación de envoltura(representado aquí por la aplicación de rectificación de una
no linealidad G(x) seguido por un filtro pasa bajo) se aplica por separado dentro de
cada banda de frecuencia.
Las implementaciones modernas del channel vocoder normalmente sustituye a los
bancos de filtros de FFT. Esta es computacionalmente mas rápido cuando se
utilizan muchas bandas, y tanto el filtro pasa bajo de no linealidad y se puede
lograr usando la magnitud de la FFT.