Semana 17: Compresión de Audio

Técnicas de Compresión y
Descompresión de Señales
Marcelo Fernando Valdiviezo C.
Carrera de Electrónica y Telecomunicaciones
Octubre - 2020

UNIDAD 3: COMPRESIÓN DE AUDIO
TEMA: EL SONIDO.

COMPRESIÓN DE AUDIO
• ALMACENAMIENTO EFICIENTE
• APLICACIONES DE STREAMING.
• APLICACIONES MULTIMEDIA INTERACTIVAS.
• REDUCCIÓN DEL ANCHO DE BANDA.
• LOGRAR QUE LAS SEÑALES DECODIFICADAS
SEAN SIMILARES A LA ORIGINAL.
• REDUCIR COMPLEJIDAD DE IMPLEMENTACIÓN.
ALGORITMOS

CLASES DE COMPRESIÓN
FLAC: Free Lossless Audio Codec.
APE: Monkey’s Audio
TTA: True Audio
No pierden calidad ni
claridad al comprimirse.
Mayor espacio de
almacenamiento
SIN PÉRDIDAS

TÉCNICAS DE COMPRESIÓN
Elimina los silencios,
basado en RLE
VOC FILE
COMPRESSIÓN
Se basa en una
comparación contra un
modelo analítico del tracto
vocal
LINEAR PREDICTIVE
CODING
Es una codificación
logarítmica (PCM, DPCM,
ADPCM)
COMPRESIÓN LEY u
y Ley A

MPEG
•Moving Picture Experts Group
•Parte de una norma múltiple para:
•Compresión de vídeo
•Compresión de audio
•Sincronización de audio, vídeo y datos
a una tasa de bits agregada de1,5
Mbit/seg.

MPEG Audio Compression
•Algoritmo de compresión con pérdidas
físicas
•Algoritmo transparente y sin pérdidas
perceptivas
•Aprovecha las propiedades perceptivas
del oído humano
•Modelado psicoacústico

MPEG Audio Compression
•El estándar de audio MPEG garantiza la
interoperabilidad, define la sintaxis del flujo de bits
codificado, define el proceso de decodificación y
garantiza la precisión del descodificador.

FUNCIONES DE AUDIO MPEG
• No hay suposiciones sobre la naturaleza de la fuente de
audio.
• Aprovechamiento de las limitaciones perceptivas del sistema
auditivo humano
• Eliminación de partes de la señal de audio irrelevantes desde
el punto de vista perceptivo
• Ofrece una frecuencia de muestreo de 32, 44.1 y 48 kHz.
• Ofrece la posibilidad de elegir entre tres capas
independientes

BANCO DE FILTROS POLIFÁSICOS
• Componente clave común a todas las capas
• Divide la señal de audio en 32 subbandas de frecuencia de
igual anchura
• Los filtros proporcionan una buena resolución temporal y de
frecuencia razonable
• Bandas críticas asociadas a los modelos psicoacústicos

PSICOACÚSTICA
• El objetivo es eliminar las partes irrelevantes de la señal de
audio
• El sistema auditivo humano es incapaz de oír el ruido de
cuantificación en condiciones de enmascaramiento auditivo
• El enmascaramiento se produce cuando una señal fuerte
hace imperceptible una zona de señales de audio más
débiles

UMBRAL DE ENMASCARAMIENTO DEL
RUIDO
• El poder de resolución del
oído humano depende de la
frecuencia
• El umbral de
enmascaramiento del ruido,
en cualquier frecuencia,
depende sólo de la energía
de la señal dentro de un
ancho de banda limitado de
esa frecuencia

EL MODELO PSICOACÚSTICO
• Analiza la señal de audio y calcula la cantidad de ruido de
enmascaramiento en función de la frecuencia
• El codificador decide la mejor manera de representar la
señal de entrada con un número mínimo de bits

PASOS BÁSICOS
• Alinear los datos de audio en el tiempo
• Convertir el audio en una representación en el dominio de
la frecuencia
• Procesar los valores espectrales en componentes tonales y
no tonales
• Aplicar una función de dispersión
• Establecer un límite inferior para los valores umbral
• Encuentre los valores de umbral para cada subbanda
• Calcular la relación señal-máscara

ESQUEMA DE CODIFICACIÓN PERCEPTUAL

MPEG Audio Layer I
•Codificación más sencilla
•Adecuado para tasas de bits superiores a 128
kbits/seg por canal
•Cada trama contiene una cabecera, una palabra
opcional de comprobación de errores CRC y
posiblemente datos auxiliares.
•Por ejemplo, la cinta compacta digital de Philips

MPEG Audio Layer II
•Complejidad intermedia
•Tasas de bits de unos 128 kbits/seg por canal
•Difusión de audio digital (DAB)
•Vídeo y audio sincronizados en CD-ROM
•Forma tramas de 1152 muestras por canal de
audio.

MPEG Audio Layer III
•Basado en bancos de filtros de capa I y II
•Codificación más compleja
•La mejor calidad de audio
•Tasas de bits de unos 64 kbits/seg por canal
•Adecuado para la transmisión de audio a través de la
RDSI (ISDN)
•Compensa las deficiencias de los filtros procesando
las salidas con dos bloques MDCT diferentes

CARACTERÍSTICAS POR NIVEL
PARA EL MPEG-1

AUDIO MLP
•Meridian Lossless Packing (MLP) es una técnica de
compresión sin pérdida utilizada para comprimir
audio de modulación de código de pulso (PCM).
•Es la tecnología principal utilizada en el contenido de
DVD-Audio, que a menudo se anuncia a través del
logotipo de "Resolución avanzada".
•Es un formato patentado desarrollado por Meridian
Audio, Ltd. para proporcionar una compresión de
1.5: 1 en la mayoría del material de audio.

COMPRESOR FLAC
•Free Lossless Audio CODEC (FLAC): es uno de los
CODECs de compresión de audio sin pérdida más
populares junto con el APE.
•Se trata de una de las ramas en desarrollo del
Ogg Project, encargado también del desarrollo,
del CODEC Ogg Vorbis mencionado
anteriormente.

Semana 17: Compresión de Audio

Semana 17: Compresión de Audio

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (19)

Similar a Semana 17: Compresión de Audio

Similar a Semana 17: Compresión de Audio (20)

Más de Marcelo Valdiviezo

Más de Marcelo Valdiviezo (20)

Último

Último (20)

Semana 17: Compresión de Audio