Formatos de audio
Enrique Alexandre (@e_alexandre)
¿Con o sin pérdidas?
• Codificadores con pérdidas (mp3, aac, wma, etc.):
• Utilizan modelos perceptuales para eliminar la información irrelevante.
• Es imposible reconstruir exactamente la señal original a partir de la
codificada.
• Codificadores sin pérdidas (.flac, .alac, .ape, etc.):
• Se limitan a eliminar la información redundante.
• Se puede reconstruir de forma exacta la señal original a partir de la
codificada.
ATC

ATC-ABS

ATAC

1977

OCF

MUSICAM

PXFM

ASPEC

1992
Layer I, Layer II

Layer III

1994

ATRAC

PASC

AC-3

PAC

TWIN-VQ

ASC

1995

MPEG-2 AAC

1997

MPEG-4 AUDIO

1999
Análisis tiempo/
frecuencia

Cuantificación y
codificación

Codificación
entrópica

Análisis
psicoacústico

Asignación de bits

Estructura genérica de
un codificador de audio

MUX
La familia MPEG
MPEG-1
MPEG-2 BC
MPEG-2 NBC (AAC)
MPEG-4
ISO/IEC MPEG-1
• Estándar “semi-abierto”:
• Partes normativas e informativas.
• Uno o dos canales:
• Un solo canal monofónico
• Dos canales monofónicos independientes
• Dos canales stereo
• Joint-stereo
• Frecuencias de muestreo: 32 kHz (broadcast), 44.1 kHz (consumer) y 48 kHz
(professional).
• Bitrates: 32-192 kbps (mono) y 64-384 kbps (stereo).
ISO/IEC MPEG-1
• Tres capas independientes con distintas complejidades:
• Capa I:
• Proporciona transparencia a 384 kbps.
• Complejidad media-baja. 	
• Aplicaciones: Philips Digital Compact Cassette (DCC).
• Capa II:
• Proporciona transparencia a 256 kbps.
• Complejidad media.
• Aplicaciones: DAB, DVB, radiodifusión
ISO/IEC MPEG-1
• Capa III (mp3)
• Proporciona transparencia a 192 kbps.
• Complejidad alta.
• Aplicaciones: ISDN (RDSI), Internet.
Nuevas variantes
• mp3PRO
• Proporciona el doble de rendimiento que el mp3
• Compatible hacia atrás con mp3
• mp3HD
• Codificador sin pérdidas compatible hacia atrás con mp3
mp3: Licencias
Codificación estéreo
• Objetivo: aprovechar las posibles redundancias (parecido) entre los dos
canales de audio.
• Herramientas disponibles en el modo Joint Stereo:
• Mid/Side Stereo (M/S): Se transmite suma y diferencia en lugar de los
canales originales.
• Intensity Stereo: Se transmite la energía y la panorámica. Funciona a altas
frecuencias (>3kHz).
ISO/IEC MPEG-2 BC
• Ampliación compatible hacia atrás con MPEG-1.
• Características añadidas:
• Frecuencias de muestreo mitad (24, 22.05 y 16 kHz) para aplicaciones con
menor ancho de banda.
• Codificación multicanal (5.1).
• Existe un MPEG-2.5, formato propietario del Fraunhofer, que permite
frecuencias de muestreo inferiores (8, 11.025 y 12 kHz).
ISO/IEC MPEG-2 NBC / AAC
• Nuevo esquema, no compatible con los anteriores, que proporciona mejor
rendimiento de codificación.
• Tres modos de operación:
• LC (Low Complexity)
• Main Profile
• SSR (Scalable Sampling Rate)
• Proporciona transparencia a 128 kbps (stereo) y 320 kbps (5.1)
• Aplicaciones comerciales:
• Apple iTunes, Sony PSP, Operadoras móviles (Movistar, Orange, etc,), DRM
(Digital Radio Mondiale), DVB, etc.
Variante: HE-AAC ó aacPlus
• La misma idea que el mp3PRO
• Buena calidad de sonido estéreo a 48 kbps
ISO/IEC MPEG-4
• No es un nuevo esquema de codificación en sí, sino un conjunto de
codificadores ya existentes unificados bajo un mismo estándar.
• Un fichero MPEG-4 puede contener audio, video, audio sintético, etc.
• Extensiones .mp4, .m4a y .3gp
Otros codificadores
Ogg Vorbis
Musepack
Otros
Ogg Vorbis
• Codificador de audio libre
• Proporciona una calidad muy parecida a un MPEG-2 AAC
• Soporta frecuencias de muestreo desde 8kHz hasta 192 kHz
• Soporta desde 1 canal hasta 255
Musepack
• Codec basado en MPEG-1 Capa II
• Pensado para proporcionar muy alta calidad de audio a tasas binarias
elevadas
• Extensión: .mpc
Otros codecs propietarios
• Windows Media Audio (WMA)
• Free Lossless Audio Codec (FLAC)
• RealAudio
Resumen: codificadores con pérdidas

Formato

Año

Gratis

Bitrate

Canales

Latencia

mp3

1993

No

8-320 kbps

2

> 100ms

AAC

1997

No

8-529 kbps

48

20-405ms

AC-3

1992

No

32-640kbps

6

40.6 ms

Musepack

1997

Si

3-1300 kbps

8

?

Vorbis

2000

Si

Variable

255

> 100ms

WMA

1999

Si (Windows)

8-768 kbps

2

> 100ms
Resumen: codificadores sin pérdidas

Formato

Velocidad

Compresión

Híbrido (c/
pérdidas)

Código
abierto

Multicanal

Wavpack

Muy rápido

58%

Si

Sí

Sí

ALAC

Rápido

58.5%

No

Sí (decod)

Sí

FLAC

Muy rápido

58.7%

No

Sí

Sí

Monkey’s

Rápido

55.5%

No

Sí

Sí
Diccionario de extensiones
• Formatos estándar
• .aif: AIFF, Audio Interchange File Format
• .wav: Waveform Audio
• . bwf: Broadcast wave (extensión al .wav)
• .raw: Raw audio file (Como un .wav pero sin cabecera)
Diccionario de extensiones
• Codificadores con pérdidas:
• .mp3: MPEG-1 Capa III
• .mp4: MPEG-4 (audio y/o video)
• .m4a: MPEG-4 audio
• .m4p: Ficheros del iTunes con DRM
• .m4v, .mp4v, .cmp, .divx, .xvid: MPEG-4 Video
• .3gp, .3g2: MPEG-4 en móviles
• .wma: Windows Media Audio
• .ogg: Ogg Vorbis
Diccionario de extensiones
• Codificadores sin pérdidas
• .flac: FLAC, Free Lossless Audio Coder
• .m4a: Apple Lossless audio coder
Sonido surround
• Un poco de historia:
• El sonido surround lleva utilizándose desde los años 30 (3 canales frontales
para el cine, desarrollados por Bell Labs)
• En 1941 se añadieron los canales traseros, para la película Fantasía de Walt
Disney. Era el sistema de sonido Fantasound, también utilizado para el
Cinemascope de la Fox.
• En los 60 el sistema Dolby Surround se convirtió en el estándar de facto,
con 4 canales.
• En los 70 se creo el sistema Quad, para música, que acabó desapareciendo
por falta de compatibilidad.
Ventajas del surround
• El sonido es más claro
• No hay un sweet spot
• La posición de los altavoces no es tan crítica
• Más posibilidades para la mezcla
Dolby AC-3
• Creado en 1991 para la película “Batman returns”.
• Es un codificador pensado desde el principio para la industria del cine (audio
multicanal), que acabó adaptándose para aplicaciones domésticas (home
theater)
• Es el estándar para la televisión de alta definición en EEUU y DVD-Video
• Velocidades binarias soportadas: desde 32 hasta 640kbps
• Frecuencias de muestreo: 32, 44.1 y 28 kHz
Dolby AC-3
• Principales características
• Protección de copyright
• Marcas de tiempo
• Down-mixing
• Identificadores de los idiomas
• Múltiples tramas auxiliares
• Control del margen dinámico
Tecnologías Dolby (consumo)
Codificación sin pérdidas, hasta 8 canales 24bits/96kHz
Codificación con pérdidas, hasta 7.1 canales a 6 Mbps
Codificación con pérdidas, hasta 6.1 canales
Codificación con pérdidas, hasta 5.1 canales
Tecnologías Dolby (consumo)
Versión para consumo del Dolby analógico

Codificador MPEG-2/4 AAC
Codificador sin pérdidas para el DVD-Audio
Sistema analógico matricial para 5.1
Igual que el pro logic II pero hasta 7.1
Añade canales frontales en altura
Tecnologías Dolby
Blu-ray

Codec

DVD

Canales

Bitrate

Canales

Bitrate

5.1

640 kbps

5.1

448 kbps

7.1

1.7 Mbps

8

18 Mbps
Tecnologías Dolby (cine)
Audio analógico para cines
Codificación con pérdidas. Igual que el de consumo.
Extensión a 7.1
Sistema de imagen 3D
Añade un canal trasero central al 5.1

Un canal por altavoz en el cine
Tecnologías DTS (consumo)
Codificación sin pérdidas, hasta 7.1 canales

Codificación con pérdidas, hasta 5.1 canales

Equivalente al Prologic II de Dolby

Extensión del Neural Surround hasta 11.1
SDDS
• Es una tecnología exclusiva para salas de cine
• Ofrece hasta 8 canales de sonido
• La información se graba en los bordes externos de la película
Dolby AC-3
Dolby AC-3
Dolby AC-3
Dolby AC-3, DTS y SDDS
Ventajas e inconvenientes de DTS
• Pueden existir fallos de sincronismo
• El ratio de compresión es menor que en AC-3
• Se suele coincidir en que es el formato más fiel al sonido del master
• La instalación es más barata
Ventajas e inconvenientes de Dolby AC-3
• Usa un ratio de codificación elevado
• Puede haber problemas con los cambios de rollo, aunque se puede evitar
• Es el formato más extendido
• El audio va sobre la película para evitar problemas de sincronismo
Ventajas e inconvenientes de SDDS
• Tiene el ratio de codificación más bajo de todos (creo)
• Proporciona 8 canales de sonido, aunque no hay demasiados cines que
soporten esto
• Está muy ligado a Sony y sus estudios (Columbia, Tristar, etc.)
• Es el sistema más caro de instalar
THX
• Es un sistema de certificación de la calidad creado en 1983 para asegurar que
la película “El retorno del Jedi” se escuchase igual en los mejores cines.
• THX viene de Tomlinson Holman’s eXperiment.
• THX impone unos requisitos muy estrictos para los cines:
• Suelo flotante
• Paredes tratadas acústicamente
• Pantalla perforada
• Ruido de fondo NC-30
• Ángulo de visión
• Calidad de la imagen
Altavoces frontales
empotrados
Aislamiento entre salas
Control de la
reverberación
Posición de la pantalla
Proyección de la película
THX
• Criterios de certificación para cines:
• Ruido de fondo (NC-30)
• Aislamiento acústico
• Reverberación
• Ángulo de visión
• Calidad de la imagen
• Equipamiento
• Instalación de los equipos
¿Cómo coloco los
altavoces en casa?

Estéreo
¿Cómo coloco los
altavoces en casa?

Estéreo
5.1

Colocación de los altavoces

7.1
Dolby True HD

Colocación de los altavoces

Ordenador

Formatos de Audio

  • 1.
    Formatos de audio EnriqueAlexandre (@e_alexandre)
  • 2.
    ¿Con o sinpérdidas? • Codificadores con pérdidas (mp3, aac, wma, etc.): • Utilizan modelos perceptuales para eliminar la información irrelevante. • Es imposible reconstruir exactamente la señal original a partir de la codificada. • Codificadores sin pérdidas (.flac, .alac, .ape, etc.): • Se limitan a eliminar la información redundante. • Se puede reconstruir de forma exacta la señal original a partir de la codificada.
  • 3.
    ATC ATC-ABS ATAC 1977 OCF MUSICAM PXFM ASPEC 1992 Layer I, LayerII Layer III 1994 ATRAC PASC AC-3 PAC TWIN-VQ ASC 1995 MPEG-2 AAC 1997 MPEG-4 AUDIO 1999
  • 4.
  • 5.
    La familia MPEG MPEG-1 MPEG-2BC MPEG-2 NBC (AAC) MPEG-4
  • 6.
    ISO/IEC MPEG-1 • Estándar“semi-abierto”: • Partes normativas e informativas. • Uno o dos canales: • Un solo canal monofónico • Dos canales monofónicos independientes • Dos canales stereo • Joint-stereo • Frecuencias de muestreo: 32 kHz (broadcast), 44.1 kHz (consumer) y 48 kHz (professional). • Bitrates: 32-192 kbps (mono) y 64-384 kbps (stereo).
  • 7.
    ISO/IEC MPEG-1 • Trescapas independientes con distintas complejidades: • Capa I: • Proporciona transparencia a 384 kbps. • Complejidad media-baja. • Aplicaciones: Philips Digital Compact Cassette (DCC). • Capa II: • Proporciona transparencia a 256 kbps. • Complejidad media. • Aplicaciones: DAB, DVB, radiodifusión
  • 8.
    ISO/IEC MPEG-1 • CapaIII (mp3) • Proporciona transparencia a 192 kbps. • Complejidad alta. • Aplicaciones: ISDN (RDSI), Internet.
  • 9.
    Nuevas variantes • mp3PRO •Proporciona el doble de rendimiento que el mp3 • Compatible hacia atrás con mp3 • mp3HD • Codificador sin pérdidas compatible hacia atrás con mp3
  • 10.
  • 11.
    Codificación estéreo • Objetivo:aprovechar las posibles redundancias (parecido) entre los dos canales de audio. • Herramientas disponibles en el modo Joint Stereo: • Mid/Side Stereo (M/S): Se transmite suma y diferencia en lugar de los canales originales. • Intensity Stereo: Se transmite la energía y la panorámica. Funciona a altas frecuencias (>3kHz).
  • 12.
    ISO/IEC MPEG-2 BC •Ampliación compatible hacia atrás con MPEG-1. • Características añadidas: • Frecuencias de muestreo mitad (24, 22.05 y 16 kHz) para aplicaciones con menor ancho de banda. • Codificación multicanal (5.1). • Existe un MPEG-2.5, formato propietario del Fraunhofer, que permite frecuencias de muestreo inferiores (8, 11.025 y 12 kHz).
  • 13.
    ISO/IEC MPEG-2 NBC/ AAC • Nuevo esquema, no compatible con los anteriores, que proporciona mejor rendimiento de codificación. • Tres modos de operación: • LC (Low Complexity) • Main Profile • SSR (Scalable Sampling Rate) • Proporciona transparencia a 128 kbps (stereo) y 320 kbps (5.1) • Aplicaciones comerciales: • Apple iTunes, Sony PSP, Operadoras móviles (Movistar, Orange, etc,), DRM (Digital Radio Mondiale), DVB, etc.
  • 14.
    Variante: HE-AAC óaacPlus • La misma idea que el mp3PRO • Buena calidad de sonido estéreo a 48 kbps
  • 15.
    ISO/IEC MPEG-4 • Noes un nuevo esquema de codificación en sí, sino un conjunto de codificadores ya existentes unificados bajo un mismo estándar. • Un fichero MPEG-4 puede contener audio, video, audio sintético, etc. • Extensiones .mp4, .m4a y .3gp
  • 16.
  • 17.
    Ogg Vorbis • Codificadorde audio libre • Proporciona una calidad muy parecida a un MPEG-2 AAC • Soporta frecuencias de muestreo desde 8kHz hasta 192 kHz • Soporta desde 1 canal hasta 255
  • 18.
    Musepack • Codec basadoen MPEG-1 Capa II • Pensado para proporcionar muy alta calidad de audio a tasas binarias elevadas • Extensión: .mpc
  • 19.
    Otros codecs propietarios •Windows Media Audio (WMA) • Free Lossless Audio Codec (FLAC) • RealAudio
  • 20.
    Resumen: codificadores conpérdidas Formato Año Gratis Bitrate Canales Latencia mp3 1993 No 8-320 kbps 2 > 100ms AAC 1997 No 8-529 kbps 48 20-405ms AC-3 1992 No 32-640kbps 6 40.6 ms Musepack 1997 Si 3-1300 kbps 8 ? Vorbis 2000 Si Variable 255 > 100ms WMA 1999 Si (Windows) 8-768 kbps 2 > 100ms
  • 21.
    Resumen: codificadores sinpérdidas Formato Velocidad Compresión Híbrido (c/ pérdidas) Código abierto Multicanal Wavpack Muy rápido 58% Si Sí Sí ALAC Rápido 58.5% No Sí (decod) Sí FLAC Muy rápido 58.7% No Sí Sí Monkey’s Rápido 55.5% No Sí Sí
  • 22.
    Diccionario de extensiones •Formatos estándar • .aif: AIFF, Audio Interchange File Format • .wav: Waveform Audio • . bwf: Broadcast wave (extensión al .wav) • .raw: Raw audio file (Como un .wav pero sin cabecera)
  • 23.
    Diccionario de extensiones •Codificadores con pérdidas: • .mp3: MPEG-1 Capa III • .mp4: MPEG-4 (audio y/o video) • .m4a: MPEG-4 audio • .m4p: Ficheros del iTunes con DRM • .m4v, .mp4v, .cmp, .divx, .xvid: MPEG-4 Video • .3gp, .3g2: MPEG-4 en móviles • .wma: Windows Media Audio • .ogg: Ogg Vorbis
  • 24.
    Diccionario de extensiones •Codificadores sin pérdidas • .flac: FLAC, Free Lossless Audio Coder • .m4a: Apple Lossless audio coder
  • 25.
    Sonido surround • Unpoco de historia: • El sonido surround lleva utilizándose desde los años 30 (3 canales frontales para el cine, desarrollados por Bell Labs) • En 1941 se añadieron los canales traseros, para la película Fantasía de Walt Disney. Era el sistema de sonido Fantasound, también utilizado para el Cinemascope de la Fox. • En los 60 el sistema Dolby Surround se convirtió en el estándar de facto, con 4 canales. • En los 70 se creo el sistema Quad, para música, que acabó desapareciendo por falta de compatibilidad.
  • 26.
    Ventajas del surround •El sonido es más claro • No hay un sweet spot • La posición de los altavoces no es tan crítica • Más posibilidades para la mezcla
  • 27.
    Dolby AC-3 • Creadoen 1991 para la película “Batman returns”. • Es un codificador pensado desde el principio para la industria del cine (audio multicanal), que acabó adaptándose para aplicaciones domésticas (home theater) • Es el estándar para la televisión de alta definición en EEUU y DVD-Video • Velocidades binarias soportadas: desde 32 hasta 640kbps • Frecuencias de muestreo: 32, 44.1 y 28 kHz
  • 28.
    Dolby AC-3 • Principalescaracterísticas • Protección de copyright • Marcas de tiempo • Down-mixing • Identificadores de los idiomas • Múltiples tramas auxiliares • Control del margen dinámico
  • 29.
    Tecnologías Dolby (consumo) Codificaciónsin pérdidas, hasta 8 canales 24bits/96kHz Codificación con pérdidas, hasta 7.1 canales a 6 Mbps Codificación con pérdidas, hasta 6.1 canales Codificación con pérdidas, hasta 5.1 canales
  • 30.
    Tecnologías Dolby (consumo) Versiónpara consumo del Dolby analógico Codificador MPEG-2/4 AAC Codificador sin pérdidas para el DVD-Audio Sistema analógico matricial para 5.1 Igual que el pro logic II pero hasta 7.1 Añade canales frontales en altura
  • 31.
  • 32.
    Tecnologías Dolby (cine) Audioanalógico para cines Codificación con pérdidas. Igual que el de consumo. Extensión a 7.1 Sistema de imagen 3D Añade un canal trasero central al 5.1 Un canal por altavoz en el cine
  • 33.
    Tecnologías DTS (consumo) Codificaciónsin pérdidas, hasta 7.1 canales Codificación con pérdidas, hasta 5.1 canales Equivalente al Prologic II de Dolby Extensión del Neural Surround hasta 11.1
  • 34.
    SDDS • Es unatecnología exclusiva para salas de cine • Ofrece hasta 8 canales de sonido • La información se graba en los bordes externos de la película
  • 35.
  • 36.
  • 37.
  • 38.
  • 39.
    Ventajas e inconvenientesde DTS • Pueden existir fallos de sincronismo • El ratio de compresión es menor que en AC-3 • Se suele coincidir en que es el formato más fiel al sonido del master • La instalación es más barata
  • 40.
    Ventajas e inconvenientesde Dolby AC-3 • Usa un ratio de codificación elevado • Puede haber problemas con los cambios de rollo, aunque se puede evitar • Es el formato más extendido • El audio va sobre la película para evitar problemas de sincronismo
  • 41.
    Ventajas e inconvenientesde SDDS • Tiene el ratio de codificación más bajo de todos (creo) • Proporciona 8 canales de sonido, aunque no hay demasiados cines que soporten esto • Está muy ligado a Sony y sus estudios (Columbia, Tristar, etc.) • Es el sistema más caro de instalar
  • 42.
    THX • Es unsistema de certificación de la calidad creado en 1983 para asegurar que la película “El retorno del Jedi” se escuchase igual en los mejores cines. • THX viene de Tomlinson Holman’s eXperiment. • THX impone unos requisitos muy estrictos para los cines: • Suelo flotante • Paredes tratadas acústicamente • Pantalla perforada • Ruido de fondo NC-30 • Ángulo de visión • Calidad de la imagen
  • 43.
  • 44.
  • 45.
  • 46.
  • 47.
  • 48.
    THX • Criterios decertificación para cines: • Ruido de fondo (NC-30) • Aislamiento acústico • Reverberación • Ángulo de visión • Calidad de la imagen • Equipamiento • Instalación de los equipos
  • 49.
  • 50.
  • 51.
  • 52.
    Dolby True HD Colocaciónde los altavoces Ordenador