Este documento describe el estándar de codificación de video H.264/MPEG-4 AVC. Explica que es un formato de compresión utilizado para subir videos a Internet que ofrece mejor calidad que formatos anteriores a tasas de bits más bajas. También describe las características clave como estimación de movimiento, diferentes perfiles, y su capacidad para adaptarse a diferentes requisitos de ancho de banda y calidad de video.
2. ESPOL
H.264/MPEG-4 AVC.
1
H.264/MPEG-4 AVC
Primero es necesario tener en claro los siguientes términos técnicos: CONCEPTO
MPEG (Moving Pictures Experts Group) Formato estándar de compresión para video y audio; y nos facilitan a usar un formato específico
MPEG1
Video: se utiliza con el formato Video CD (comprimir un DVD en CD), la calidad de salida es similar a la de un VHS (video cassette) doméstico.
Audio: usa el Audio Layer 3; es el más conocido como MP3.
MEPG2
Estándar de compresión de video usado en DVD y una mejor calidad de imagen.
MEPG4
Estándares de comprensión de audio y video con los codecs vidD y DivX para el vídeo y AVC para el audio o también conocido como H.264
Códec
Abreviatura de codificador-decodificador. Pueden: codificar, transmitir, almacenar o cifrar una señal. Son a menudos usados en videoconferencias y emisiones de medios de comunicación.
AVC
Una norma que define un códec de video.
ITU-T
Sector de la Normalización de las Telecomunicaciones, es un sector de la UIT (unión internacional de telecomunicaciones)
Encargada de coordinar estándares para las telecomunicaciones.
ISO/IEC Estándar para la seguridad de la información por la Organización Internacional de Normalización y la Comisión Electrotécnica Internacional
NAL Es la capa de abstracción de red forma parte del estándar de codificación de video H.264/AVC .
El H.264 o MPEG-4 AVC (Advanced Video Coding), es un códec de video que permite comprimir y descomprimir un video digital, puede ofrecer un video con calidad de DVD en menos de 1Mbps. Esta se obtiene por estimación de movimiento e intra; reducción de artefactos de compresión. La codificación que usa de entropía, da un número menor de bits a símbolos que se encuentra con frecuencia y mayor número de bits que encontró con poca frecuencia de símbolos. En pocas palabras es un formato de compresión básicamente utilizado para subir videos en internet.
3. ESPOL
H.264/MPEG-4 AVC.
2
¿Cómo surgió el nombre ‘’ H.264/MPEG-4 AVC”? La ITU-T y la ISO/IEC se unieron para elaborar la siguiente generación de códec de video; el JVT (Joint Video Team - 2001) conformados por expertos del VCEG y MPEG fue formado con el fin de completar este desarrollo técnico. Y la ITU-T propuso adoptar este estándar con el nombre de ITU-T H.264 y por ende el ISO/IEC planteo el nombre MPEG-4 parte 10 AVC (Códec de video avanzado) de esta manera se surgió en conjunto el término H.264/MPEG-4 AVC. Para su respectiva programación tomaron en consideración lo siguiente: La estructura DCT + Compensación de Movimiento no sufriría cambios fundamentales. Anteriores formas de codificar video se volverían a examinar. No se aceptaría mantener compatibilidades con normas anteriores. CARACTERISTICAS Recordemos que el objetivo inicial de MPEG-4AVC estaba enfocado hacia los videos de baja calidad en aplicaciones o videoconferencias por internet, basados en 8bits/muestra con un muestreo ortogonal de 4:2:0 por lo que no daba salida al uso de en ambientes ya profesionales que por razones obvias necesitan resoluciones más elevadas para dar una mejor calidad a los espectadores, para esto es necesario: Más de 8 bits/muestra Un muestreo de 4:4:4 o 4:2:2 Tasas binarias más elevadas Utilizar un sistema de color por componentes RGB No tener pérdidas en el video. Por ende para poder responder a estas demandas de mejor resolución y calidad, aparecieron las ‘’extensiones de gama de fidelidad’’ (FRext) que tienen soporte para:
Tamaño de transformada adaptativo.
Cuantificación con matrices escaladas.
Representación eficiente sin pérdidas de regiones específicas.
Luego tenemos este conjunto de extensiones denominadas de "perfil alto" son:
La extensión × High :
o Soporta 4:2:0 hasta 8 bits/muestra.
La extensión High-10 :
4. ESPOL
H.264/MPEG-4 AVC.
3
o Soporta 4:2:0 hasta 10 bits/muestra.
La extensión High 4:2:2 :
o Soporta hasta 4:2:2
o 10 bits/muestra
La extensión High 4:4:4 :
o Soporta hasta 4:4:4
o 12 bits/muestra
o la codificación de regiones sin pérdidas
DIFERENCIAS CON VERSIONES ANTERIORES
El H.264/MPEG-4 AVC tiene diferencias con versiones anteriores en el principio general de codificación que es: predicción, transformada, cuantificación. Con una menor cuantía de información que se necesita almacenar en los videos codificados mediante ese códec.
Las imágenes tienen dos nuevas normas la SP (switching P) y la SI (switching I) que codifican la transición entre dos flujos de video, nos permiten enviar imágenes intra en tiempos de procesamiento, pasar de un video a otro usando predicción temporal o espacial con la ventaja que permite la reconstrucción de valores específicos exactos de la muestra aunque se utilicen imágenes de referencias diferentes en el proceso de predicción.
El proceso de compensación de movimiento nos da una gran variedad de formas y de particiones de bloques, cada macrobloque a parte del tamaño original, puede ser descompuesto en sub-bloques y este a su vez puede ser descompuesto; proporciona una mayor exactitud en la estimación, con una precisión que puede llegar hasta un cuarto de pixel.
En los perfiles FRExt un tamaño de 4x4 pixeles a 8x8 pixeles
Coeficientes enteros que permite evitar errores de redondeo en la DCT clásica
Tiene una precisión finita, se puede calcular sin exceder los 16 bits de precisión.
Se puede implementar exclusivamente por medio de sumas y desplazamientos binarios.
El rango del QP (parámetro de cuantificación) ha aumentado, ya que los valores van de 0 a 51; y para conseguir mejores resultados visuales la cuantificación de la crominancia es mejor que la de la luminancia.
Integra un filtro antibloques con el que mejora la eficacia de compresión y la calidad visual de la secuencias de video eliminando a su vez efectos indeseables de la codificación.
Adaptabilidad a la red, los algoritmos están divididos en 2 capas:
Codificación de video VCL que representa eficazmente el contenido del video
Capa de adaptación a la red NAL orientada para adaptar el formato de datos de video al soporte de transmisión. .