Este documento describe diferentes técnicas de transformadas utilizadas para la compresión de imágenes, incluyendo la transformada de Walsh-Hadamard, la transformada de Haar, la transformada de Karhunen-Loève y la transformada discreta del coseno. Estas transformadas reducen la redundancia en las imágenes al descorrelacionar los pixeles y aislando las diferentes frecuencias, lo que permite la compresión mediante la eliminación de la información menos importante. La transformada discreta del coseno es particularmente eficiente y es utilizada en los
8. TRANSFORMADAS ORTOGONALES
TRANSFORMADA DE UNA
IMAGEN
Disminuye la
redundancia
Identifica las partes
menos importantes
Reduciendo los
tamaños de la
mayor parte de los
pixeles
Aislando las diversas
frecuencias de la
imagen
9. TRANSFORMADAS ORTOGONALES
• Las frecuencias bajas corresponden a características importantes de la
imagen.
• Las frecuencias altas corresponden a los detalles de la imagen (son menos
importantes).
10. TRANSFORMADAS ORTOGONALES
• Cada fila de W se llama vector de la base.
• La reducción de la redundancia. El primer coeficiente c1 puede ser grande, pero el
resto de los valores deben ser pequeños.
• El aislamiento de las frecuencias. El primer coeficiente c1 debe corresponder a la
frecuencia de pixel cero, y los coeficientes restantes deben corresponder a
frecuencias cada vez mas altas.
Valores
transformados o
coeficientes de la
transformada
Ítems de datos
(pixeles)
Pesos
, , 1,2,...,i j ijj
c d w i j n= =
C = W D
11. TRANSFORMADAS ORTOGONALES
• El primer vector de la base (la fila superior de W) está formado únicamente por 1’s
por lo que su frecuencia es cero.
• Los vectores subsiguientes tienes dos +1’s y dos -1’s, produciendo valores
transformados pequeños, y sus frecuencias cada vez mas altas.
14. LA TRANSFORMADA DE WALSH-
HADAMARD
RÁPIDA Y FÁCIL DE CALCULAR
REQUIERE SOLAMENTE
ADICIONES Y SUSTRANCCIONES
SU RENDIMIENTO EN
COMPACTACIÓN DE ENERGíA ES
MENOR QUE LA DCT
EFICIENCIA DE COMPRESIÓN
BAJA
15. LA TRANSFORMADA DE WALSH-
HADAMARD
( ) bit i de la representación binaria del entero uib u =
17. LA TRANSFORMADA DE HAAR
SIMPLE Y RÁPIDA
ES LA TRANSFORMADA WAVELET
MAS SENCILLA
SE BASA EN LAS FUNCIONES DE
HAAR
18. LA TRANSFORMADA DE HAAR
2 1
0 1
0, 0 1
0, 1 2
p
p
k q
p n
Si p q ó
i p q
= + −
−
= =
2
0
0
1
1
2
4 2
0 2 0 1
1 2 1 1
2 2 1 1
3 2 2 1
n
N
N
=
= =
= + −
= + −
= + −
= + −
( ) ( )
def
0 00
1
, 0 1h x h x x
N
= =
( ) ( )
2
def
2
1
1 2
2 2
2 , 1
1 22 ,
2 2
0,
en otro caso para 0,1
p p
p
p
k pq p p
q
q
x
q
q
h x h x x
N
x
−
−
−
= −
=
19. LA TRANSFORMADA DE KARHUNEN-
LOÈVE
ES LA MEJOR EN
COMPACTACIÓN DE ENERGÍA
SUS COEFICIENTES DEPENDEN
DE LOS DATOS A SER
COMPRIMIDOS
EL CÁLCULO DE LOS
COEFICIENTES ES LENTO
GENERALMENTE NO SE UTILIZA
POR SU LENTITUD
20. LA TRANSFORMADA DE KARHUNEN-
LOÈVE
( )
, 1,2,...,i
i k=b Vectores de los bloques
( )i
i
k
=
b
b Vector promedio
( ) ( )i i
= −v b b
( )
0
i
i
k
=
v
( ) ( )i i
=w Av
( )
0
i
i
k
=
w
( ) ( ) ( )
( )
( ) ( ) ( )
( )
1 2
1 2
, ,...,
, ,...,
k
k
=
=
V v v v
W w w w
= W A V
( ) ( ) ( ) ( )
( )j 1 2 k
j j jw ,w ,...,w=c
21. LA TRANSFORMADA DISCRETA DEL
COSENO
TAN EFICIENTE COMO LA KLT
UTILIZA UNA BASE FIJA
INDEPENDIENTE DE LOS DATOS
EXISTEN MÉTODOS RÁPIDOS
PARA EL CÁLCULO DE LA DCT
ES UTILIZADO POR JPEG Y MPEG
22. LA TRANSFORMADA DISCRETA DEL
COSENO
• Es parecida a la DFT, pero sólo usa números reales.
• Los coeficientes de la transformación son de la forma:
C(a, b, x, y) = cos ((2x+1)aπ/2W) · cos ((2y+1)bπ/2H)
• Esto da lugar a una base de imágenes con forma de celdas.
C(3, 2) C(5, 5)
• El valor de a indica el número
de celdas en cada fila (eje X),
y el de b el número de celdas
en cada columna (eje Y).
23. LA DCT
• Primeros componentes de la DCT, C(a, b, x, y).
a = 0 a = 1 a = 2 a = 3 a = 4b=0b=1b=2
24. • El resultado de la DCT se asemeja a un cuadrante de la
DFT. Magnitud ≡ valor absoluto del número.
Imagen de entrada, A DFT(A) DCT(A)
• La DCT tiene propiedades parecidas a la DFT (comportamiento
frente a rotación, escala, suavizado, etc.).
• Las aplicaciones de la DCT son las mismas que para la DFT:
eliminación de ruido, compresión de imágenes y análisis frecuencial
de las imágenes.