Este documento describe diferentes operaciones y transformaciones de imágenes digitales como operaciones lógicas, aritméticas y geométricas, así como métodos para convertir imágenes RGB a escala de grises. Explica que la conversión a escala de grises se puede hacer promediando los valores RGB de cada pixel o asignando un peso mayor al verde y menor al azul para imitar la sensibilidad del ojo humano. También cubre el procesamiento espacial de imágenes y el cálculo del negativo de una imagen.
Utp pdi_2014-2_sap3 operaciones, transformaciones y conversiones
1. Procesamiento de Imágenes
y Visión Artificial
(WEE2)
Sesión: 3
Operaciones, transformaciones y conversiones
Ing. José C. Benítez P.
2. Logros de aprendizaje
1. Conocer las operaciones lógicas y aritméticas aplicadas a
los diferentes tipos de imágenes digitales.
2. Procesar espacialmente las imágenes digitales.
3. Conocer los métodos de conversión de las imágenes
digitales RGB a escala de grises.
2
3. 3
Contenido
Operaciones, transformaciones y conversiones:
• Operaciones con imágenes.
• Procesamiento espacial de imágenes.
• Métodos de conversión RGB a escala de grises.
4. Operaciones con imágenes
Operaciones lógicas y aritméticas.
o Operaciones lógicas.
o Suma.
o Resta.
Operaciones geométricas.
o Traslaciones.
o Magnificaciones.
o Rotaciones.
o Interpolaciones
Procesamiento espacial.
o Convolución.
o Correlación.
o Convolución y correlación.
23. ¿Cómo convertir una imagen a escala de grises?
23
Para que una imagen sea vea en tonos de gris se
requiere que los tres componentes básicos del color (en
el computador: rojo, verde, azul – RGB por sus siglas en
inglés) tengan más o menos la misma intensidad,
podemos decir que si queremos convertir un pixel a su
equivalente en escala de grises bastaría con hacer algo
como esto:
• Sumar los valores de los componentes de color del
pixel, es decir sumar R + G + B
• Sacar el promedio de esa suma
• El valor hallado se debe asignar a R, G y B
Con estos tres pasos ya logramos que el pixel sea de
color gris ya que cada uno de sus componentes tiene el
mismo valor.
24. ¿Cómo convertir una imagen a escala de grises?
24
Hay muchas otras formas de hacerlo, incluso alguien que
haya trabajado previamente con imágenes puede tener
su propia versión de como implementarlo de acuerdo a lo
que necesite o al tiempo que tenga.
Pero existe una manera ampliamente conocida y
aceptada en el gremio de las personas que trabajan con
imágenes y visión por computador esa manera es la que
aprenderemos a efectuar.
25. 25
El ojo humano y su sensibilidad
Bien, resulta que el ojo humano es mucho más sensible a los
colores verdes y rojos que al azul, por lo que en cuanto a
precepción de iluminación se trata nuestro ojo reconoce los
patrones de iluminación en color en las siguientes
proporciones para cada componente:
• Rojo: 30%
• Verde: 59%
• Azul: 11%
Así que lo más adecuado es calcular el valor de cada
componente de color con base a esta proporción y de este
modo se obtiene el pixel de color gris con la iluminación
adecuada para que nuestro ojo lo perciba como un mejor
equivalente a su versión en color.
26. 26
Conversión de imágenes RGB a grayscale
En PDI existen generalmente cuatro funciones diferentes
para convertir los colores a escala de grises: lightness,
luminosity y average.
Para cada píxel: lightness promedia los valores de color
máximo y mínimo; luminosity le da más peso al verde y
muy poco al azul; average calcula el promedio de los tres
colores:
Average = (R + G + B) / 3
Lightness = ( max(R,G,B) + min(R,G,B) ) / 2
Luminosity = 0,21 ×R + 0,72 ×G + 0,07 ×B
Luminancia = R×0.3 + G×0.59 + B×0.11
28. 28
Negativo de una imagen
Si una imagen es binaria, el negativo de la imagen es el
cambio de los pixeles 1 a 0.
Si una imagen es de escala de grises, el negativo es el
valor del pixel interpolado opuesto a la profundidad.
Ejemplo: Si el pixel tiene valor g, y su profundidad es 8
bpp su valor negativo será 255-g.
Si una imagen es a color, el negativo es el valor de cada
pixel de cada color interpolado opuesto a la profundidad
de los colores.
Ejemplo: Si el pixel tiene valor (r, g, b), y su profundidad
es 8 bpp su valor negativo para cada color será: (255-x,
255-y, 255-z)