Utp pdi_2014-2_sap3 operaciones, transformaciones y conversiones
1. Procesamiento de Imágenes
y Visión Artificial
(WEE2)
Sesión: 3
Operaciones, transformaciones y conversiones
MSc. Ing. José C. Benítez P.
2. Logros de aprendizaje
1. Implementar las operaciones lógicas aplicadas a los
diferentes tipos de imágenes digitales
2. Utilizar las operaciones aritméticas entre los diferentes
tipos de imágenes digitales.
3. Programar las operaciones geométricas entre los
diferentes tipos de imágenes digitales.
4. Utilizar los métodos de conversión de imágenes digitales
a colores a escala de grises.
5. Procesar espacialmente las imágenes digitales.
6. Negativar una imagen digital binaria, escala de grises y a
colores.
2
3. 3
Contenido
Operaciones, transformaciones y conversiones:
Operaciones con imágenes
• Operaciones lógicas con imágenes.
• Operaciones aritméticas con imágenes.
• Operaciones trigonométricas con imágenes.
Conversiones de imágenes
• Métodos de conversión RGB a escala de grises.
• Negativo de una imagen digital.
Procesamiento espacial de imágenes.
4. Operaciones con imágenes
Operaciones lógicas
o AND.
o OR.
Operaciones aritméticas
o Suma.
o Resta.
o Multiplicación
Operaciones geométricas
o Traslaciones.
o Magnificaciones.
o Rotaciones.
14. Conversiones de imágenes
¿Cómo convertir una imagen a escala de grises?
Para que una imagen sea vea en tonos de gris se requiere
que los tres componentes básicos del color (en el
computador: rojo, verde, azul – RGB por sus siglas en inglés)
tengan más o menos la misma intensidad, podemos decir
que si queremos convertir un pixel a su equivalente en
escala de grises bastaría con hacer algo como esto:
• Sumar los valores de los componentes de color del pixel,
14
es decir sumar R + G + B
• Sacar el promedio de esa suma
• El valor hallado se debe asignar a R, G y B
Con estos tres pasos ya logramos que el pixel sea de color
gris ya que cada uno de sus componentes tiene el mismo
valor.
15. Conversiones de imágenes
¿Cómo convertir una imagen a escala de grises?
15
Hay muchas otras formas de hacerlo, incluso alguien que
haya trabajado previamente con imágenes puede tener
su propia versión de como implementarlo de acuerdo a lo
que necesite o al tiempo que tenga.
Pero existe una manera ampliamente conocida y
aceptada en el gremio de las personas que trabajan con
imágenes y visión por computador esa manera es la que
aprenderemos a efectuar.
16. 16
Conversiones de imágenes
El ojo humano y su sensibilidad
Bien, resulta que el ojo humano es mucho más sensible a los
colores verdes y rojos que al azul, por lo que en cuanto a
precepción de iluminación se trata nuestro ojo reconoce los
patrones de iluminación en color en las siguientes
proporciones para cada componente:
• Rojo: 30%
• Verde: 59%
• Azul: 11%
Así que lo más adecuado es calcular el valor de cada
componente de color con base a esta proporción y de este
modo se obtiene el pixel de color gris con la iluminación
adecuada para que nuestro ojo lo perciba como un mejor
equivalente a su versión en color.
17. 17
Conversiones de imágenes
Conversión de imágenes RGB a grayscale
En PDI existen generalmente cuatro funciones diferentes
para convertir los colores a escala de grises: "lightness",
"luminosity" y "average".
Para cada píxel: "lightness" promedia los valores de color
máximo y mínimo; "luminosity" le da más peso al verde y
muy poco al azul; "average" calcula el promedio de los tres
colores:
Average = (R + G + B) / 3
Lightness = ( max(R,G,B) + min(R,G,B) ) / 2
Luminosity = 0,21 ×R + 0,72 ×G + 0,07 ×B
Luminancia = R×0.3 + G×0.59 + B×0.11
19. 19
Conversiones de imágenes
Negativo de una imagen
Si una imagen es binaria, el negativo de la imagen es el
cambio de los pixeles 1 a 0.
Si una imagen es de escala de grises, el negativo es el
valor del pixel interpolado opuesto a la profundidad.
Ejemplo: Si el pixel tiene valor g, y su profundidad es 8
bpp su valor negativo será 255-g.
Si una imagen es a color, el negativo es el valor de cada
pixel de cada color interpolado opuesto a la profundidad
de los colores.
Ejemplo: Si el pixel tiene valor (r, g, b), y su profundidad
es 8 bpp su valor negativo para cada color será: (255-x,
255-y, 255-z)
21. Resumen
Realizar un resumen mediante mapas conceptuales (CMapTools)
21
de esta diapositiva.
Serán mejor consideradas los resúmenes que tengan información
extra a esta diapositiva.
Las fuentes adicionales utilizadas en el resumen se presentarán
en su carpeta personal del Dropbox y deben conservar el nombre
original y agregar al final _S3.
Las fuentes y los archivos *.cmap deben colocarse dentro de su
carpeta personal del Dropbox, dentro de una carpeta de nombre:
PDI_PaternoM_S3
Las Tareas que no cumplan las
indicaciones no serán considerados
por el profesor.
22. 22
Preguntas
El resumen con mapas conceptuales solicitado de la Sesión, al
menos debe responder las siguientes preguntas:
1. Clasificar las operaciones sobre imágenes digitales.
2. ¿Cual es la relación entre operaciones lógicas y aritméticas?
3. ¿En que consiste el overflow?.
4. Explicar los diferentes métodos de conversión RGB a escala de
grises. ¿Cuál es el mejor?
5. Explicar los diferentes métodos de negativar una imagen
digital.
6. Hacer un listado de 10 aplicaciones de las operaciones,
transformaciones y conversiones.
23. Sesión 3. Operaciones, transformaciones y conversiones
Procesamiento de Imágenes y Visión Artificial
23
http://utpiayva.blogspot.com