Procesamiento de Imágenes 
y Visión Artificial 
(WEE2) 
Sesión: 1 
Introducción a 
la Visión Artificial y el 
Procesamiento Digital de Imágenes 
MSc. Ing. José C. Benítez P.
Logros de aprendizaje 
1. Definir los conceptos básicos de Inteligencia Artificial, 
Visión Computacional, Visión Artificial, Procesamiento 
de Imágenes, Gráficos por computadora. 
2. Conocer las dificultades de la Visión Computacional y el 
Reconocimiento de Patrones. 
3. Definir la imposibilidad física y, las restricciones y 
supuestos del procesamiento de imágenes. 
4. Identificar la aplicaciones de la visión artificial. 
5. Modelar un Sistema de Visión Artificial. 
2
3 
Contenido 
Introducción a la Visión Artificial y al PDI 
• Inteligencia artificial. 
• Visión Artificial, Visión Computacional, PDI, Gráficos 
por computadora. 
• Disciplinas de la Visión Computacional. 
• Procesamiento de Imágenes. 
• Reconocimiento de patrones. 
• Visión computacional. 
• Gráficos por computadora. 
• Dificultades de la Visión Computacional. 
• Dificultades del Reconocimiento de Patrones. 
• Imposibilidad física. 
• Restricciones y supuestos. 
• Aplicaciones de la Visión Artificial. 
• Sistema de Visión Artificial.
Esquema del curso 
Operaciones 
Punto 
Filtros Segmentación 
Extracción de 
características 
Operaciones 
Morfológicas 
Reconocimiento 
de Patrones 
Introducción a 
la Visión 
Artificial 
Representación 
de la Imagen 
4
Inteligencia Artificial 
• La inteligencia artificial es 
una ciencia que intenta crear 
programas para máquinas que 
imiten el comportamiento y la 
comprensión humana. 
• Intenta crear máquinas y/o 
programas para automatizar 
tareas que requieran de 
comportamiento inteligente. 
• Estas máquinas y/o programas 
se denominan agentes. 
5
Visión Artificial 
• La Visión Artificial (Visión por Computador 
o Visión Computacional), es parte de la 
inteligencia artificial. 
• Es el conjunto de técnicas y modelos que 
permiten procesar, analizar y explicar 
aquella información espacial (3-D) obtenida 
a través de una imagen digital (2-D). 
• Intenta programar un computador para que 
"entienda" una escena o las características 
de una imagen digital. 
6
La visión artificial y otras áreas 
7
Disciplinas de la Visión Computacional 
Procesamiento 
de Imágenes 
Reconocimiento 
de Patrones 
Visión 
Computacional 
Gráficos por 
Computadora 
8
Procesamiento de Imágenes 
• Transforma imágenes para obtener nuevas imágenes. 
Binarización, Complemento 
Corte, Ecualización, Filtros 
Operaciones Morfológicas 
Imagen 2D Imagen 2D 
9
Procesamiento de Imágenes 
• Mejorado de Imágenes 
• Restauración de imágenes 
corregir imágenes fuera de foco 
• Compresión de la imagen 
(transmisión) 
• Identificar el ROI. 
10
Reconocimiento de Patrones 
• Identificar los objetos existentes en una imagen. 
Segmentación, filtros, 
Identificación de bordes, 
Clasificación y reconoci-miento 
Imagen 2D patrones 
de Patrones 
11
Reconocimiento de Patrones 
• Reconocimiento de rostros 
• Reconocimiento de celulas 
• Reconocimiento de huellas 
digitales 
• Reconocimiento de placas 
12
Visión Computacional 
• Reconstrucción de la imagen 3D desde imágenes 2D 
Construcción imágenes 3D 
Generación de escenas 
Descripción de la escena 
Imagen 2D 
Datos 
geométricos 
en 3D 
Imagen Original Esquema Básico Esquema intermedio Escena en 3-D 
13
• Determinar la identidad y 
localización de objetos en una 
imagen. 
• Construir una representación 
tridimensional de un objeto. 
• Construir una descripción de la 
escena de trabajo. 
• Establece la relación entre el 
mundo 3-D y las vistas 2-D 
tomadas de él, para: 
1. Reconstruir un espacio 3-D a 
partir de vistas 2-D 
2. Proyectar una escena 3-D en 
un plano 2-D. 
Visión Computacional 
14
Gráficos por Computadora 
• Modelado Geométrico de objetos 
Projecciones 3D en 2D 
Sombreado, 
Texturizado 
Animación, Renderización 
Datos 
Geométricos 
en 3D 
Imagen 2D 
15
Dificultades de la visión computacional 
Es un mapeo de M:1 (3D  2D) 
• Muchas superficies 3D con materiales, geometría e 
iluminación distintas, nos llevan a imágenes 2D idénticas. 
• El mapeo inverso (2D  3D) no tiene una solución única, 
por que en el paso 3D  2D se ha perdido información. 
Computacionalmente cara. 
• El cerebro humano trabaja en paralelo, para procesar miles 
de señales. Una PC tiene un solo μP. 
Dificultad para identificar el patrón a reconocer. 
• No entendemos aún el problema de reconocimiento de 
patrones. 
16
Dificultades del Reconocimiento de Patrones 
¿Cómo discernir entre realidad y una imagen de la realidad? 
¿Qué pistas o claves están presentes en la imagen? 
¿Qué conocimiento utilizamos para reconocer algo en la imagen? 
17
Dificultades del Reconocimiento de Patrones 
¿Qué es este objeto? 
¿Juega el color un rol importante en el reconocimiento? 
¿Sería más fácil reconocerlo desde una vista diferente? 
18
Dificultades del Reconocimiento de Patrones 
• ¿La textura característica de una imagen pueden ayudarnos a 
reconocer objetos rápidamente? 
19
Dificultades del Reconocimiento de Patrones 
• ¿La forma de una imagen pueden ayudarnos a reconocer 
objetos rápidamente? 
¿cuál es macho y cuál es hembra? 
20
Imposibilidad física 
21
Restricciones y Supuestos 
• Restricciones para recobrar la escena 
– Recolectar más datos (imágenes) 
– Asumir cosas acerca del mundo 
• Computabilidad y robustez 
– Es la solución computable usando recursos razonables? 
– Es la solución robusta? 
• Sistemas para la industria. 
– Hacen fuertes suposiciones sobre las condiciones de iluminación 
– Hacen fuertes suposiciones sobre la posición de los objetos 
– Hacen fuertes suposiciones sobre el tipo de objetos 
22
Aplicaciones de la 
Visión Artificial 
23
Control de calidad en la industria 
24
Biometría 
25
Detección de rostros 
26
Reconocimiento de Actividad Humana 
27
Reconocimiento de objetivos 
28
Interpretación de imágenes aéreas 
29
Monitoreo de tráfico 
30
Sistema de Visión Artificial 
31
Sistema de Visión Artificial 
32
Digitalización 
Retro-alimentación Imagen Capturada 
Procesamiento 
de la imagen 
Objetos Reconocidos Segmento de interés 
33 
Sistema de Visión Artificial
Referencias 
• R. C. González, R. E. Woods; Digital image processing; Addison- 
Wesley, 2007. 
• N. Efford; Digital image processing: A practical introduction 
using JAVA; Addison-Wesley, 2000. 
• R. C. González, R. E. Woods, S. L. Eddins; Digital image 
processing using MATLAB; Prentice Hall, 2004. 
• J. R. Parker; Algorithms for image processing and computer 
vision; Wiley, 1997. 
34
35 
Resumen 
 Realizar un resumen mediante mapas conceptuales (CMapTools) 
de esta diapositiva. 
 Serán mejor consideradas los resúmenes que tengan información 
extra a esta diapositiva. 
 Las fuentes adicionales utilizadas en el resumen se presentarán 
en su carpeta personal del Dropbox y deben conservar el nombre 
original y agregar al final _S1. 
 Las fuentes y los archivos *.cmap deben colocarse dentro de su 
carpeta personal del Dropbox, dentro de una carpeta de nombre: 
PDI_PaternoM_S1 
Las Tareas que no cumplan las 
indicaciones no serán considerados 
por el profesor.
36 
Preguntas 
El resumen con mapas conceptuales solicitado de la Sesión, al 
menos debe responder las siguientes preguntas: 
1. ¿Qué es la IA?. ¿Qué son los agentes? 
2. ¿Qué es la VA? ¿Qué es el PDI? 
3. ¿Cuáles son las aplicaciones del PDI? 
4. ¿Qué es el reconocimiento de patrones? 
5. ¿Cuáles son las aplicaciones del RDP? 
6. ¿Qué es la visión computacional (VC)? 
7. ¿Qué son los gráficos por computadora?. 
8. ¿Cuáles son las dificultades de la VC y del RDP?. 
9. Hacer un listado de 10 aplicaciones del PDI. 
10. ¿Qué es un sistema de VA y cuáles son sus elementos?
37 
Sesión 1. Introducción a la VA y al PDI 
Procesamiento de Imágenes 
y Visión Artificial 
Blog del curso: 
http://utppdiyva.blogspot.com

Utp 2014-1_pdi_cap1 introduccion a la va

  • 1.
    Procesamiento de Imágenes y Visión Artificial (WEE2) Sesión: 1 Introducción a la Visión Artificial y el Procesamiento Digital de Imágenes MSc. Ing. José C. Benítez P.
  • 2.
    Logros de aprendizaje 1. Definir los conceptos básicos de Inteligencia Artificial, Visión Computacional, Visión Artificial, Procesamiento de Imágenes, Gráficos por computadora. 2. Conocer las dificultades de la Visión Computacional y el Reconocimiento de Patrones. 3. Definir la imposibilidad física y, las restricciones y supuestos del procesamiento de imágenes. 4. Identificar la aplicaciones de la visión artificial. 5. Modelar un Sistema de Visión Artificial. 2
  • 3.
    3 Contenido Introduccióna la Visión Artificial y al PDI • Inteligencia artificial. • Visión Artificial, Visión Computacional, PDI, Gráficos por computadora. • Disciplinas de la Visión Computacional. • Procesamiento de Imágenes. • Reconocimiento de patrones. • Visión computacional. • Gráficos por computadora. • Dificultades de la Visión Computacional. • Dificultades del Reconocimiento de Patrones. • Imposibilidad física. • Restricciones y supuestos. • Aplicaciones de la Visión Artificial. • Sistema de Visión Artificial.
  • 4.
    Esquema del curso Operaciones Punto Filtros Segmentación Extracción de características Operaciones Morfológicas Reconocimiento de Patrones Introducción a la Visión Artificial Representación de la Imagen 4
  • 5.
    Inteligencia Artificial •La inteligencia artificial es una ciencia que intenta crear programas para máquinas que imiten el comportamiento y la comprensión humana. • Intenta crear máquinas y/o programas para automatizar tareas que requieran de comportamiento inteligente. • Estas máquinas y/o programas se denominan agentes. 5
  • 6.
    Visión Artificial •La Visión Artificial (Visión por Computador o Visión Computacional), es parte de la inteligencia artificial. • Es el conjunto de técnicas y modelos que permiten procesar, analizar y explicar aquella información espacial (3-D) obtenida a través de una imagen digital (2-D). • Intenta programar un computador para que "entienda" una escena o las características de una imagen digital. 6
  • 7.
    La visión artificialy otras áreas 7
  • 8.
    Disciplinas de laVisión Computacional Procesamiento de Imágenes Reconocimiento de Patrones Visión Computacional Gráficos por Computadora 8
  • 9.
    Procesamiento de Imágenes • Transforma imágenes para obtener nuevas imágenes. Binarización, Complemento Corte, Ecualización, Filtros Operaciones Morfológicas Imagen 2D Imagen 2D 9
  • 10.
    Procesamiento de Imágenes • Mejorado de Imágenes • Restauración de imágenes corregir imágenes fuera de foco • Compresión de la imagen (transmisión) • Identificar el ROI. 10
  • 11.
    Reconocimiento de Patrones • Identificar los objetos existentes en una imagen. Segmentación, filtros, Identificación de bordes, Clasificación y reconoci-miento Imagen 2D patrones de Patrones 11
  • 12.
    Reconocimiento de Patrones • Reconocimiento de rostros • Reconocimiento de celulas • Reconocimiento de huellas digitales • Reconocimiento de placas 12
  • 13.
    Visión Computacional •Reconstrucción de la imagen 3D desde imágenes 2D Construcción imágenes 3D Generación de escenas Descripción de la escena Imagen 2D Datos geométricos en 3D Imagen Original Esquema Básico Esquema intermedio Escena en 3-D 13
  • 14.
    • Determinar laidentidad y localización de objetos en una imagen. • Construir una representación tridimensional de un objeto. • Construir una descripción de la escena de trabajo. • Establece la relación entre el mundo 3-D y las vistas 2-D tomadas de él, para: 1. Reconstruir un espacio 3-D a partir de vistas 2-D 2. Proyectar una escena 3-D en un plano 2-D. Visión Computacional 14
  • 15.
    Gráficos por Computadora • Modelado Geométrico de objetos Projecciones 3D en 2D Sombreado, Texturizado Animación, Renderización Datos Geométricos en 3D Imagen 2D 15
  • 16.
    Dificultades de lavisión computacional Es un mapeo de M:1 (3D 2D) • Muchas superficies 3D con materiales, geometría e iluminación distintas, nos llevan a imágenes 2D idénticas. • El mapeo inverso (2D 3D) no tiene una solución única, por que en el paso 3D 2D se ha perdido información. Computacionalmente cara. • El cerebro humano trabaja en paralelo, para procesar miles de señales. Una PC tiene un solo μP. Dificultad para identificar el patrón a reconocer. • No entendemos aún el problema de reconocimiento de patrones. 16
  • 17.
    Dificultades del Reconocimientode Patrones ¿Cómo discernir entre realidad y una imagen de la realidad? ¿Qué pistas o claves están presentes en la imagen? ¿Qué conocimiento utilizamos para reconocer algo en la imagen? 17
  • 18.
    Dificultades del Reconocimientode Patrones ¿Qué es este objeto? ¿Juega el color un rol importante en el reconocimiento? ¿Sería más fácil reconocerlo desde una vista diferente? 18
  • 19.
    Dificultades del Reconocimientode Patrones • ¿La textura característica de una imagen pueden ayudarnos a reconocer objetos rápidamente? 19
  • 20.
    Dificultades del Reconocimientode Patrones • ¿La forma de una imagen pueden ayudarnos a reconocer objetos rápidamente? ¿cuál es macho y cuál es hembra? 20
  • 21.
  • 22.
    Restricciones y Supuestos • Restricciones para recobrar la escena – Recolectar más datos (imágenes) – Asumir cosas acerca del mundo • Computabilidad y robustez – Es la solución computable usando recursos razonables? – Es la solución robusta? • Sistemas para la industria. – Hacen fuertes suposiciones sobre las condiciones de iluminación – Hacen fuertes suposiciones sobre la posición de los objetos – Hacen fuertes suposiciones sobre el tipo de objetos 22
  • 23.
    Aplicaciones de la Visión Artificial 23
  • 24.
    Control de calidaden la industria 24
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
    Sistema de VisiónArtificial 31
  • 32.
    Sistema de VisiónArtificial 32
  • 33.
    Digitalización Retro-alimentación ImagenCapturada Procesamiento de la imagen Objetos Reconocidos Segmento de interés 33 Sistema de Visión Artificial
  • 34.
    Referencias • R.C. González, R. E. Woods; Digital image processing; Addison- Wesley, 2007. • N. Efford; Digital image processing: A practical introduction using JAVA; Addison-Wesley, 2000. • R. C. González, R. E. Woods, S. L. Eddins; Digital image processing using MATLAB; Prentice Hall, 2004. • J. R. Parker; Algorithms for image processing and computer vision; Wiley, 1997. 34
  • 35.
    35 Resumen Realizar un resumen mediante mapas conceptuales (CMapTools) de esta diapositiva. Serán mejor consideradas los resúmenes que tengan información extra a esta diapositiva. Las fuentes adicionales utilizadas en el resumen se presentarán en su carpeta personal del Dropbox y deben conservar el nombre original y agregar al final _S1. Las fuentes y los archivos *.cmap deben colocarse dentro de su carpeta personal del Dropbox, dentro de una carpeta de nombre: PDI_PaternoM_S1 Las Tareas que no cumplan las indicaciones no serán considerados por el profesor.
  • 36.
    36 Preguntas Elresumen con mapas conceptuales solicitado de la Sesión, al menos debe responder las siguientes preguntas: 1. ¿Qué es la IA?. ¿Qué son los agentes? 2. ¿Qué es la VA? ¿Qué es el PDI? 3. ¿Cuáles son las aplicaciones del PDI? 4. ¿Qué es el reconocimiento de patrones? 5. ¿Cuáles son las aplicaciones del RDP? 6. ¿Qué es la visión computacional (VC)? 7. ¿Qué son los gráficos por computadora?. 8. ¿Cuáles son las dificultades de la VC y del RDP?. 9. Hacer un listado de 10 aplicaciones del PDI. 10. ¿Qué es un sistema de VA y cuáles son sus elementos?
  • 37.
    37 Sesión 1.Introducción a la VA y al PDI Procesamiento de Imágenes y Visión Artificial Blog del curso: http://utppdiyva.blogspot.com