SlideShare una empresa de Scribd logo
1 de 48
Pontificia Universidad Católica de Chile
 Departamento de Ciencias de la Computación




CLASIFICACIÓN JERÁRQUICA DE
IMÁGENES

                                                                       Iván Lillo Vallés

                                       Profesores supervisores: Domingo Mery – Álvaro Soto
                                                          Viernes 28 de septiembre de 2012

                                                                                             1
Contenido
 Motivación
 Enfoques
 Propuesta
 Resultados preliminares
 Trabajo futuro
 Conclusiones



                            2
¿Para qué detectar
objetos en imágenes?

                               Interacción
  Inspección


                  Vigilancia


   Navegación
                                 Diversión


                                             3
¿Para qué detectar
objetos en imágenes?




                       4
¿Para qué detectar
objetos en imágenes?




                       5
¿Para qué detectar
objetos en imágenes?


                       http://techtalks.tv/talks/self-driving-cars/56391/




                                                                © Google




                                                                            6
Contenido
 Motivación
 Enfoques
 Propuesta
 Resultados preliminares
 Trabajo futuro
 Conclusiones



                            7
Aprendizaje de máquina
                               (Machine Learning)



                   Algoritmo de aprendizaje
     BD
                • Sesgo – conocimiento previo              Tarea
entrenamiento
                • Espacio de hipótesis
                • Esquema de búsqueda




                                              Evaluación




                                                                   8
Aprendizaje de máquina
                               (Machine Learning)

                   Algoritmo de aprendizaje

                • Sesgo – conocimiento previo
                • Espacio de hipótesis
                • Esquema de búsqueda




      Sesgo                                     Esquema de búsqueda
                     Espacio de hipótesis
• Descripción                                   • Optimización
                 • Cómo uso los datos
• Esquema                                       • Exhaustiva
                 • Esquema de clasificador
• Relaciones                                    • Greedy




                                                                  9
Aprendizaje de máquina
                        (Machine Learning)
      Sesgo
                           Detección de personas
• Descripción
• Esquema       HoG denso, con traslape (holístico)
• Relaciones

                                           Dalal & Triggs, CVPR 2005




                                                                       10
Aprendizaje de máquina
                        (Machine Learning)
      Sesgo
                           Detección de personas
• Descripción
• Esquema
                Partes con patrones repetitivos: Poselets
• Relaciones


                                            Bourdev et al, ECCV 2009




                                                                       11
Aprendizaje de máquina
                        (Machine Learning)
      Sesgo
                            Detección de objetos
• Descripción
• Esquema       Información característica: objeto + pocas
• Relaciones    partes : Object detector de Felzenszwalb

                                      Felzenszwalb et al, 2010




                                                                 12
Aprendizaje de máquina
                       (Machine Learning)
      Sesgo
                          Clasificación de escenas
• Descripción
                Información característica: pequeñas partes
• Esquema
                (patrones) repetitivos en las imágenes
• Relaciones
                (diccionario visual)




                                                              13
Aprendizaje de máquina
                       (Machine Learning)
      Sesgo
                          Clasificación de escenas
• Descripción
                Información característica: pequeñas partes
• Esquema
                (patrones) repetitivos en las imágenes
• Relaciones
                (diccionario visual)




                                                              14
Aprendizaje de máquina
                            (Machine Learning)
   Espacio de hipótesis

• Cómo uso los datos         MODELO
• Esquema de clasificador



                               Lineales
                                               No
                                            lineales


                                Árboles
                                              Redes
                                            neuronales


                                    FUNCIÓN X Y
                                                         15
Aprendizaje de máquina
                               (Machine Learning)



                   Algoritmo de aprendizaje
     BD
                • Sesgo – conocimiento previo              Tarea
entrenamiento
                • Espacio de hipótesis
                • Esquema de búsqueda




                                              Evaluación




                                                                   16
Contenido
 Motivación
 Enfoques
 Propuesta
 Resultados preliminares
 Trabajo futuro
 Conclusiones



                            17
PROBLEMAS

Datos no estructurados       Holístico




                                         18
PROBLEMAS

Modelos de partes    Anotaciones (poselets)

                     Sesgo (object detector Felzenszwalb)

                     Disjunción partes/clasificación




                                                            19
¿Es posible encontrar partes sin
supervisión y que sean discriminativas?
            Sin anotaciones

            Útiles para clasificar

            Sin sesgo que limite la búsqueda




                    Aprendizaje conjunto



                                               20
Aprendizaje conjunto



         PARTES



    CLASIFICADORES
CONSIDERANDO LAS PARTES




                           21
Aprendizaje conjunto



  PARTES                        CLASIFICADORES
                            CONSIDERANDO LAS PARTES



Regiones de imagen
                           Clasificadores   Puntaje (score)
   Multiescala
                              lineales      por cada región
     Formas



                                                              22
Aprendizaje conjunto



PARTES                         CLASIFICADORES
                           CONSIDERANDO LAS PARTES




         Puntaje (score)         Asignaciones de
         para la imagen            cada región




                                                   23
Imagen   Regiones        Vectores




          N regiones   fi describe región i
          i = 1,…, N

                                              24
K partes

           K clasificadores lineales (vectores)   w
           Región i  asignación       zi 1,..., K 

L categorías

           L clasificadores lineales (vectores) 

           Descriptor: histograma de asignaciones     h( z )


           Asignaciones unen partes y categorías

                                                               25
Definición de energía (score) por imagen


                             Score clasificador        Score partes contenidas
  E° configuración    =          imagen           +          en imagen



                                                            N
   E  x, y, z                 αT h  z 
                                  y                        z
                                                            wTi fi
                                                           i 1

              Asignaciones                                              Descriptor
Imagen                                  Histograma                      región i
                        Clasificador    asignaciones    Clasificador
     Categoría          categoría                       asignación zi



                                                                                 26
N
E  x, y, z                 αT h  z 
                               y                         z
                                                          wTi fi
                                                          i 1

Tarea


          E° configuración                 E° configuración
              correcta           >            incorrecta




  E x j , y j , z j         E  x j , yi , zi  , i  j



                                                                   27
E x j , y j , z j                  E  x j , yi , zi  , i  j

Búsqueda de parámetros                              optimización


                           L                  K                   M
                      1  α l          2  w k            3   j
                                   2                    2
            min                    2                    2
                          l 1               k 1                 j 1
sujeto a

    E  x j , y j , z j   E  x j , yi , zi   0  y j , yi , zi   j
                                                                           i  j ,  j  0




                                                                                                28
Datos de entrada
            M imágenes (xj ,yj), j = 1,…,M
            Nj parches por imagen



Se busca
            l, l = 1,…,L
            wk, k = 1,…,K
            zj, j = 1,…,M




                                             29
Inferencia
             Dada imagen x, inferir categoría




                                       N
                                            T 
              y , zi  arg max  yk   w k fi 
               *   *

                        k 1,..., K   i 1     
                        y 1,..., L




                                                    30
Estimación inicial w0 , z0
Estimación de parámetros

                                               Estimación |w, z



                                                 Actualizo z| ,w



                                                 Actualizo w| ,z




                                           N
              E  x, y, z   αT h  z    w Ti fi
                               y               z
                                          i 1


                                                                       31
Estimación de parámetros

       Estimación |w, z



                             L                   M
                        1  α l          3   j
                                     2
              min                    2
                            l 1                 j 1
  sujeto a

      E  x j , y j , z j   E  x j , yi , zi     y j , yi , zi   j   i  j ,  j  0




                                                                                                  32
Estimación de parámetros

      Actualizo z| ,w




                                           N
               E  x, y, z   α h  z    w Ti fi
                                T
                                y              z
                                           i 1




                                     N
                                          T 
                zi  arg max  ys   w s fi 
                 *

                      s 1,..., K   i 1     

                                                       33
Estimación de parámetros

         Actualizo w| ,z



                             K                   M
                        2  w k           3   j
                                      2
              min                     2
                            k 1                 j 1
  sujeto a

      E  x j , y j , z j   E  x j , yi , zi     y j , yi , zi   j   i  j ,  j  0




                                                                                                  34
Estimación inicial w0 , z0
Estimación de parámetros

                                Estimación |w, z



                                 Actualizo z| ,w



                                 Actualizo w| ,z




                           Parámetros estimados


                                                          35
Contenido
 Motivación
 Enfoques
 Propuesta
 Resultados preliminares
 Trabajo futuro
 Conclusiones



                            36
Caltech-4 (crops)
            4 categorías
            K = 200 (partes)
            Esquema piramidal  consistencia espacial
            50% datos entrenamiento / 50% prueba
            99.93% rendimiento (1 error de 1500 imágenes)




                                                            37
airplanes_side        cars




    faces        motorbikes_side




                                   38
airplanes_side         cars




    faces        motorbikes_side




                                   39
40
41
15 scenes categories
            15 categorías
            K = 750 (partes)
            Esquema piramidal  consistencia espacial
            100 datos entrenamiento / resto prueba
            78% rendimiento (81% estado del arte)




                                                        42
bedroom      suburb    industrial     kitcken      livingroom




   coast       forest    highway       inside_city   mountain




open_country   street   tallbuilding     office        store




                                                                  43
bedroom
      suburb
    industrial
      kitcken
  livingroom
        coast
       forest
    highway
  inside_city
   mountain
open_country
       street
  tallbuilding
       office
        store

                 44
Contenido
 Motivación
 Enfoques
 Propuesta
 Resultados preliminares
 Trabajo futuro
 Conclusiones



                            45
Mejorar modelo
           Nivel intermedio jerarquía partes/objetos
           Planteamiento y resolución
           Partes variables, multiescala


Nuevas pruebas y bases de datos



Publicar



                                                       46
Contenido
 Motivación
 Enfoques
 Propuesta
 Resultados preliminares
 Trabajo futuro
 Conclusiones



                            47
Esquema jerárquico
posee ventajas

                     Aprender partes
                     discriminativas


Necesidad: mejores
formulaciones y
procedimientos
                     Por mejorar: overfitting




                                                48

Más contenido relacionado

Similar a Clasificación Jerárquica de Objetos en Imágenes

Metodología de la Investigación. Tema 2. El proceso de investigación.
Metodología de la Investigación. Tema 2. El proceso de investigación.Metodología de la Investigación. Tema 2. El proceso de investigación.
Metodología de la Investigación. Tema 2. El proceso de investigación.
Universidad de Málaga
 
Taller de análisis de datos
Taller de análisis de datosTaller de análisis de datos
Taller de análisis de datos
Software Guru
 
Utp 2014-1_pdi_cap1 introduccion a la va
 Utp 2014-1_pdi_cap1 introduccion a la va Utp 2014-1_pdi_cap1 introduccion a la va
Utp 2014-1_pdi_cap1 introduccion a la va
c09271
 
Facci silabo bd_2012_ok
Facci silabo bd_2012_okFacci silabo bd_2012_ok
Facci silabo bd_2012_ok
ULEAM-FACCI
 
Evidencia 10. instrumentacion
Evidencia 10. instrumentacionEvidencia 10. instrumentacion
Evidencia 10. instrumentacion
javs8
 
Programación Orientada a Objeto y Java
Programación Orientada a Objeto y JavaProgramación Orientada a Objeto y Java
Programación Orientada a Objeto y Java
Ingeniería Nica
 

Similar a Clasificación Jerárquica de Objetos en Imágenes (19)

Plan+de+clases
Plan+de+clasesPlan+de+clases
Plan+de+clases
 
Inteligencia artificial i isc Temario
Inteligencia artificial i isc TemarioInteligencia artificial i isc Temario
Inteligencia artificial i isc Temario
 
Curso Big Data. Introducción a Deep Learning by Gabriel Valverde Castilla
Curso Big Data. Introducción a  Deep Learning by Gabriel Valverde CastillaCurso Big Data. Introducción a  Deep Learning by Gabriel Valverde Castilla
Curso Big Data. Introducción a Deep Learning by Gabriel Valverde Castilla
 
Introduccion a Azure Machine Learning.pptx
Introduccion a Azure Machine Learning.pptxIntroduccion a Azure Machine Learning.pptx
Introduccion a Azure Machine Learning.pptx
 
Metodología de la Investigación. Tema 2. El proceso de investigación.
Metodología de la Investigación. Tema 2. El proceso de investigación.Metodología de la Investigación. Tema 2. El proceso de investigación.
Metodología de la Investigación. Tema 2. El proceso de investigación.
 
Introducción a Machine Learning
Introducción a Machine LearningIntroducción a Machine Learning
Introducción a Machine Learning
 
Programaia
ProgramaiaProgramaia
Programaia
 
Taller de análisis de datos
Taller de análisis de datosTaller de análisis de datos
Taller de análisis de datos
 
Utp 2014-1_pdi_cap1 introduccion a la va
 Utp 2014-1_pdi_cap1 introduccion a la va Utp 2014-1_pdi_cap1 introduccion a la va
Utp 2014-1_pdi_cap1 introduccion a la va
 
Análisis del Software Educativo Primeros Auxilios
Análisis del Software Educativo Primeros AuxiliosAnálisis del Software Educativo Primeros Auxilios
Análisis del Software Educativo Primeros Auxilios
 
Facci silabo bd_2012_ok
Facci silabo bd_2012_okFacci silabo bd_2012_ok
Facci silabo bd_2012_ok
 
Deep Learning + R by Gabriel Valverde
Deep Learning + R by Gabriel ValverdeDeep Learning + R by Gabriel Valverde
Deep Learning + R by Gabriel Valverde
 
Evidencia 10. instrumentacion
Evidencia 10. instrumentacionEvidencia 10. instrumentacion
Evidencia 10. instrumentacion
 
Unidad v adsi -p2- (iii-2012)-web
Unidad v   adsi -p2- (iii-2012)-webUnidad v   adsi -p2- (iii-2012)-web
Unidad v adsi -p2- (iii-2012)-web
 
Tics
TicsTics
Tics
 
Programación Orientada a Objeto y Java
Programación Orientada a Objeto y JavaProgramación Orientada a Objeto y Java
Programación Orientada a Objeto y Java
 
Sie 2 esquivel-gamez
Sie 2 esquivel-gamezSie 2 esquivel-gamez
Sie 2 esquivel-gamez
 
Sie 2 esquivel-gamez
Sie 2 esquivel-gamezSie 2 esquivel-gamez
Sie 2 esquivel-gamez
 
Presentacion
PresentacionPresentacion
Presentacion
 

Último

QUINTA SEXTA GENERACION de COMPUTADORAS
QUINTA  SEXTA GENERACION de COMPUTADORASQUINTA  SEXTA GENERACION de COMPUTADORAS
QUINTA SEXTA GENERACION de COMPUTADORAS
Marc Liust
 
Editorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdfEditorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdf
Yanitza28
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
nicho110
 

Último (18)

10°8 - Avances tecnologicos del siglo XXI 10-8
10°8 - Avances tecnologicos del siglo XXI 10-810°8 - Avances tecnologicos del siglo XXI 10-8
10°8 - Avances tecnologicos del siglo XXI 10-8
 
Función del analizador léxico.pdf presentacion
Función del analizador léxico.pdf presentacionFunción del analizador léxico.pdf presentacion
Función del analizador léxico.pdf presentacion
 
investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXI
 
Editorial. Grupo de 12B. La Salle Margarita.pdf
Editorial. Grupo de 12B. La Salle Margarita.pdfEditorial. Grupo de 12B. La Salle Margarita.pdf
Editorial. Grupo de 12B. La Salle Margarita.pdf
 
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdfpresentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
presentacion_desamblado_de_una_computadora_base_a_las_normas_de_seguridad.pdf
 
presentación del desensamble y ensamble del equipo de computo en base a las n...
presentación del desensamble y ensamble del equipo de computo en base a las n...presentación del desensamble y ensamble del equipo de computo en base a las n...
presentación del desensamble y ensamble del equipo de computo en base a las n...
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
QUINTA SEXTA GENERACION de COMPUTADORAS
QUINTA  SEXTA GENERACION de COMPUTADORASQUINTA  SEXTA GENERACION de COMPUTADORAS
QUINTA SEXTA GENERACION de COMPUTADORAS
 
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptx
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptxinfor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptx
infor expo AVANCES TECNOLOGICOS DEL SIGLO 21.pptx
 
Guia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosGuia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos Basicos
 
Editorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdfEditorial. Grupo de 12B de La Salle Margarita.pdf
Editorial. Grupo de 12B de La Salle Margarita.pdf
 
AVANCES TECNOLOGICOS DEL SIGLO XXI. 10-08..pptx
AVANCES TECNOLOGICOS  DEL SIGLO XXI. 10-08..pptxAVANCES TECNOLOGICOS  DEL SIGLO XXI. 10-08..pptx
AVANCES TECNOLOGICOS DEL SIGLO XXI. 10-08..pptx
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
2023 07 Casos prácticos para Realidad aumentada, metaverso y realidad extendida
2023 07 Casos prácticos para Realidad aumentada, metaverso y realidad extendida2023 07 Casos prácticos para Realidad aumentada, metaverso y realidad extendida
2023 07 Casos prácticos para Realidad aumentada, metaverso y realidad extendida
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 
Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptx
 

Clasificación Jerárquica de Objetos en Imágenes

  • 1. Pontificia Universidad Católica de Chile Departamento de Ciencias de la Computación CLASIFICACIÓN JERÁRQUICA DE IMÁGENES Iván Lillo Vallés Profesores supervisores: Domingo Mery – Álvaro Soto Viernes 28 de septiembre de 2012 1
  • 2. Contenido  Motivación  Enfoques  Propuesta  Resultados preliminares  Trabajo futuro  Conclusiones 2
  • 3. ¿Para qué detectar objetos en imágenes? Interacción Inspección Vigilancia Navegación Diversión 3
  • 6. ¿Para qué detectar objetos en imágenes? http://techtalks.tv/talks/self-driving-cars/56391/ © Google 6
  • 7. Contenido  Motivación  Enfoques  Propuesta  Resultados preliminares  Trabajo futuro  Conclusiones 7
  • 8. Aprendizaje de máquina (Machine Learning) Algoritmo de aprendizaje BD • Sesgo – conocimiento previo Tarea entrenamiento • Espacio de hipótesis • Esquema de búsqueda Evaluación 8
  • 9. Aprendizaje de máquina (Machine Learning) Algoritmo de aprendizaje • Sesgo – conocimiento previo • Espacio de hipótesis • Esquema de búsqueda Sesgo Esquema de búsqueda Espacio de hipótesis • Descripción • Optimización • Cómo uso los datos • Esquema • Exhaustiva • Esquema de clasificador • Relaciones • Greedy 9
  • 10. Aprendizaje de máquina (Machine Learning) Sesgo Detección de personas • Descripción • Esquema HoG denso, con traslape (holístico) • Relaciones Dalal & Triggs, CVPR 2005 10
  • 11. Aprendizaje de máquina (Machine Learning) Sesgo Detección de personas • Descripción • Esquema Partes con patrones repetitivos: Poselets • Relaciones Bourdev et al, ECCV 2009 11
  • 12. Aprendizaje de máquina (Machine Learning) Sesgo Detección de objetos • Descripción • Esquema Información característica: objeto + pocas • Relaciones partes : Object detector de Felzenszwalb Felzenszwalb et al, 2010 12
  • 13. Aprendizaje de máquina (Machine Learning) Sesgo Clasificación de escenas • Descripción Información característica: pequeñas partes • Esquema (patrones) repetitivos en las imágenes • Relaciones (diccionario visual) 13
  • 14. Aprendizaje de máquina (Machine Learning) Sesgo Clasificación de escenas • Descripción Información característica: pequeñas partes • Esquema (patrones) repetitivos en las imágenes • Relaciones (diccionario visual) 14
  • 15. Aprendizaje de máquina (Machine Learning) Espacio de hipótesis • Cómo uso los datos MODELO • Esquema de clasificador Lineales No lineales Árboles Redes neuronales FUNCIÓN X Y 15
  • 16. Aprendizaje de máquina (Machine Learning) Algoritmo de aprendizaje BD • Sesgo – conocimiento previo Tarea entrenamiento • Espacio de hipótesis • Esquema de búsqueda Evaluación 16
  • 17. Contenido  Motivación  Enfoques  Propuesta  Resultados preliminares  Trabajo futuro  Conclusiones 17
  • 19. PROBLEMAS Modelos de partes Anotaciones (poselets) Sesgo (object detector Felzenszwalb) Disjunción partes/clasificación 19
  • 20. ¿Es posible encontrar partes sin supervisión y que sean discriminativas? Sin anotaciones Útiles para clasificar Sin sesgo que limite la búsqueda Aprendizaje conjunto 20
  • 21. Aprendizaje conjunto PARTES CLASIFICADORES CONSIDERANDO LAS PARTES 21
  • 22. Aprendizaje conjunto PARTES CLASIFICADORES CONSIDERANDO LAS PARTES Regiones de imagen Clasificadores Puntaje (score) Multiescala lineales por cada región Formas 22
  • 23. Aprendizaje conjunto PARTES CLASIFICADORES CONSIDERANDO LAS PARTES Puntaje (score) Asignaciones de para la imagen cada región 23
  • 24. Imagen Regiones Vectores N regiones fi describe región i i = 1,…, N 24
  • 25. K partes K clasificadores lineales (vectores) w Región i  asignación zi 1,..., K  L categorías L clasificadores lineales (vectores)  Descriptor: histograma de asignaciones h( z ) Asignaciones unen partes y categorías 25
  • 26. Definición de energía (score) por imagen Score clasificador Score partes contenidas E° configuración = imagen + en imagen N E  x, y, z   αT h  z  y   z wTi fi i 1 Asignaciones Descriptor Imagen Histograma región i Clasificador asignaciones Clasificador Categoría categoría asignación zi 26
  • 27. N E  x, y, z   αT h  z  y   z wTi fi i 1 Tarea E° configuración E° configuración correcta > incorrecta E x j , y j , z j   E  x j , yi , zi  , i  j 27
  • 28. E x j , y j , z j   E  x j , yi , zi  , i  j Búsqueda de parámetros optimización L K M 1  α l  2  w k  3   j 2 2 min 2 2 l 1 k 1 j 1 sujeto a E  x j , y j , z j   E  x j , yi , zi   0  y j , yi , zi   j  i  j ,  j  0 28
  • 29. Datos de entrada M imágenes (xj ,yj), j = 1,…,M Nj parches por imagen Se busca l, l = 1,…,L wk, k = 1,…,K zj, j = 1,…,M 29
  • 30. Inferencia Dada imagen x, inferir categoría  N T  y , zi  arg max  yk   w k fi  * * k 1,..., K  i 1  y 1,..., L 30
  • 31. Estimación inicial w0 , z0 Estimación de parámetros Estimación |w, z Actualizo z| ,w Actualizo w| ,z N E  x, y, z   αT h  z    w Ti fi y z i 1 31
  • 32. Estimación de parámetros Estimación |w, z L M 1  α l  3   j 2 min 2 l 1 j 1 sujeto a E  x j , y j , z j   E  x j , yi , zi     y j , yi , zi   j i  j ,  j  0 32
  • 33. Estimación de parámetros Actualizo z| ,w N E  x, y, z   α h  z    w Ti fi T y z i 1  N T  zi  arg max  ys   w s fi  * s 1,..., K  i 1  33
  • 34. Estimación de parámetros Actualizo w| ,z K M 2  w k  3   j 2 min 2 k 1 j 1 sujeto a E  x j , y j , z j   E  x j , yi , zi     y j , yi , zi   j i  j ,  j  0 34
  • 35. Estimación inicial w0 , z0 Estimación de parámetros Estimación |w, z Actualizo z| ,w Actualizo w| ,z Parámetros estimados 35
  • 36. Contenido  Motivación  Enfoques  Propuesta  Resultados preliminares  Trabajo futuro  Conclusiones 36
  • 37. Caltech-4 (crops) 4 categorías K = 200 (partes) Esquema piramidal  consistencia espacial 50% datos entrenamiento / 50% prueba 99.93% rendimiento (1 error de 1500 imágenes) 37
  • 38. airplanes_side cars faces motorbikes_side 38
  • 39. airplanes_side cars faces motorbikes_side 39
  • 40. 40
  • 41. 41
  • 42. 15 scenes categories 15 categorías K = 750 (partes) Esquema piramidal  consistencia espacial 100 datos entrenamiento / resto prueba 78% rendimiento (81% estado del arte) 42
  • 43. bedroom suburb industrial kitcken livingroom coast forest highway inside_city mountain open_country street tallbuilding office store 43
  • 44. bedroom suburb industrial kitcken livingroom coast forest highway inside_city mountain open_country street tallbuilding office store 44
  • 45. Contenido  Motivación  Enfoques  Propuesta  Resultados preliminares  Trabajo futuro  Conclusiones 45
  • 46. Mejorar modelo Nivel intermedio jerarquía partes/objetos Planteamiento y resolución Partes variables, multiescala Nuevas pruebas y bases de datos Publicar 46
  • 47. Contenido  Motivación  Enfoques  Propuesta  Resultados preliminares  Trabajo futuro  Conclusiones 47
  • 48. Esquema jerárquico posee ventajas Aprender partes discriminativas Necesidad: mejores formulaciones y procedimientos Por mejorar: overfitting 48

Notas del editor

  1. Presentarse, dar gracias.
  2. Me voy a saltar todas las fuentes posibles de imágenes (fotografía, RX, NIR, ondas acusticas, etc).Resuelve problemas de:control de calidad (alimentos, autos, piezas mecánicas, IC)Vigilancianavegación robótica, o simplemente para mejorar procesos.Interacción humano-computadorDiversión El tema de visión por computador es uno de los más interesantes. Sabemos que tiene solución (vision humana), pero hasta ahora no sabemos el “cómo”.
  3. Aplicaciones exitosas a lo largo de la historiaHuella digital, sigue siendo el estándar de IDCódigos QR, cada vez más usados, realidad extendidaTAG, para los que tienen autoKinect, ¿Diversión? una buena parte de orales CVPR 2012 son aplicaciones con KinectEn general son bien estructuradas, con un buen entrenamiento es posible tener muy buenos rendimientos.
  4. Otras aplicaciones menos estructuradas basados en aprendizaje de máquina. Cambia el paradigma: de la predicción a la inferencia.Con muchas imágenes de entrenamiento, la idea es que un algoritmo aprenda cuál es y cómo usar la información relevante de las imágenes, para detección y clasificación. Los ejemplos muestran algoritmos “exitosos” como el detector de objetos de Felzenszwalb y Viola & Jones.
  5. Algoritmo de aprendizaje como funcion
  6. Modelo será la función escondida en los datos que queremos conocer.Algoritmo de aprendizaje como funcion
  7. Enfatizar tarea y Evaluación, redondear la idea del aprendizaje de máquina.
  8. Hay ejemplos de estructurado y no estructurado (store o tienda)
  9. - Anotaciones son un problema -> bases de datos no anotadas son mucho másquelasanotadas, HH.Sesgo en object detector estarelacionado a que son pocaspartes y todasaparecen en la imagen (según un score) y un modelo de distancias entre laspartes (estrella). En general descrubrirpartes no tienerelación con el clasificador. Puedoencontrarmuybuenaspartespero son irrelevantespararealizar la clasificación.Partes son fijaspara el clasificador, vienenyaentrenadas (en general, exceptopara object detector).
  10. Énfasis en jerarquías