SlideShare una empresa de Scribd logo
1 de 34
Descargar para leer sin conexión
20391: Visió per Computador
                                                    Apunts de l’assignatura




                      Classe 9
               Reconeixement
                d’Objectes (I)


Jordi Vitrià     20391: Visió per Computador                 1
20391: Visió per Computador
                                                  Apunts de l’assignatura




Jordi Vitrià   20391: Visió per Computador                 2
20391: Visió per Computador
                                                  Apunts de l’assignatura




Jordi Vitrià   20391: Visió per Computador                 3
20391: Visió per Computador
                                                                                       Apunts de l’assignatura

                            Quin és el problema?


  Problema: Equivalència entre estímuls.




1 objecte ↔ ∞ imatges
Causes: escala, orientació, etc.                                 Cal trobar característiques
                                                                 invariants!



Jordi Vitrià                       20391: Visió per Computador                                  4
20391: Visió per Computador
                                                         Apunts de l’assignatura

                 Quin és el problema?


  Problema: Equivalència entre estímuls
  (il·luminació).




Jordi Vitrià          20391: Visió per Computador                 5
20391: Visió per Computador
                                                         Apunts de l’assignatura

                 Quin és el problema?


  Problema: Equivalència entre estímuls
  (il·luminació).




Jordi Vitrià          20391: Visió per Computador                 6
20391: Visió per Computador
                                                               Apunts de l’assignatura

                       Quin és el problema?


  Problema: Equivalència entre estímuls.

           En alguns casos podem trobar mecanismes
           simples de reconeixement associats a
           característiques més o menys simples de les
           imatges i que constitueixen senyals no ambigus
           de la presència de l’objecte.

           Però en la majoria dels casos no hi ha una altre
           camí que l’aprenentatge de descripcions
           complexes.



Jordi Vitrià                20391: Visió per Computador                 7
20391: Visió per Computador
                                                                    Apunts de l’assignatura

                 Quin és el problema?


  Problema: Equivalència entre estímuls.


                  “The Cubist are destined... To give back
                  to painting its true aim, which is to
                  reproduce... objects as they are.
                  Lighting must be eliminated because ... it
                  is the sign of a particular instant... As
                  well, perspective must be eliminated
                  because ... it is accidental a think like
                  lighting”

                               J.Rivière. Present tendencies in painting.
                           Revue d’Europe et Amérique, Paris, March 1912.




Jordi Vitrià          20391: Visió per Computador                            8
20391: Visió per Computador
                                                          Apunts de l’assignatura

                  Quin és el problema?


  Diferència entre classificar i identificar.




Jordi Vitrià           20391: Visió per Computador                 9
20391: Visió per Computador
                                                                     Apunts de l’assignatura

                      Quin és el problema?

           Perquè és útil el reconeixement de classes?

  Reconeixement de nous objectes dins d’una classe:
  • Podem inferir les propietats (usos, perills, …) de coses que no
  hem vist mai! (Imaginem el primer europeu que va veure un
  tigre!);
  • Restringeix el nombre de models per identificar (indexació);
  • Permet l'ús d’informació específica de la classe per identificar
  (p.e. neutralitzar expressions facials);
  • Fa possible la generalització des d’informació molt parcial
  (p.e. La Mona Lisa!).




Jordi Vitrià                20391: Visió per Computador                     10
20391: Visió per Computador
                                                          Apunts de l’assignatura

                  Quin és el problema?


  (Alguns) Mètodes:

  Classificació de les característiques de la imatge.

  Ajust de Models geomètrics a la imatge.

  Aparença o reconeixement basat en vistes.




Jordi Vitrià           20391: Visió per Computador               11
20391: Visió per Computador
                                                                                 Apunts de l’assignatura
                                     Mètodes

  Classificació de les característiques de la
  imatge.
  Objectiu: Definir un espai de característiques de la
  imatge que permeti representar els objectes a partir
  del seu aspecte (o d’un conjunt de característiques
  locals) en la imatge.
  Hi ha 3 parts:

           • Definició d’una representació adequada. Normalment
           intentarem reduir la dimensió de les dades de forma que es
           conservin les invariancies i s’eliminin les altres dimensions.

           • Aprenentatge, a partir d’un conjunt d’exemples.

           • Reconeixement, a partir del model après.
Jordi Vitrià                       20391: Visió per Computador                          12
20391: Visió per Computador
                                                          Apunts de l’assignatura
                         Mètodes

  Classificació de les característiques de la imatge.




Jordi Vitrià           20391: Visió per Computador               13
20391: Visió per Computador
                                                                 Apunts de l’assignatura
                                Mètodes

  Classificació de les característiques de la imatge.




  Classificació entre túbul i interstici en una biòpsia
  renal a partir de característiques texturals.



Jordi Vitrià                  20391: Visió per Computador               14
20391: Visió per Computador
                                                                     Apunts de l’assignatura
                                 Mètodes


  Classificació de les característiques de la imatge.

  Usarem com a operacions bàsiques la dilatació (∂ B (k ))
  i erosió (ε B (k )) morfològiques
  amb elements estructurants que són cercles de radi k:
                                     B(k )

  La seva combinació crea una nova operació:
  l’apertura.

                      I o B(k ) = δ B ( k ) (ε B ( k ) ( I ))



Jordi Vitrià                   20391: Visió per Computador                  15
20391: Visió per Computador
                                                                 Apunts de l’assignatura
                                Mètodes

  Classificació de les característiques de la imatge.
  Efecte de l’apertura en una imatge:




Jordi Vitrià                  20391: Visió per Computador               16
20391: Visió per Computador
                                                                                                    Apunts de l’assignatura
                                                            Mètodes


  Classificació de les característiques de la imatge.


  Llavors definim per a cada punt (x,y) de la imatge el
  següent vector:
                    G ( x, y ) =                         {vol ( I o B(1)) − vol ( I o B(2)),K,
                                                         vol ( I o B( n − 1)) − vol ( I o B( n ))}
  On           vol ( I ( x, y )) =        ∑ I ( x '− x, y '− y )
                                     ( x , y )∈B ( n )


  Aquest vector, que anomenem GRANULOMETRIA (o
  la seva derivada!) representa el comportament de
  l’entorn de cada punt respecte a l’operació apertura, i
  és un bón descripció de textura!

Jordi Vitrià                                              20391: Visió per Computador                      17
20391: Visió per Computador
                                                                 Apunts de l’assignatura
                                Mètodes

  Classificació de les característiques de la imatge.




Jordi Vitrià                  20391: Visió per Computador               18
20391: Visió per Computador
                                                                 Apunts de l’assignatura
                                Mètodes
  Classificació de les característiques de la imatge.
  Resultat de classificar la granulometria de cada punt
  amb una xarxa neural.




Jordi Vitrià                  20391: Visió per Computador               19
20391: Visió per Computador
                                                                      Apunts de l’assignatura
                              Mètodes

  Classificació de les característiques de la imatge: SEEMORE.




Jordi Vitrià                20391: Visió per Computador                      20
20391: Visió per Computador
                                                                    Apunts de l’assignatura
                              Mètodes

Classificació de les característiques de la imatge: SEEMORE.




Jordi Vitrià                20391: Visió per Computador                    21
20391: Visió per Computador
                                                                      Apunts de l’assignatura
                              Mètodes

  Classificació de les característiques de la imatge: SEEMORE.




Jordi Vitrià                20391: Visió per Computador                      22
20391: Visió per Computador
                                                          Apunts de l’assignatura
                         Mètodes


  Ajust de Models Rígids.

  Disposem d’una mostra de
  l’objecte, en forma de de
  corba o de model de “filferro”
  + les transformacions que són
  admissibles.




Jordi Vitrià           20391: Visió per Computador               23
20391: Visió per Computador
                                                               Apunts de l’assignatura
                              Mètodes

  Ajust de Models Rígids.

  Correspondència: Donada una imatge, hi ha molts
  llocs i moltes maneres per a provar de fer
  correspondre l’objecte!

  Representació: Com representem internament els
  objectes per a que el procés de correspondència sigui
  eficient? Un model per a tot? Un model per a cada
  vista?...

  Semblança: Com decideixo que he trobat una
  correspondència?


Jordi Vitrià                20391: Visió per Computador               24
20391: Visió per Computador
                                                               Apunts de l’assignatura
                              Mètodes


  Ajust de Models Rígids: Reconeixement per
  alineació.

  Es basa en buscar la correspondència entre una vista
  2D d’un objecte rígid i un model 3D. L’objecte vist pot
  tenir una posició 3D, orientació i escala arbitràries, i
  pot estar semiocult.

  Dividim el problema en dos parts:
           • Aliniació
           • Transformació i comparació.



Jordi Vitrià                20391: Visió per Computador               25
20391: Visió per Computador
                                                                  Apunts de l’assignatura
                                Mètodes

  Ajust de Models Rígids: Reconeixement per alineació.

  Alineació del model amb la imatge a partir d’un
  conjunt reduït de punts del model i de la imatge.

  Si assumim que l’objecte es pot representar bé amb
  una “projecció ortogonal+escala”, llavors es pot
  demostrar que:

           “..donats tres punts del model sobre un pla
           paral·lel al pla imatge i tres punts a la imatge, hi
           ha una única transformació que posa en
           correspondència els punts del model i els de la
           imatge”.

Jordi Vitrià                  20391: Visió per Computador                26
20391: Visió per Computador
                                                                             Apunts de l’assignatura
                             Mètodes

    Ajust de Models Rígids: Reconeixement per alineació.




Imatge model i punts   Punts característics              Resultats amb un
característics         detectats en una                  nivell de semblança
                       escena.                           suficient.
                       Hi ha forces
                       correspondències
                       possibles!



Jordi Vitrià               20391: Visió per Computador                              27
20391: Visió per Computador
                                                              Apunts de l’assignatura
                           Mètodes

  Ajust de Models Rígids: Reconeixement per alineació.




Jordi Vitrià             20391: Visió per Computador                 28
20391: Visió per Computador
                                                                 Apunts de l’assignatura
                            Mètodes

  Ajust de Models Rígids: Reconeixement per alineació.

  Però, com comparem?
  Hi ha diverses solucions: funció distància entre
  característiques binàries.

                 A cada punt de la imatge li assignem un valor
                 equivalent a la distància que hi ha entre aquest
                 punt i la característica més propera.

                 Quan projectem les característiques del model,
                 sumem els valors de la funció distància del píxels
                 sobre els que han caigut les característiques. Com
                 menor sigui el valor, més correspondència!


Jordi Vitrià              20391: Visió per Computador                   29
20391: Visió per Computador
                                                                        Apunts de l’assignatura
                     Mètodes


  Un cas interessant: detecció de cares.
                                                  Processament de cares:

                                                  Detection i tracking

                                                       Alineament i
                                                      normalització.


                                                 Representació i modelat
                                                      d’identitats.




Jordi Vitrià       20391: Visió per Computador                                 30
20391: Visió per Computador
                                                                                                                                      Apunts de l’assignatura
                                                                                 Mètodes
Un cas interessant: detecció de cares.
                                cares




                                         La imatge es divideix en un gran conjunt de                         Calculem mesures locals
                                         finestres (solapades). Cada finestra és classificada
                                                                                                                    a la imatge
                                         com a “cara” o “no cara”, basant-se en un conjunt
                                         de mesures locals.


                                                                                                                 Classificador
                                                                                                                 Cara/No cara




                                         Jordi Vitrià                          20391: Visió per Computador                                   31
20391: Visió per Computador
                                                                                                                  Apunts de l’assignatura
                                                                                 Mètodes

Un cas interessant: detecció de cares.
                                cares
                                         Partim d’un GRAN conjunt d’exemples
                                         i contraexemples.




Jordi Vitrià                                                                   20391: Visió per Computador               32
20391: Visió per Computador
                                                                                       Apunts de l’assignatura
                               Mètodes

  Un cas interessant: detecció de cares.

  Estratègia:


                           Preprocessament &
                          Normalització de mida


                                                                         Canonical Face Pattern
                                                                         Model

    Finestra analitzada
                                                                Comparació

                              Finestra normalitzada



                                                           Classificador Cara/No Cara



Jordi Vitrià                 20391: Visió per Computador                                      33
20391: Visió per Computador
                                                             Apunts de l’assignatura
                            Mètodes

  Un cas interessant: detecció de cares.




Jordi Vitrià              20391: Visió per Computador               34

Más contenido relacionado

Más de Universitat de Barcelona

Más de Universitat de Barcelona (6)

Els informàtics o val la pena estudiar informàtica?
Els informàtics o val la pena estudiar informàtica?Els informàtics o val la pena estudiar informàtica?
Els informàtics o val la pena estudiar informàtica?
 
Pc Seminar Jordi
Pc Seminar JordiPc Seminar Jordi
Pc Seminar Jordi
 
Classe 8 Visió
Classe 8 VisióClasse 8 Visió
Classe 8 Visió
 
The Last Frontier
The Last FrontierThe Last Frontier
The Last Frontier
 
Bits, àtoms i màquines virtuals
Bits, àtoms i màquines virtualsBits, àtoms i màquines virtuals
Bits, àtoms i màquines virtuals
 
Computación y señales sociales
Computación y señales socialesComputación y señales sociales
Computación y señales sociales
 

Classe 9 Visió

  • 1. 20391: Visió per Computador Apunts de l’assignatura Classe 9 Reconeixement d’Objectes (I) Jordi Vitrià 20391: Visió per Computador 1
  • 2. 20391: Visió per Computador Apunts de l’assignatura Jordi Vitrià 20391: Visió per Computador 2
  • 3. 20391: Visió per Computador Apunts de l’assignatura Jordi Vitrià 20391: Visió per Computador 3
  • 4. 20391: Visió per Computador Apunts de l’assignatura Quin és el problema? Problema: Equivalència entre estímuls. 1 objecte ↔ ∞ imatges Causes: escala, orientació, etc. Cal trobar característiques invariants! Jordi Vitrià 20391: Visió per Computador 4
  • 5. 20391: Visió per Computador Apunts de l’assignatura Quin és el problema? Problema: Equivalència entre estímuls (il·luminació). Jordi Vitrià 20391: Visió per Computador 5
  • 6. 20391: Visió per Computador Apunts de l’assignatura Quin és el problema? Problema: Equivalència entre estímuls (il·luminació). Jordi Vitrià 20391: Visió per Computador 6
  • 7. 20391: Visió per Computador Apunts de l’assignatura Quin és el problema? Problema: Equivalència entre estímuls. En alguns casos podem trobar mecanismes simples de reconeixement associats a característiques més o menys simples de les imatges i que constitueixen senyals no ambigus de la presència de l’objecte. Però en la majoria dels casos no hi ha una altre camí que l’aprenentatge de descripcions complexes. Jordi Vitrià 20391: Visió per Computador 7
  • 8. 20391: Visió per Computador Apunts de l’assignatura Quin és el problema? Problema: Equivalència entre estímuls. “The Cubist are destined... To give back to painting its true aim, which is to reproduce... objects as they are. Lighting must be eliminated because ... it is the sign of a particular instant... As well, perspective must be eliminated because ... it is accidental a think like lighting” J.Rivière. Present tendencies in painting. Revue d’Europe et Amérique, Paris, March 1912. Jordi Vitrià 20391: Visió per Computador 8
  • 9. 20391: Visió per Computador Apunts de l’assignatura Quin és el problema? Diferència entre classificar i identificar. Jordi Vitrià 20391: Visió per Computador 9
  • 10. 20391: Visió per Computador Apunts de l’assignatura Quin és el problema? Perquè és útil el reconeixement de classes? Reconeixement de nous objectes dins d’una classe: • Podem inferir les propietats (usos, perills, …) de coses que no hem vist mai! (Imaginem el primer europeu que va veure un tigre!); • Restringeix el nombre de models per identificar (indexació); • Permet l'ús d’informació específica de la classe per identificar (p.e. neutralitzar expressions facials); • Fa possible la generalització des d’informació molt parcial (p.e. La Mona Lisa!). Jordi Vitrià 20391: Visió per Computador 10
  • 11. 20391: Visió per Computador Apunts de l’assignatura Quin és el problema? (Alguns) Mètodes: Classificació de les característiques de la imatge. Ajust de Models geomètrics a la imatge. Aparença o reconeixement basat en vistes. Jordi Vitrià 20391: Visió per Computador 11
  • 12. 20391: Visió per Computador Apunts de l’assignatura Mètodes Classificació de les característiques de la imatge. Objectiu: Definir un espai de característiques de la imatge que permeti representar els objectes a partir del seu aspecte (o d’un conjunt de característiques locals) en la imatge. Hi ha 3 parts: • Definició d’una representació adequada. Normalment intentarem reduir la dimensió de les dades de forma que es conservin les invariancies i s’eliminin les altres dimensions. • Aprenentatge, a partir d’un conjunt d’exemples. • Reconeixement, a partir del model après. Jordi Vitrià 20391: Visió per Computador 12
  • 13. 20391: Visió per Computador Apunts de l’assignatura Mètodes Classificació de les característiques de la imatge. Jordi Vitrià 20391: Visió per Computador 13
  • 14. 20391: Visió per Computador Apunts de l’assignatura Mètodes Classificació de les característiques de la imatge. Classificació entre túbul i interstici en una biòpsia renal a partir de característiques texturals. Jordi Vitrià 20391: Visió per Computador 14
  • 15. 20391: Visió per Computador Apunts de l’assignatura Mètodes Classificació de les característiques de la imatge. Usarem com a operacions bàsiques la dilatació (∂ B (k )) i erosió (ε B (k )) morfològiques amb elements estructurants que són cercles de radi k: B(k ) La seva combinació crea una nova operació: l’apertura. I o B(k ) = δ B ( k ) (ε B ( k ) ( I )) Jordi Vitrià 20391: Visió per Computador 15
  • 16. 20391: Visió per Computador Apunts de l’assignatura Mètodes Classificació de les característiques de la imatge. Efecte de l’apertura en una imatge: Jordi Vitrià 20391: Visió per Computador 16
  • 17. 20391: Visió per Computador Apunts de l’assignatura Mètodes Classificació de les característiques de la imatge. Llavors definim per a cada punt (x,y) de la imatge el següent vector: G ( x, y ) = {vol ( I o B(1)) − vol ( I o B(2)),K, vol ( I o B( n − 1)) − vol ( I o B( n ))} On vol ( I ( x, y )) = ∑ I ( x '− x, y '− y ) ( x , y )∈B ( n ) Aquest vector, que anomenem GRANULOMETRIA (o la seva derivada!) representa el comportament de l’entorn de cada punt respecte a l’operació apertura, i és un bón descripció de textura! Jordi Vitrià 20391: Visió per Computador 17
  • 18. 20391: Visió per Computador Apunts de l’assignatura Mètodes Classificació de les característiques de la imatge. Jordi Vitrià 20391: Visió per Computador 18
  • 19. 20391: Visió per Computador Apunts de l’assignatura Mètodes Classificació de les característiques de la imatge. Resultat de classificar la granulometria de cada punt amb una xarxa neural. Jordi Vitrià 20391: Visió per Computador 19
  • 20. 20391: Visió per Computador Apunts de l’assignatura Mètodes Classificació de les característiques de la imatge: SEEMORE. Jordi Vitrià 20391: Visió per Computador 20
  • 21. 20391: Visió per Computador Apunts de l’assignatura Mètodes Classificació de les característiques de la imatge: SEEMORE. Jordi Vitrià 20391: Visió per Computador 21
  • 22. 20391: Visió per Computador Apunts de l’assignatura Mètodes Classificació de les característiques de la imatge: SEEMORE. Jordi Vitrià 20391: Visió per Computador 22
  • 23. 20391: Visió per Computador Apunts de l’assignatura Mètodes Ajust de Models Rígids. Disposem d’una mostra de l’objecte, en forma de de corba o de model de “filferro” + les transformacions que són admissibles. Jordi Vitrià 20391: Visió per Computador 23
  • 24. 20391: Visió per Computador Apunts de l’assignatura Mètodes Ajust de Models Rígids. Correspondència: Donada una imatge, hi ha molts llocs i moltes maneres per a provar de fer correspondre l’objecte! Representació: Com representem internament els objectes per a que el procés de correspondència sigui eficient? Un model per a tot? Un model per a cada vista?... Semblança: Com decideixo que he trobat una correspondència? Jordi Vitrià 20391: Visió per Computador 24
  • 25. 20391: Visió per Computador Apunts de l’assignatura Mètodes Ajust de Models Rígids: Reconeixement per alineació. Es basa en buscar la correspondència entre una vista 2D d’un objecte rígid i un model 3D. L’objecte vist pot tenir una posició 3D, orientació i escala arbitràries, i pot estar semiocult. Dividim el problema en dos parts: • Aliniació • Transformació i comparació. Jordi Vitrià 20391: Visió per Computador 25
  • 26. 20391: Visió per Computador Apunts de l’assignatura Mètodes Ajust de Models Rígids: Reconeixement per alineació. Alineació del model amb la imatge a partir d’un conjunt reduït de punts del model i de la imatge. Si assumim que l’objecte es pot representar bé amb una “projecció ortogonal+escala”, llavors es pot demostrar que: “..donats tres punts del model sobre un pla paral·lel al pla imatge i tres punts a la imatge, hi ha una única transformació que posa en correspondència els punts del model i els de la imatge”. Jordi Vitrià 20391: Visió per Computador 26
  • 27. 20391: Visió per Computador Apunts de l’assignatura Mètodes Ajust de Models Rígids: Reconeixement per alineació. Imatge model i punts Punts característics Resultats amb un característics detectats en una nivell de semblança escena. suficient. Hi ha forces correspondències possibles! Jordi Vitrià 20391: Visió per Computador 27
  • 28. 20391: Visió per Computador Apunts de l’assignatura Mètodes Ajust de Models Rígids: Reconeixement per alineació. Jordi Vitrià 20391: Visió per Computador 28
  • 29. 20391: Visió per Computador Apunts de l’assignatura Mètodes Ajust de Models Rígids: Reconeixement per alineació. Però, com comparem? Hi ha diverses solucions: funció distància entre característiques binàries. A cada punt de la imatge li assignem un valor equivalent a la distància que hi ha entre aquest punt i la característica més propera. Quan projectem les característiques del model, sumem els valors de la funció distància del píxels sobre els que han caigut les característiques. Com menor sigui el valor, més correspondència! Jordi Vitrià 20391: Visió per Computador 29
  • 30. 20391: Visió per Computador Apunts de l’assignatura Mètodes Un cas interessant: detecció de cares. Processament de cares: Detection i tracking Alineament i normalització. Representació i modelat d’identitats. Jordi Vitrià 20391: Visió per Computador 30
  • 31. 20391: Visió per Computador Apunts de l’assignatura Mètodes Un cas interessant: detecció de cares. cares La imatge es divideix en un gran conjunt de Calculem mesures locals finestres (solapades). Cada finestra és classificada a la imatge com a “cara” o “no cara”, basant-se en un conjunt de mesures locals. Classificador Cara/No cara Jordi Vitrià 20391: Visió per Computador 31
  • 32. 20391: Visió per Computador Apunts de l’assignatura Mètodes Un cas interessant: detecció de cares. cares Partim d’un GRAN conjunt d’exemples i contraexemples. Jordi Vitrià 20391: Visió per Computador 32
  • 33. 20391: Visió per Computador Apunts de l’assignatura Mètodes Un cas interessant: detecció de cares. Estratègia: Preprocessament & Normalització de mida Canonical Face Pattern Model Finestra analitzada Comparació Finestra normalitzada Classificador Cara/No Cara Jordi Vitrià 20391: Visió per Computador 33
  • 34. 20391: Visió per Computador Apunts de l’assignatura Mètodes Un cas interessant: detecció de cares. Jordi Vitrià 20391: Visió per Computador 34