SlideShare una empresa de Scribd logo
1 de 77
Descargar para leer sin conexión
´
         RECONSTRUCCION VISUAL 3-D : UNA
            PERSPECTIVA DEL SISTEMA




                     Guillermo Enrique Medina Zegarra



                           Orientador : Dr. Edgar Lobaton 1
                         Co-Orientador : Dr. Nestor Calvo 2




                                  Tesis profesional presentada al Programa Profesional de
                                  Ingenier´a Inform´tica (Ciencias de la Computaci´n)
                                           ı         a                                 o
                                  como parte de los requisitos para obtener el T´tulo Pro-
                                                                                ı
                                  fesional en Ingenier´a Inform´tica.
                                                       ı        a




                      Universidad Cat´lica San Pablo (UCSP)
                                     o
                                 Arequipa - Per´u
                                   Mayo de 2012

1
    http://www.ece.ncsu.edu/people/ejlobato
2
    https://plus.google.com/102163044101441746442/about
Dedico la presente tesis a Dios, sobre
todas las cosas, a mis padres y a mi ma-
m´ Beatriz.
  a
Abreviaturas

2D     Dos Dimensiones
3D     Tres Dimensiones
CG     Corte de Grafos
CNC    Correlaci´n Normalizada Cruzada
                 o
IMPA   Instituto de Matem´tica Pura y Aplicada
                         a
NCC    Normalized Cross-Correlation
PD     Programaci´n Din´mica
                   o    a
SDC    Suma de las Diferencias al Cuadrado
SVA    Suma de los Valores Absolutos
TLD    Transformaci´n Lineal Directa
                     o




                                      3
Agradecimientos



Agradezco a Dios, a la Virgen Mar´ y a mi mam´ Beatriz por cuidarme y guiarme a lo
                                 ıa          a
largo de mi vida!

Agradezco a mis padres por haberme dado la oportunidad de estudiar en la mejor uni-
versidad del pa´ Ellos siempre estuvier´n conmigo en los momentos m´s dif´
               ıs.                     o                           a     ıciles en mi
vida personal y profesional.

Agradezco a la universidad, por haber contribuido en mi formaci´n profesional y humana,
                                                               o
en la carrera que estar´ pr´ximo a culminar. Porque durante mi estad´ en la universi-
                       e o                                            ıa,
dad, ha permitido moldear en m´ un futuro profesional con una excelente formaci´n
                                 ı,                                                 o
integral .

Agradezco a la familia Barrios Neyra, por todo el tiempo que me prest´ su c´mara digital
                                                                        o  a
e instalaciones de su casa, para llevar a cabo la presente investigaci´n.
                                                                      o

Agradezco a las siguientes personas: Alex Cuadros, Alfredo Miranda, Alfredo Paz, Carlos
Leyton, Christian L´pez del Alamo, Cynthia Pinto, Edgar Lobat´n, Eduardo Tejada, Jes´s
                    o                                          o                      u
Mena, John Branch, Jos´ Corrales-Nieves, Juan Carlos Gutierrez, Julio Guevara, Lu´
                         e                                                             ıs
Pareja, Marcel Lazo de la Vega, Nestor Calvo, Olga Senyukova, Regina Ticona y Russell
Stimpson por sus sabios consejos, sugerencias y/o cr´
                                                    ıticas constructivas. Los enumer´ en
                                                                                    e
orden alfab´tico seg´n el primer nombre.
           e        u

Agradezco a mi jurado: Ana Cuadros, Ernesto Cuadros y Raquel Pati˜o por su paciencia
                                                                      n
y comprensi´n en la edici´n del presente documento de tesis, sin su apoyo esto no hubiera
            o            o
sido posible.
Resumen




       El modelar una superficie 3D de un objeto a partir de sus dos im´genes
                                                                         a
 estereosc´picas tiene muchas aplicaciones, tales como: en el campo de los v´
          o                                                                 ıdeo
 juegos, en la industria del cine y en las simulaciones de vuelo. El proceso se
 basa en la recuperaci´n de la estructura 3D a partir de dos reproyecciones.
                       o
 Una ventaja de generar un modelo de superficie, es permitir la manipulaci´n   o
 de los datos en un espacio tridimensional (por ejemplo, girar el objeto o crear
 deformaciones del mismo) a fin de generar nuevos puntos de vista.

        Una arquitectura f´ısica simple fue dise˜ada y creada, para llegar a con-
                                                n
 seguir la reconstrucci´n de la superficie de un objeto en donde la secuencia de
                        o
 pasos fue la siguiente: calibraci´n de las c´maras a trav´s del m´todo de Zheng-
                                  o          a            e       e
 you Zhang, para obtener la matriz de mapeamiento; rectificaci´n de ambas
                                                                     o
 im´genes, (vistas laterales), para conseguir una alineaci´n de las mismas; ha-
    a                                                       o
 llar los puntos correspondientes con la correlaci´n normalizada cruzada (CNC)
                                                  o
 de ambas vistas laterales rectificadas; crear la nube de puntos a partir de la
 triangulaci´n (intersecci´n) de los puntos correspondientes hallados en las dos
             o             o
 im´genes rectificadas; crear la superficie de la nube de puntos a partir de la
    a
 triangulaci´n de Delaunay del mapa de disparidad procesado y, finalmente,
             o
 mapear la textura de la imagen derecha rectificada a la superficie creada de la
 triangulaci´n de Delaunay del mapa de disparidad procesado.
             o
Abstract




        Modeling a 3D surface of an object through two stereo images has many
  applications, such as: video games, movie flight simulation. The process is ba-
  sed on the recovery of 3D structure from two reprojection. One advantage of
  generating a surface model is to allow manipulation of data in three dimensio-
  nal space ( i.e., rotate the object or create distortions ) to generate new points
  of view.

        A simple physical architecture was designed and created to be able to get
  the reconstruction of the surface of an object where the sequence of steps was as
  follows: calibration of the cameras with the Zhengyou Zhang method to obtain
  the mapping matrix; rectification of both images (side views) to achieve an
  alignment of the same; find the points corresponding to the normalized cross-
  correlation (NCC) of the two side views rectified; creating a cloud of points
  through the triangulation (intersection) of the corresponding points found in
  the two rectified images; create the surface of the cloud of points from the
  Delaunay triangulation of the disparity map processed and finally mapping of
  the texture of the rectified right image to the surface created from the Delaunay
  triangulation of the processed disparity map.
´
Indice general


1. Introducci´n
             o                                                                             14

   1.1. Motivaci´n y contexto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
                o

   1.2. Planteamiento del Problema . . . . . . . . . . . . . . . . . . . . . . . . . . 17

   1.3. Objetivo general    . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

   1.4. Objetivos espec´
                       ıficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

   1.5. Organizaci´n de la tesis
                  o                . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18


2. Trabajos relacionados                                                                   19

   2.1. Consideraciones Iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

   2.2. Paradigma est´reo computacional . . . . . . . . . . . . . . . . . . . . . . . 19
                     e

   2.3. Reconstrucci´n 3D de un modelo . . . . . . . . . . . . . . . . . . . . . . . 20
                    o

   2.4. Consideraciones Finales    . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21


3. Calibraci´n de las c´maras y an´lisis bifocal
            o          a          a                                                        22

   3.1. Consideraciones Iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

   3.2. Modelo de c´mara pinhole . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
                   a

   3.3. Calibraci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
                 o

        3.3.1. Par´metros intr´
                  a           ınsecos . . . . . . . . . . . . . . . . . . . . . . . . . 25

        3.3.2. Par´metros extr´
                  a           ınsecos . . . . . . . . . . . . . . . . . . . . . . . . . 25

        3.3.3. Distorsi´n del lente . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
                       o

   3.4. M´todos de calibraci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
         e                  o

                                             7
´
                                                                       INDICE GENERAL

        3.4.1. El m´todo de Heikkil¨ y Silv´n . . . . . . . . . . . . . . . . . . . . 27
                   e               a       e

        3.4.2. El m´todo de Zhengyou Zhang . . . . . . . . . . . . . . . . . . . . . 31
                   e

   3.5. Geometr´ epipolar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
               ıa

        3.5.1. Propiedades de la matriz fundamental F . . . . . . . . . . . . . . . 38

   3.6. Consideraciones Finales     . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38


4. Reconstrucci´n de una nube de puntos a partir de dos vistas
               o                                                                           39

   4.1. Consideraciones Iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

   4.2. El problema de correspondencia . . . . . . . . . . . . . . . . . . . . . . . . 39

   4.3. Tipos de restricciones de correspondecia . . . . . . . . . . . . . . . . . . . 40

   4.4. T´cnicas de correspondencia . . . . . . . . . . . . . . . . . . . . . . . . . . 40
         e

        4.4.1. Block matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

   4.5. Rectificaci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
                  o

   4.6. C´lculo de disparidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
         a

   4.7. Consideraciones Finales     . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46


5. Propuesta                                                                               47

   5.1. Consideraciones Iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

   5.2. Pipeline de la propuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

   5.3. Consideraciones Finales     . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49


6. Pruebas y resultados                                                                    50

   6.1. Componentes del sistema de visi´n est´reo . . . . . . . . . . . . . . . . . . 50
                                       o     e

        6.1.1. Arquitectura f´
                             ısica para dos c´maras digitales . . . . . . . . . . . . 51
                                             a

        6.1.2. Calibraci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
                        o

   6.2. Resultados con dos c´maras . . . . . . . . . . . . . . . . . . . . . . . . . . 53
                            a

   6.3. Limitaciones y problemas encontrados       . . . . . . . . . . . . . . . . . . . . 59

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                            8
´
INDICE GENERAL

7. Conclusiones y Trabajos Futuros                                                      61

   7.1. Recomendaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

   7.2. Trabajos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62


Ap´ndices
  e                                                                                     63


A. Caracter´
           ısticas t´cnicas de las dos c´maras digitales
                    e                   a                                               64


B. Posiciones del tablero de ajedrez                                                    67


C. Triangulaci´n de Delaunay en el plano 2D
              o                                                                         69




Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                         9
´
Indice de cuadros


 4.1. Medidas de semejanza en Block Matching . . . . . . . . . . . . . . . . . . . 41

 6.1. Par´metros usados para la reconstrucci´n de cada uno de los modelos. . . . 50
         a                                  o

 6.2. Ajustes t´cnicos en las dos c´maras digitales. . . . . . . . . . . . . . . . . . 51
               e                   a

 A.1. Cuadros comparativos de las caracter´    ıstica t´cnicas entre las dos c´maras
                                                       e                        a
      digitales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

 A.2. Caracter´
              ısticas de la imagen. . . . . . . . . . . . . . . . . . . . . . . . . . . 64

 A.3. Caracter´
              ısticas de la exposici´n. . . . . . . . . . . . . . . . . . . . . . . . . 65
                                    o

 A.4. Caracter´
              ısticas de la ´ptica. . . . . . . . . . . . . . . . . . . . . . . . . . . 65
                            o

 A.5. Caracter´
              ısticas del flash. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

 A.6. Caracter´
              ısticas del control del disparo. . . . . . . . . . . . . . . . . . . . . 65

 A.7. Caracter´
              ısticas de la visualizaci´n. . . . . . . . . . . . . . . . . . . . . . . . 66
                                       o

 A.8. Caracter´
              ısticas f´
                       ısicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66




                                           10
´
Indice de figuras


 1.1. Pintura pre-renacentista y renacentista. (a) Jes´s entrando a Jerusal´n y
                                                      u                        e
      (b) La Escuela de Atenas [Ma et al., 2004]. . . . . . . . . . . . . . . . . . . 14

 1.2. M´quina de perspectiva [Faugeras, 1993] . . . . . . . . . . . . . . . . . . . 15
       a

 1.3. (a) Dos vistas y (b) m´ltiples vistas [Hartley and Zisserman, 2004]. . . . . 15
                            u

 1.4. (a) Posici´n de una sola c´mara; (b) iluminaci´n artificial para la adquisi-
                o               a                   o
      ci´n de im´genes y (c) posici´n de m´ltiples c´maras [Zitnick et al., 2004].
        o        a                 o       u        a                                     16

 1.5. ¿C´mo hallar los puntos correspondientes? [Szeliski, 2011]. . . . . . . . . . 17
        o


 3.1. Modelo de c´mara pinhole frontal [Ma et al., 2004] . . . . . . . . . . . . . 23
                 a

 3.2. Modelo de c´mara pinhole [Ma et al., 2004] . . . . . . . . . . . . . . . . . . 24
                 a

 3.3. Proyecci´n de perspectiva de un cuadrado [Bakstein., 1999] . . . . . . . . . 26
              o

 3.4. Proyecci´n de perspectiva de un c´
              o                        ırculo [Heikkil¨ and Silv´n, 1997]
                                                      a         e                . . . . 29

 3.5. Analisis geom´trico de dos vistas [Ma et al., 2004] . . . . . . . . . . . . . . 36
                   e


 4.1. Las Figuras 4.1a y 4.1b de la primer fila son las im´genes originales del
                                                                 a
      sistema de visi´n est´reo; las Figuras 4.1c y 4.1d son las im´genes rectifi-
                       o     e                                           a
      cadas. Los c´ırculos de color rojo representan a los puntos correspondientes
      de ambos planos imagen y las l´     ıneas de color azul a las l´ ıneas epipolares
      [Fusiello et al., 2000]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

 4.2. (a) y (b) son el par de im´genes correspondientes de Tsukuba y (c) mapa de
                                 a
      disparidad de ambas im´genes correspondientes [Scharstein and Szeliski, 2002]. 45
                               a


 5.1. Pipeline de la propuesta de tesis. . . . . . . . . . . . . . . . . . . . . . . . 47


 6.1. (a) Distancias entre las dos c´maras digitales y (b) dos tornillos, cuatro
                                    a
      volandas y dos mariposas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

                                           11
´
                                                                    INDICE DE FIGURAS

   6.2. (a) Posici´n frontal de ambas c´maras digitales y (b) visor de las dos c´-
                  o                      a                                            a
        maras laterales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

   6.3. Dos posiciones del tablero de ajedrez. . . . . . . . . . . . . . . . . . . . . . 52

   6.4. (a) Selecci´n de las cuatro esquinas de la Figura 6.3a; (b) detecci´n de los
                   o                                                         o
        puntos internos de la Figura 6.3b. . . . . . . . . . . . . . . . . . . . . . . . 52

   6.5. (a) y (b) im´genes originales del par est´reo, (c) y (d) im´genes rectificadas,
                    a                            e                 a
        (e) y (f) im´genes pre-procesadas. . . . . . . . . . . . . . . . . . . . . . . . 53
                    a

   6.6. (a) Mapa de disparidad procesado, (b) nube de puntos, (c) enmallado tri-
        dimensional, (d) creaci´n de la superficie. . . . . . . . . . . . . . . . . . . . 54
                               o

   6.7. (a) Suavizamiento de la superficie, (b) texturizaci´n de la superficie, (c)
                                                            o
        vista de costado de la superficie texturizada. . . . . . . . . . . . . . . . . . 54

   6.8. (a) y (b) im´genes originales del par est´reo, (c) y (d) im´genes rectificadas,
                    a                            e                 a
        (e) y (f) im´genes pre-procesadas. . . . . . . . . . . . . . . . . . . . . . . . 55
                    a

   6.9. (a) Mapa de disparidad procesado, (b) nube de puntos, (c) enmallado tri-
        dimensional, (d) creaci´n de la superficie. . . . . . . . . . . . . . . . . . . . 56
                               o

   6.10. (a) Suavizamiento de la superficie, (b) texturizaci´n de la superficie, (c)
                                                             o
         vista de costado de la superficie texturizada. . . . . . . . . . . . . . . . . . 56

   6.11. (a) y (b) im´genes originales del par est´reo, (c) y (d) im´genes rectificadas,
                     a                            e                 a
         (e) y (f) im´genes pre-procesadas. . . . . . . . . . . . . . . . . . . . . . . . 57
                     a

   6.12. (a) Mapa de disparidad procesado, (b) nube de puntos, (c) enmallado tri-
         dimensional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

   6.13. (a) Vista del costado del rostro sin suavizar, (b) vista de frente del rostro
         sin suavizar, (c) vista del costado del rostro suavizado, (d) vista de frente
         del rostro suavizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

   6.14. (a) Reducci´n del ancho del rostro humano sin texturizar, (b) reducci´n
                      o                                                               o
         del ancho del rostro texturizado, (c) vista frontal del rostro sin texturizar
         y (d) vista frontal del rostro texturizaci´n. . . . . . . . . . . . . . . . . . . 59
                                                   o

   6.15. (a) Reconstrucci´n fallida del “cubo m´gico” y (b) fen´meno de “gradas”
                          o                      a              o
         en la reconstrucci´n de la superficie del modelo del “cubo m´gico”. . . . . . 59
                           o                                        a

   6.16. (a) y (b) Im´genes originales defectuosas, (c) mapa de disparidad err´neo
                     a                                                         o
         y (d) reconstrucci´n 3D amorfa del “cubo m´gico”. . . . . . . . . . . . . . . 60
                           o                          a


   B.1. Treinta posiciones de tablero de calibraci´n. . . . . . . . . . . . . . . . . . 67
                                                  o

   B.0. Treinta posiciones de tablero de calibraci´n (cont...) . . . . . . . . . . . . . 68
                                                  o

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                           12
´
INDICE DE FIGURAS

   C.1. Conjunto de puntos (v´rtices) de P . . . . . . . . . . . . . . . . . . . . . . . 69
                             e

   C.2. Ilustraci´n de la primera propiedad de Delaunay.
                 o                                            . . . . . . . . . . . . . . 70

   C.3. Ilustraci´n de la segunda propiedad de Delaunay. . . . . . . . . . . . . . . 70
                 o

   C.4. (a) Arista ilegal y (b) correcci´n de la arista ilegal. . . . . . . . . . . . . . 71
                                        o




Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                         13
Cap´
   ıtulo 1

Introducci´n
          o

1.1.     Motivaci´n y contexto
                 o

      En el mundo de las Bellas Artes (Arquitectura, Pintura, Escultura y M´sica) hasta
                                                                            u
la ´poca del Renacimiento (Siglo XVI), los artistas no pod´ dibujar en un cuadro la
   e                                                        ıan
profundidad de una escena, porque no hab´ los m´todos necesarios para lograrlo, al no
                                            ıan     e
existir las t´cnicas para conseguir la tridimensionalidad de una escena en una pintura.
             e
Filippo Brunelleschi, Piero della Francesca, Leonardo da Vinci [DaVinci, 2005] y Albert
Durer, llevaron a cabo investigaciones sobre c´mo la visi´n del ojo humano observaba a
                                                o        o
un objeto. Dando origen a los puntos de fuga y a la m´quina de perspectiva [Mery, 2004].
                                                      a

      En la Figura 1.1a se puede ver una pintura pre-renacentista sin un efecto 3D y en
la Figura 1.1b se observa que las l´
                                   ıneas de color celeste convergen en un punto de fuga,
lo cual hace que la pintura tenga profundidad. Los puntos de fuga son rayos imaginarios
que llegan a converger en un solo punto.




                      (a)                              (b)


Figura 1.1: Pintura pre-renacentista y renacentista. (a) Jes´s entrando a Jerusal´n y (b)
                                                            u                    e
La Escuela de Atenas [Ma et al., 2004].

                                           14
CAP´
   ITULO 1. Introducci´n
                      o

      En la Figura 1.2, se puede observar la m´quina de perspectiva, en donde, se visualiza
                                              a
con claridad un punto fijo (punto de fuga), que corresponde a los ojos del artista, en el
cual, convergen todos los rayos (l´
                                  ıneas de color rojo) del objeto. Tambi´n se puede ver un
                                                                        e
plano que sirve de ayuda al dibujante, para hallar la relaci´n con el objeto.
                                                             o




                  Figura 1.2: M´quina de perspectiva [Faugeras, 1993]
                               a

      Una de las funciones del cerebro humano es crear un escenario en 3D con la infor-
maci´n que percibe de ambos ojos. Llevar a cabo dicho proceso se conoce como visi´n
     o                                                                                  o
estereosc´pica [Forsyth and J., 2002] y el area cient´
         o                                 ´         ıfica encargada, se conoce como visi´n
                                                                                        o
computacional [Faugeras, 1993] [Cipolla et al., 2010]. Un ejemplo cl´sico, para ver la di-
                                                                      a
ferencia que percibe cada ojo, es situar el dedo ´ındice de cualquiera de sus dos manos a
una distancia no mayor de 5 cm. delante de su entrecejo, seguidamente cierra los dos ojos
y alternativamente abre y cierra cada ojo. Se observar´ que cada ojo tiene una percepci´n
                                                       a                                o
un poco distinta del dedo ´
                          ındice y que la distancia entre cada uno de los ojos es conocida
como disparidad binocular [Wildes, 1991].

     La visi´n computacional puede reconstruir modelos [Vasudevan et al., 2011] a trav´s
             o                                                                           e
de dos, tres, cuatro o m´ltiples vistas [Ma et al., 2004] [Hartley and Zisserman, 2004] de
                        u
un mismo objeto; entre m´s im´genes (vistas) exista de un mismo objeto, mejor ser´ la
                           a     a                                                     a
reconstrucci´n. En la Figura 1.3a se puede ver la nube de puntos de dos im´genes est´reo
             o                                                               a        e
tomadas a un edificio, y en la Figura 1.3b, se observa otra nube de puntos de un dinosaurio.
Dado que el segundo objeto, el dinosaurio, tiene m´ltiples im´genes o vistas, la nube de
                                                     u          a
puntos del dinosaurio es mucho mejor a diferencia del primer objeto (el edificio).




                       (a)                                  (b)


    Figura 1.3: (a) Dos vistas y (b) m´ltiples vistas [Hartley and Zisserman, 2004].
                                      u

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                        15
1.1. Motivaci´n y contexto
                                                                            o

      Cada una de las vistas puede representar a la misma c´mara o a diferentes c´maras.
                                                               a                  a
Cada c´mara debe estar correctamente posicionada y adecuadamente distribuida en una
       a
arquitectura f´ısica [Cipolla et al., 2010]. La posici´n de cada c´mara es muy importante
                                                      o           a
porque tiene informaci´n de la proyecci´n del objeto a reconstruir. La iluminaci´n na-
                         o                   o                                      o
tural o artificial es otro de los problemas en la reconstrucci´n 3D de un modelo, porque
                                                               o
determina la intensidad de luz sobre la superfice del objeto.

       En la Figura 1.4a se puede ver una imagen representativa de una sola c´mara que to-
                                                                             a
ma varias im´genes a un buda, que est´ encima de una superficie plana giratoria. El buda
              a                         a
tiene como fuente de iluminaci´n a un foco. En la Figura 1.4b se visualiza la iluminaci´n
                                 o                                                     o
artificial para la adquisici´n de im´genes del laboratorio de fotograf´ computacional y v´
                            o      a                                 ıa                 ı-
deo del Instituto de Matem´tica Pura y Aplicada (IMPA) [VISGRAF., 2012]. En la Figura
                               a
1.4c se observa la posici´n y distribuci´n de m´ltiples c´maras sobre otro arquitectura
                           o              o      u         a
f´
 ısica [Zitnick et al., 2004].




                       (a)                                      (b)




                                           (c)


Figura 1.4: (a) Posici´n de una sola c´mara; (b) iluminaci´n artificial para la adquisici´n
                      o               a                   o                             o
de im´genes y (c) posici´n de m´ltiples c´maras [Zitnick et al., 2004].
     a                   o       u       a

      Una de las ventajas de la Figura 1.4a es el uso de una superficie plana giratoria
debajo del objeto (buda). El uso de la superficie plana giratoria facilita una mayor preci-
si´n en el ´ngulo de giro del buda. Una desventaja de la Figura 1.4a es el uso de un solo
  o        a
foco hacia la superficie del objeto. El uso de una sola buj´ es un inconveniente, porque
                                                          ıa
no tiene una adecuada iluminaci´n sobre toda la superficie del objeto a reconstruir, dado
                                 o

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                       16
CAP´
   ITULO 1. Introducci´n
                      o

que la distribuci´n de la iluminaci´n no es la correcta. En la Figura 1.4b hay una correcta
                 o                 o
iluminaci´n, porque se puede observar que hay un ambiente controlado con cuatro reflec-
           o
tores, que est´n encerrados con un c´
               a                       ırculo de color verde. Otra ventaja de la Figura 1.4b
es el uso de una franela de color negra, que est´ encerrado con un cuadrado de color rojo.
                                                 a
El uso de los cuatro reflectores y la franela negra ayudan bastante en el proceso de adqui-
sici´n de im´genes [Barnard and Fischler, 1982] [Gonz´lez and Woods, 1996], porque no
    o        a                                             a
s´lo se tiene una adecuada iluminaci´n, sino que tambi´n, el uso de la franela negra ayuda
 o                                    o                   e
a eliminar el background del objeto a reconstruir. En la Figura 1.4c se puede ver que dos
tr´
  ıpodes sujetan a ocho c´maras a trav´s de un pedazo de fierro. Al lado izquierdo de
                            a              e
cada c´mara existe un cable, con el cual se logra la sincronicidad de las ocho c´maras en
       a                                                                          a
un solo instante de tiempo, consiguiendo con ello, tener varias vista del objeto a recons-
truir [Hartley and Zisserman, 2004]. Por lo tanto se concluye que es necesario tener una
adecuada arquitectura f´ ısica para el correcto posicionamiento, distribuci´n e iluminaci´n
                                                                           o              o
de la(s) c´mara(s).
           a



1.2.      Planteamiento del Problema

      Un primer problema para la reconstrucci´n 3D de un modelo es dise˜ar y crear
                                                    o                           n
una arquitectura f´ısica para la correcta ubicaci´n e ideal distribuci´n de cada c´mara.
                                                    o                   o             a
Por lo que, en la presente investigaci´n, se desea ubicar adecuadamente ambas c´maras
                                         o                                            a
sobre una arquitectura f´ısica, para la correcta adquisici´n [Barnard and Fischler, 1982] del
                                                          o
par de im´genes estereosc´picas. Se debe de tomar en cuenta una adecuada iluminaci´n
           a                o                                                             o
artificial o natural para el proceso de adquisici´n de im´genes. Un segundo problema es
                                                   o        a
la calibraci´n de las c´maras [Salvi et al., 2002], lo que significa obtener los par´metros
             o         a                                                             a
necesarios [Heikkil¨ and Silv´n, 1997] para realizar el mapeamiento de un objeto al plano
                   a           e
imagen.

      En la Figura 1.5 se observa que el tercer problema, para la reconstrucci´n 3D de un
                                                                              o
modelo, es saber c´mo hallar los puntos correspondientes [Szeliski, 2011] del par de im´-
                   o                                                                    a
genes estereosc´picas. Llevar a cabo la correspondencia de los puntos correspondientes, es
               o
un problema demasiado ambiguo y complejo [Forsyth and J., 2002], porque no es sencillo
determinar con precisi´n la correspondencia de dichos puntos, debido a la variaci´n de la
                       o                                                          o
intensidad luminosa, oclusi´n, ruido o textura [Cochran and Medioni, 1992].
                            o




         Figura 1.5: ¿C´mo hallar los puntos correspondientes? [Szeliski, 2011].
                       o

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                          17
1.3. Objetivo general

      Un m´todo estad´
            e          ıstico est´ndar [Mulligan and Daniilidis, 2001], en la b´squeda de
                                 a                                             u
similitudes de dos im´genes estereosc´picas, es la Correlaci´n Normalizada Cruzada (CNC)
                     a               o                      o
[Ma et al., 2004].

      Un cuarto problema es hallar la posici´n correcta de ambos puntos 2D correspon-
                                                o
dientes en el espacio 3D (proceso de rectificaci´n y triangulaci´n) [Fusiello et al., 2000]
                                                   o               o
[Hartley and Sturm, 1997]. El quinto problema es reconstruir [W¨hler, 2009] y suavizar
                                                                      o
[Piegl and Tiller, 1997] la superficie a partir de la nube de puntos [Linsen, 2001] resultante
del problema anterior.



1.3.      Objetivo general

     Proponer un modelo para la reconstrucci´n de una imagen 3D de un objeto, a partir
                                            o
de dos im´genes capturadas por dos c´maras ubicadas adecuadamente.
         a                          a



1.4.      Objetivos espec´
                         ıficos
  1. Posicionar correctamente las dos c´maras digitales, en una arquitectura f´
                                       a                                      ısica, para
     la adquisici´n de im´genes y calibraci´n.
                 o       a                 o

  2. Hacer la rectificaci´n de las im´genes, para calcular un adecuado mapa de disparidad
                        o           a
     a trav´s de la Correlaci´n Normalizada Cruzada.
           e                 o

  3. Crear la superficie del objeto a partir de la triangulaci´n de Delaunay del mapa de
                                                             o
     disparidad.



1.5.      Organizaci´n de la tesis
                    o

      En el cap´
               ıtulo 2 se hizo una descripci´n sobre el paradigma est´reo computacional
                                            o                           e
y las etapas de la reconstrucci´n 3D de un modelo. En el cap´
                                o                                 ıtulo 3 se habla sobre la
calibraci´n de las c´maras y el an´lisis bifocal. En el cap´
         o          a               a                         ıtulo 4 se comenta sobre la
rectificaci´n y el c´lculo de disparidad. En el cap´
           o       a                                 ıtulo 5 est´ descrita la secuencia de
                                                                a
pasos de la propuesta de tesis. En el cap´ ıtulo 6, se muestran las pruebas y resultados
obtenidos de los objetos utilizados. Finalmente, en el cap´ ıtulo 7 est´n las conclusiones,
                                                                        a
recomendaciones y trabajos futuros.

      En el ap´ndice A est´n las caracter´
              e           a              ısticas t´cnicas de las dos c´maras digitales usadas
                                                  e                   a
en la presente investigaci´n. En el ap´ndice B est´n las treinta posiciones tomadas al
                           o            e              a
tablero de ajedrez, para la calibraci´n de la c´mara. En el ap´ndice C, est´n descritas las
                                     o         a                 e           a
propiedades de la triangulaci´n de Delaunay en el plano 2D.
                              o



Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                          18
Cap´
   ıtulo 2

Trabajos relacionados

2.1.      Consideraciones Iniciales

      Con el objetivo de contextualizar, entender los conceptos y trabajos relacionados en
la presente investigaci´n, este cap´
                       o           ıtulo se ha dividido en dos secciones. En la primera se des-
criben los seis pasos del paradigma est´reo computacional [Barnard and Fischler, 1982].
                                           e
En la segunda, se comenta sobre las etapas, en com´n, que tiene la reconstrucci´n 3D de
                                                       u                             o
un modelo [Hartley and Zisserman, 2004] [Ma et al., 2004] [Koch et al., 2000].



2.2.      Paradigma est´reo computacional
                       e

     El concepto de la reconstrucci´n 3D a trav´s de la visi´n computacional est´ definido
                                    o           e           o                    a
como la recuperaci´n (reconstrucci´n) de las caracter´
                   o                o                 ısticas (estructura) tridimensionales
de una escena a partir de dos im´genes (vistas) tomadas de diferentes puntos angulares
                                  a
[Mery, 2004], y en donde el paradigma est´reo computacional [Barnard and Fischler, 1982]
                                         e
envuelve los siguientes pasos:


   1. Adquisici´n de im´genes.- Las im´genes est´reo pueden ser adquiridas o tomadas de
                o       a               a          e
      diferentes formas, es decir, pueden variar con respecto al tipo de c´mara (marca), el
                                                                           a
      n´mero de c´maras, la posici´n de las c´maras, la distancia de las c´maras y la re-
       u           a                 o         a                             a
      soluci´n. Estas son algunas de las consideraciones que se deben de tener en cuenta en
            o
      el proceso de adquisici´n de las im´genes. La oclusi´n, iluminaci´n y la textura for-
                             o            a                o             o
      man parte de la complejidad del dominio de la escena [Barnard and Fischler, 1982].

   2. Modelaci´n de las c´maras.- El modelamiento de las c´maras proyecta las caracter´
               o         a                                 a                             ıs-
      ticas geom´tricas y f´
                 e         ısicas del mapeamiento de un punto 3D a coordenadas p´    ıxeles.
      Seg´n [Weng et al., 2002] el proceso de calibraci´n de una c´mara tiene dos pasos.
          u                                            o            a
      El primer paso es una transformaci´n lineal, en donde, se hallan los par´metros de la
                                         o                                    a
      c´mara. El segundo paso resuelve el problema no lineal de la distorsi´n [Tsai, 1987].
       a                                                                    o

                                              19
2.3. Reconstrucci´n 3D de un modelo
                                                                       o

  3. Selecci´n de caracter´
            o             ısticas.- Consiste en eligir a los candidatos de una imagen de
     acuerdo a sus atributos geom´tricos, intensidad, color o textura en una regi´n, borde
                                   e                                             o
     o p´ [Ma et al., 2004] [Barnard and Fischler, 1982].
        ıxel
  4. B´squeda de correspondencias.- Encontrar los puntos correspondientes o puntos ho-
       u
     m´logos [Birchfield., 1998] en un sistema de visi´n est´reo con dos, tres o m´ltiples
       o                                              o     e                    u
     vistas es un proceso demasiado complejo y ambiguo, porque no necesariamente se
     puede hallar el punto hom´logo en la imagen correspondiente. Esto se debe a cau-
                                o
     sa de los siguientes factores: variaci´n de la intensidad luminosa, oclusi´n, ruido,
                                           o                                   o
     textura de los objetos y/o errores de calibraci´n [Cochran and Medioni, 1992].
                                                    o
  5. Determinaci´n de la profundidad.- Seguidamente de haber resuelto el problema de la
                 o
     b´squeda de correspondencia y hallados los puntos hom´logos, la reconstrucci´n del
      u                                                     o                    o
     punto tridimensional estar´ dada por la triangulaci´n [Hartley and Sturm, 1997].
                               a                        o
  6. Interpolaci´n.- Despu´s de haber hallado la profundidad de cada par de puntos
                o          e
     correspondientes, en el paso anterior. Ahora se puede interpolar ciertas zonas o
     areas en donde exista una escasez de puntos tridimensionales.
     ´



2.3.     Reconstrucci´n 3D de un modelo
                     o

      Shankar Sastry [Ma et al., 2004], Andrew Zisserman [Hartley and Zisserman, 2004]
y Marc Pollefeys [Koch et al., 2000] dividen la reconstrucci´n 3D de su modelo en los
                                                            o
siguientes pasos:

  1. Calibraci´n.- Paso en el cual se hallan los par´metros necesarios [Salvi et al., 2002]
              o                                     a
     para el mapeamiento de un punto 3D al plano imagen.
     La matriz de mapeamiento o proyecci´n de perspectiva [Hearn and Baker, 1995] de
                                             o
     un punto 3D al plano, se lleva a cabo a trav´s de la matriz de par´metros intr´
                                                     e                     a              ınse-
     cos [Heikkil¨ and Silv´n, 1997] o matriz de calibraci´n [Ma et al., 2004], que son la
                  a         e                               o
     presentaci´n de las propiedades f´
               o                        ısicas de la c´mara y su optica. Los par´metros de
                                                       a         ´               a
     la matriz de calibraci´n son: la distancia focal (f ), punto principal (ox , oy ), factor
                            o
     de torcimiento (sθ ) y los coeficientes para el cambio de unidades m´tricas a p´
                                                                           e            ıxeles.
     La matriz de par´metros extr´
                       a            ınsecos es la posici´n y orientaci´n de la c´mara con
                                                         o            o          a
     respecto al punto 3D y est´ representada por una matriz de rotaci´n R y una matriz
                                 a                                       o
     de traslaci´n t [Weng et al., 2002] [Zhang, 1999].
                o
  2. Rectificaci´n.- Seguidamente de haber realizado la calibraci´n de las c´maras y haber
                o                                               o          a
     hallado la matriz de par´metros intr´
                             a            ınsecos y la matriz de par´metros extr´
                                                                     a            ınsecos,
     se procede a la rectificaci´n [Fusiello et al., 2000] [Trucco and Verri, 1998] de los
                               o
     planos imagen del par de im´genes del sistema de visi´n estereosc´pica.
                                 a                          o           o
     Generalmente la rectificaci´n [Fusiello., 1998] se realiza a trav´s del eje horizontal
                               o                                     e
     con la finalidad de conseguir una alineaci´n del par de l´
                                               o              ıneas epipolares correspon-
     dientes. Haciendo que la b´squeda de correspondencias sea l´
                               u                                    ıneal y no cuadr´tica
                                                                                     a
     [Cormen et al., 2001].

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                            20
CAP´
   ITULO 2. Trabajos relacionados

     Despu´s de haber realizado el proceso de rectificaci´n, el emparejamiento de los
           e                                               o
     puntos correspondientes [Szeliski, 2011] [Scharstein and Szeliski, 2002] se realiza en
     su correspondiente l´
                         ınea epipolar y no en toda la imagen.

  3. C´lculo de disparidad.- Despu´s de haber rectificado al par de im´genes estereos-
       a                            e                                   a
     c´picas, los puntos correspondientes se hallan alineados en forma horizontal, pero
      o
     a´n existe una diferencia entre las coordenadas de dichos puntos hom´logos. Esta
      u                                                                     o
     diferencia se llama disparidad [Lecumberry, 2005] [Scharstein and Szeliski, 2002].

  4. Reconstrucci´n 3D.- Despu´s de haber llevado a cabo el c´lculo de disparidad o
                    o              e                               a
     distancia asociada a los puntos correspondientes del par de im´genes rectificadas del
                                                                    a
     sistema de visi´n estereosc´pica y, tambi´n haber calculado la matriz de par´metros
                      o          o            e                                     a
     intr´
         ınsecos y la matriz de par´metros extr´
                                    a          ınsecos, entonces, ahora se puede encontrar
     la localizaci´n de un punto 3D a trav´s de la intersecci´n de dos rectas en el espacio.
                  o                        e                 o
     El proceso de intersecci´n de dos rectas en el espacio, se conoce como triangulaci´n
                             o                                                         o
     [Hartley and Sturm, 1997]. Cada recta representa a la reproyecci´n del mismo punto
                                                                       o
     3D en cada plano imagen del mismo sistema de visi´n estereosc´pica.
                                                          o            o



2.4.     Consideraciones Finales

      B´sicamente la reconstrucci´n 3D de un modelo est´ determinada por la calibraci´n,
        a                         o                      a                            o
rectificaci´n, c´lculo de disparidad y finalmente la triangulaci´n de puntos 3D. El para-
          o    a                                               o
digma est´reo computacional es el m´s completo en hacer una descripci´n de cada uno
          e                           a                                  o
de los pasos asociados para la recuperaci´n de la estructura tridimensional de un objeto,
                                         o
porque tiene una secuencia de pasos bien estructurada y definida.




Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                         21
Cap´
   ıtulo 3

Calibraci´n de las c´maras y an´lisis
         o          a          a
bifocal

3.1.     Consideraciones Iniciales

      Llevar a cabo la proyecci´n de un punto 3D a coordenadas p´
                               o                                   ıxeles se hace a trav´s
                                                                                         e
de un conjunto de par´metros, que est´n representados en una matriz de mapeamiento
                        a               a
[Heikkil¨ and Silv´n, 1997]. Este conjunto de par´metros se divide en intr´
        a          e                               a                         ınsecos y ex-
tr´
  ınsecos. Los par´metros intr´
                   a           ınsecos est´n relacionados con las propiedades f´
                                          a                                       ısicas de
la c´mara y su optica, y los par´metros extr´
    a            ´                a            ınsecos con un movimiento de rotaci´n y o
traslaci´n. La geometr´ epipolar [Ma et al., 2004] [Hartley and Zisserman, 2004] permite
        o              ıa
entender el an´lisis matem´tico del plano imagen de la c´mara lateral izquierda y el plano
               a           a                            a
imagen de la c´mara lateral derecha del sistema de visi´n est´reo.
               a                                        o     e



3.2.     Modelo de c´mara pinhole
                    a

       El modelo de c´mara pinhole no s´lo es el modelo de c´mara m´s b´sico, sino
                     a                     o                   a         a a
tambi´n, el modelo m´s utilizado en el area de visi´n de computacional, porque ayuda a
       e              a                 ´          o
entender la formaci´n de una imagen desde un punto de vista geom´trico, utilizando la
                   o                                                e
proyecci´n de perspectiva. Tambi´n existen otros modelos de c´mara [Mer´., 2008] que no
         o                       e                           a           e
ser´n tratados en la presente investigaci´n porque no tienen una relaci´n directa con la
   a                                     o                             o
tesis.

       El m´delo de c´mara pinhole consiste en un centro optico o en donde convergen
            o          a                                      ´
todos los rayos de la proyecci´n y un plano imagen I, en el cual, la imagen es proyectada.
                              o
El plano imagen est´ ubicado a una distancia focal f del centro ´ptico y es perpendicular
                     a                                            o
al eje z, como se muestra en la Figura 3.1. Tambi´n se puede observar que, para cualquier
                                                   e
punto arbitrario que est´ dentro de dicha l´
                         e                   ınea, su proyecci´n ser´ la misma en el plano
                                                              o     a
imagen I.

                                            22
CAP´
   ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal
                     o          a          a




             Figura 3.1: Modelo de c´mara pinhole frontal [Ma et al., 2004]
                                    a

     Sea p un punto cualquiera en 3D, que est´ expresado en coordenadas no homog´neas
                                             a                                      e
                             T      3
[Coxeter, 2003] p = [X, Y, Z] ∈ R , ser´ proyectado en el plano imagen I como un
                                          a
punto 2D x. El punto 2D x tambi´n est´ representado en coordenadas no homog´neas
                                  e     a                                           e
          T      2
x = [x, y] ∈ R . El punto x es la intersecci´n de la recta entre el centro ´ptico o y el
                                             o                               o
punto p con el plano imagen I. En la ecuaci´n 3.1 se puede observar la representaci´n
                                             o                                          o
matem´tica de la intersecci´n del centro optico o con el punto p de la Figura 3.1 y la
       a                   o             ´
notaci´n matem´tica op representa la l´
      o         a    ¯                ınea recta entre el centro optico o y el punto p.
                                                                 ´



                                          x = op ∩ I
                                               ¯                                      (3.1)

      Dado que el plano cartesiano R2 se identifica como un plano en un espacio vectorial,
se puede asociar cualquier punto bidimensional como un vector. Ahora, se usar´ la nota-
                                                                                  a
ci´n x como la representaci´n de un vector en coordenadas homog´neas [Coxeter, 2003].
  o                          o                                       e
Tambi´n se utilizar´ la letra en negrita, para expresar un punto cualquiera como un vector.
       e            a
Una de las ventajas de la Geometr´ Proyectiva es el uso de las coordenadas homog´neas
                                    ıa                                                e
[Coxeter, 2003]. Utilizar coordenadas homog´neas permite colocar un 1 al final del par
                                                e
ordenado, posibilitando la eficiencia en las rotaciones y traslaciones en las transformacio-
nes lineales. En la ecuaci´n 3.2, los puntos x y p est´n en coordenadas homog´nas, y π
                           o                            a                         e
representa a la matriz de mapeamiento [Ma et al., 2004].


                             π
                                                       X
                                                          
                                   
             x     f 0 0 0
                                            R t       Y   
          Z y = 0 f 0 0 
                                                       
                                                               λ := Z , λ ∈ R+        (3.2)
                                            0 1        Z
                                                         
                                                          
             1     0 0 1 0
                                                       1
                 x                π
                                                       p

     La matriz π es la multiplicaci´n de la matriz Kf y la matriz Π0 de la ecuaci´n 3.3.
                                   o                                               o
En las dos primeras diagonales de la matriz Kf se tiene la distancia focal, y la matriz Π0

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                        23
3.3. Calibraci´n
                                                                                              o

a menudo es llamada la matriz de proyecci´n est´ndar o matriz de proyecci´n can´nica
                                         o     a                         o     o
[Ma et al., 2004].

                                                                     
                         f 0 0 0       f 0 0    1 0 0 0
                   π =  0 f 0 0  =  0 f 0  0 1 0 0 
                                          
                                                                                          (3.3)
                         0 0 1 0       0 0 1    0 0 1 0
                               Kf ×Π0                 Kf            Π0


      Para el caso que el plano imagen I est´ ubicado detr´s de las coordenadas de la
                                              e             a
c´mara pinhole, como se muestra en la Figura 3.2, la distancia focal f de la matriz π de
 a
la ecucaci´n 3.4 ser´ negativa, porque, el plano imagen I est´ ubicado detr´s del eje de
          o         a                                        a               a
coordenadas de la c´mara. La proyecci´n de cualquier escena u objeto del mundo real,
                    a                   o
ser´ proyectada de forma inversa.
   a




                   Figura 3.2: Modelo de c´mara pinhole [Ma et al., 2004]
                                          a



                           π
                                                      X
                                                         
                                 
        x     f 0 0 0
                                        R t          Y   
     Z y = 0 f 0 0                                        λ := Z , λ ∈ R+ , f ∈ R−     (3.4)
                                                     
                                        0 1           Z
                                                         
                                                         
        1     0 0 1 0
                                                      1
           x                    π
                                                      p


3.3.       Calibraci´n
                    o

      La calibraci´n de las c´maras consiste en hallar la matriz de mapeamiento, en-
                  o           a
tre las coordenadas globales a las coordenadas p´   ıxeles. Dicha matriz de mapeamiento
[Ma et al., 2004] o matriz de transformaci´n de perspectiva [Fusiello et al., 2000] tiene
                                            o
definido los par´metros intr´
                a           ınsecos y extr´
                                          ınsecos [Mer´., 2008] [Heikkil¨ and Silv´n, 1997]
                                                       e                a         e
[Tsai, 1987] que son detallados a continuaci´n:
                                             o

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                             24
CAP´
   ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal
                     o          a          a

3.3.1.     Par´metros intr´
              a           ınsecos

      Debido a que el sistema de medidas de una imagen (coordenadas p´      ıxeles), y el
sistema de medidas de un punto homog´neo 2D x (coordenadas m´tricas) proyectado en
                                        e                          e
el plano imagen, no son lo mismo, se tiene que hacer una conversi´n entre ambos sistemas
                                                                 o
de coordenadas a trav´s de la matriz de los par´metros intr´
                      e                         a           ınsecos.

      La matriz de los par´metros intr´
                              a            ınsecos est´ conformado por la distancia focal (f ); el
                                                      a
punto principal (ox , oy ), que es la intersecci´n entre el plano imagen I y el eje z del sistema
                                                o
de coordenadas de la c´mara; el factor de torcimiento (sθ ) y los coeficientes (sx , sy ), para
                          a
el cambio de unidades m´tricas a p´
                             e          ıxeles. La matriz de par´metros intr´
                                                                 a           ınsecos representa
a las propiedades f´
                   ısicas de la c´mara y su optica.
                                    a            ´

     En la ecuaci´n 3.5, se puede observar que la matriz K es la multiplicaci´n de las
                 o                                                            o
matrices Ks y Kf . La matriz K es la matriz que contiene a los par´metros intr´
                                                                  a             ınsecos.
Dicha matriz tambi´n es conocida como matriz de calibraci´n [Ma et al., 2004].
                   e                                     o


                                                                     
                      f sx f sθ ox       sx sθ o x    f 0 0
                     0    f sy oy  =  0 sy oy   0 f 0                                 (3.5)
                                                
                                                            
                       0    0   1        0 0 1        0 0 1
                                 K               Ks              Kf


3.3.2.     Par´metros extr´
              a           ınsecos

      Los par´metros extr´
              a           ınsecos definen el movimiento r´    ıgido de traslaci´n y rotaci´n de
                                                                              o          o
las coordenadas globales de un punto cualquiera p = (Xi , Yi , Zi ) del objeto, con respecto
al centro de coordenadas de la c´mara o=(xi , yi , zi ). En la ecuaci´n 3.6, la variable R re-
                                 a                                    o
presenta a la matriz de rotaci´n y t es la matriz de traslaci´n [Heikkil¨ and Silv´n, 1997].
                              o                                o          a          e


                                                                   
                       xi       m11 m12 m13     Xi       x0
                     
                      yi  =  m21 m22 m23   Yi  +  y0 
                                                                                     (3.6)
                       zi       m31 m32 m33     Zi       z0
                         o                   R           p            t

       La ecuaci´n 3.7 est´ el modelo generalizado para el mapeamiento de un punto 3D a
                 o         a
coordenadas p´  ıxeles; en dicha ecuaci´n se puede observar la variable lambda (λ), la cual
                                        o
representa a un valor escalar que pertenece a los n´meros reales, y un punto x que ha
                                                        u
sido transformado a coordenadas p´   ıxeles homog´neas. Seguidamente, despu´s del signo de
                                                   e                          e
igualdad, est´ la matriz de par´metros intr´
              a                  a             ınsecos (K), la matriz de proyecci´n can´nica
                                                                                 o     o
(Π0 ), la matriz de par´metros extr´
                         a            ınsecos (R y t) y un punto cualquiera p del objeto en
coordenadas homog´neas.
                      e

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                               25
3.4. M´todos de calibraci´n
                                                                     e                  o



                                        π
                                                                   X
                                                                      
                                              
             u       f sx f sθ ox    1 0 0 0
                                                       R t        Y   
         λ  v  =  0 f sy oy   0 1 0 0                                λ∈R         (3.7)
                                                                
                                                       0 1         Z
                                                                      
                                                                      
             1        0    0   1     0 0 1 0
                                                                   1
              x           K                 Π0
                                                                   p



3.3.3.        Distorsi´n del lente
                      o

      Existen dos tipos de distorsi´n durante el mapeamiento de las coordenadas globales
                                    o
a las coordenadas p´  ıxeles. La primera es una distorsi´n lineal [Bakstein., 1999], que se
                                                         o
produce debido a la proyecci´n de perspectiva. Mientras mayor sea la distancia focal, me-
                               o
nor ser´ la distorsi´n [Mer´., 2008]. En la Figura 3.3 se puede observar, que la proyecci´n
       a            o        e                                                           o
de perspectiva de un cuadrado, no conserva la originalidad de su forma (geometr´   ıa).




          Figura 3.3: Proyecci´n de perspectiva de un cuadrado [Bakstein., 1999]
                              o

      La segunda distorsi´n es no lineal [Tsai, 1987] [Mer´., 2008] y se debe a la curvatura
                          o                               e
del lente. La concavidad de la optica hace que se produzca una deformaci´n en la imagen,
                                ´                                          o
lo cual har´ que las l´
            a         ıneas rectas no se observen como tales, sino como curvas.



3.4.      M´todos de calibraci´n
           e                  o

      Si bien las dos partes del proceso de calibraci´n son: la transformaci´n lineal y la
                                                      o                     o
correcci´n de la distorsi´n [Weng et al., 2002]. Hay m´todos que resuelven cada parte de
        o                o                              e
dicho proceso de diferentes formas [Salvi et al., 2002] [Faugeras and Toscani., 1987].

      Se ha elegido el m´todo de Heikkil¨ y Silv´n [Heikkil¨ and Silv´n, 1997] por la mane-
                        e               a       e          a         e
ra de como da a conocer ambas partes del proceso de calibraci´n y el m´todo de Zhengyou
                                                               o        e
Zhang [Zhang, 2000], por su robustez y flexibilidad.

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                         26
CAP´
   ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal
                     o          a          a

3.4.1.    El m´todo de Heikkil¨ y Silv´n
              e               a       e

     El m´todo de Heikkil¨ y Silv´n [Heikkil¨ and Silv´n, 1997] consta de los siguientes
          e              a       e          a         e
cuatro pasos:


  1. El primer paso consiste en hacer una Transformaci´n Lineal Directa (TLD) de las
                                                            o
     coodenadas homog´neas del objeto (Xi , Yi , Zi , 1) a coordenadas de la imagen (ui , vi ).
                       e
     Para llevar a cabo ello, se utiliza una matriz homog´nea de 3 × 4 llamada matriz
                                                              e
     A. La ecuaci´n matricial ser´ de la siguiente forma:
                  o               ıa


                                                                                   Xi
                                                                                       
                                                                        
                               ui w i      a11 a12 a13 a14 
                                                                                   Yi   
                           
                               vi wi  =  a21 a22 a23 a24  
                                                                                      
                                                                                                           (3.8)
                                                                                   Zi
                                                                                     
                                                                                       
                                wi         a31 a32 a33 a34
                                                                                   1
                                                           A

     Heikkil¨ y Silv´n [Heikkil¨ and Silv´n, 1997] resuelven los par´metros a11 , . . . , a34
            a       e          a         e                          a
     de la matriz A de la TLD eliminando wi . Por consiguiente, el sistema lineal, se
     denotar´ de la siguiente manera:
            ıa


                                                    La = 0                                                 (3.9)


                                                                                                     
                  X1 Y1 Z1         1 0   0 0                0 −X1 u1           −Y1 u1       Z1 u1 −u1
                  0  0 0           0 X1 Y1 Z1               1 −X1 v1           −Y1 v1       Z1 v1 −v1 
                                                                                                     
              
                   .  .  .         . .    .  .              .   .                .            .    . 
                                                                                                     
              
                  .
                   .  .
                      .  .
                         .         . .
                                   . .    .
                                          .  .
                                             .              .
                                                            .   .
                                                                .                .
                                                                                 .            .
                                                                                              .    . 
                                                                                                   . 
              
                 Xi Yi Zi         1 0   0 0                0 −Xi ui           −Yi ui       Zi ui −ui 
         L=   
                                                                                                       (3.10)
                                                                                                      
                  0  0 0           0 X i Yi Z i             1 −Xi vi           −Yi vi       Zi vi −vi 
              
              
                   .  .  .         . .    .  .              .   .                .            .    . 
                                                                                                     
              
                  .
                   .  .
                      .  .
                         .         . .
                                   . .    .
                                          .  .
                                             .              .
                                                            .   .
                                                                .                .
                                                                                 .            .
                                                                                              .    . 
                                                                                                   .
                                                                                                     
              
                 Xn Yn Zn         1 0   0 0                0 −Xn un −Yn un Zn un −un 
                                                                                      
                  0  0 0           0 Xn Yn Zn               1 −Xn vn −Yn vn Zn vn −vn


                   a = [a11 , a12 , a13 , a14 , a21 , a22 , a23 , a24 , a31 , a32 , a33 , a34 ]T          (3.11)

     Para evitar una soluci´n trivial, en el sistema lineal de la ecuaci´n 3.9, el par´metro
                            o                                           o             a
     a34 de la matriz A debe ser uno y Faugeras y Toscani [Faugeras and Toscani., 1987]
     sugieren que los par´metros a31 , a32 y a33 , cumplan la siguiente igualdad: a31 + a32 +
                          a
     a33 = 1, la cual garantiza la no singularidad de la matriz A, por lo cual, se encontrar´
                                                                                            a
     una soluci´n.
                o
     Una vez obtenidos los par´metros de la matriz A, Melen [Melen., 1994] hace una
                              a
     descomposici´n RQ a la matriz A, obteniendo la siguiente ecuaci´n:
                 o                                                  o

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                                             27
3.4. M´todos de calibraci´n
                                                                             e                  o



                                    A = λV −1 B −1 F M T
                                                                                            (3.12)
                                            R         Q

     donde las matrices M y T forman la matriz de rotaci´n y traslaci´n del sistema de
                                                                 o           o
     coordenadas del objeto al sistema de coordenadas de la c´mara de la ecuaci´n 3.6.
                                                                     a             o
     Las matrices V, B y F representan al punto principal (ox , oy ), los coeficientes para
     la distorsi´n lineal (b1 , b2 ) y la distancia focal f respectivamente.
                o

                                                                                 
                  1 0 −ox           1 + b1   b2   0           f 0 0
            V =  0 1 −oy  , B =  b2     1 − b1 0  , F =  0 f 0                        (3.13)
                                
                                                                  
                  0 0 1               0      0    1           0 0 1

  2. El segundo paso consiste en corregir los componentes de distorsi´n radial y tangen-
                                                                      o
     cial [Tsai, 1987] [Mer´., 2008] de la proyecci´n del punto 3D al plano imagen. El
                           e                       o
     problema de la existencia de ruido en las im´genes, se resuelve a trav´s de m´
                                                  a                        e      ınimos
     cuadrados. La funci´n objetivo a minimizar es la siguiente:
                         o


                                   N                     N
                            F =    i=1 (Ui   − ui )2 +   i=1 (Vi   − vi )2                  (3.14)

     Donde:
     (Ui , Vi ) representa a los datos reales
     (ui , vi ) representa a los datos observados o ideales

     Debido a que la funci´n objetivo F a minimizar en la ecuaci´n 3.14 es no lineal,
                           o                                    o
     se utiliza el m´todo de Levenberg-Marquardt [Mor´, 1978] para su optimizaci´n.
                    e                                 e                          o
     El m´todo de Levenberg-Marquardt es un algoritmo iterativo que busca la mejor
          e
     soluci´n al problema de m´
           o                  ınimos cuadrados.

  3. El tercer paso consiste en corregir la distorsi´n a causa del ´ngulo y el desplazamiento
                                                    o              a
     entre el objeto y el plano imagen.
     Como se puede observar en la Figura 3.4, la distancia focal f es la distancia ortogonal
     entre O y el plano Π2 . Tambi´n se puede mirar que Γ2 es la proyecci´n de Γ1 en
                                     e                                          o
     el plano Π2 . Se utiliza un cono porque es la figura geom´trica m´s representativa
                                                                 e         a
     para la proyecci´n del c´
                     o        ırculo Γ1 del plano Π1 al plano Π2 . La proyecci´n puede ser
                                                                               o
     expresada de la siguiente forma:


                              (X − αZ)2 + (Y − βZ)2 = γ 2 Z 2                               (3.15)

     Los par´metros α y β especifican la asimetr´ del cono en la direcci´n X y Y.
              a                                   ıa                       o
     El par´metro γ especifica la “nitidez” del cono. Dado que el sistema de coordenas
            a
     Ω1 (X, Y, Z) ∈ R3 , que est´ centrado en el foco de la c´mara O y su eje Z, es
                                a                            a

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                               28
CAP´
   ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal
                     o          a          a




    Figura 3.4: Proyecci´n de perspectiva de un c´
                        o                        ırculo [Heikkil¨ and Silv´n, 1997]
                                                                a         e

     perpendicular al plano Π1 , y dado que el sistema de coordenadas Ω2 (x, y, z) ∈ R3 ,
     que tambi´n est´ centrado en el foco de la c´mara O, y que su eje z es ortogonal al
                e     a                          a
     plano imagen Π2 , se realiza una transformaci´n de Ω2 a Ω1 , la cual, est´ expresada
                                                   o                          a
     en la siguiente ecuaci´n:
                           o

                                                        
                              X       a11 a11 a13     x
                             Y  =  a21 a22 a23   y                           (3.16)
                                                   

                              Z       a31 a32 a33     z

     Si formamos una base ortonormal de la transpuesta de cada vector columna de la
     matriz de 3 × 3 de la ecuaci´n 3.16, entonces la ecuaci´n 3.15 puede ser expresada
                                 o                          o
     en coordenadas de la c´mara de la siguiente forma:
                           a


                      [ (a11 − αa31 )x + (a12 − αa32 )y + (a13 − αa33 )z]2
                      + [(a21 − βa31 )x + (a22 − βa32 )y + (a23 − βa33 )z]2
                      = γ 2 (a31 + a32 y + a33 z)2                                 (3.17)

     Ahora, la intersecci´n de C y el plano Π2 , es Γ2 , y est´ expresada como:
                         o                                    a


                (n2 + k 2 − r2 )x2 + 2(kl + np − rs)xy + (l2 + p2 − s2 )y 2 +
                 2(km + nq − rt)x + 2(lm + pq − st) + m2 + q 2 − t2 = 0            (3.18)

     Donde:


                    k = a11 − ta31     n = a21 − sa31     r = γa31
                    l = a12 − ta32     p = a22 − sa32     s = γa32                 (3.19)
                    m = (a13 − ta33 )f q = (a23 − sa33 )f t = γa33 f

     En la ecuaci´n 3.18, se puede observar que tiene una forma cuadr´tica y que la
                 o                                                   a
     imagen proyectada puede ser un c´
                                     ırculo o una elipse.

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                      29
3.4. M´todos de calibraci´n
                                                                                     e                  o

     Si partimos del supuesto que es una elipse, entonces el centro(uc , vc ) puede ser ex-
     presado como:


                          uc = (kp−nl)(lq−pm)−(ks−lr)(tl−ms)−(ns−pr)(wp−qs)
                                         (kp−nl)2 −(ks−lr)2 −(ns−pr)2
                               (kp−nl)(mn−kq)−(ks−lr)(mr−kt)−(ns−pr)(qr−nt)                         (3.20)
                          vc =           (kp−nl)2 −(ks−lr)2 −(ns−pr)2


     Para conocer cu´l es la proyecci´n del centro del c´
                       a                o                 ırculo, se considera la situaci´n
                                                                                         o
     donde el radio del c´
                         ırculo es cero (γ = 0). Consecuentemente r, s y t se convierten en
     cero, por lo tanto, se obtiene la posici´n de la proyecci´n del punto y la proyecci´n
                                             o                o                          o
     del centro del c´
                     ırculo.


                                              lq−pm                mn−kq
                                       u0 =   kp−nl
                                                          , v0 =   kp−nl                            (3.21)

     Una vez calculados los datos de la ecuaci´n 3.20 y la ecuaci´n 3.21, se procede hacer
                                              o                  o
     una correcci´n de la proyecci´n a trav´s de la siguiente ecuaci´n:
                 o                o         e                       o


                                       Ui = Ui − sx su (uc,i − u0,i )
                                                                                                    (3.22)
                                       Vi = Vi − sy (vc,i − v0,i )

  4. En el cuarto y ultimo paso, se resuelve el problema del back-projection [Pollefeys, 2009],
                    ´
     en el cual, se desea recuperar la l´
                                        ınea o recta de las coordenadas de la imagen; esto
     se hace a trav´s del modelo de c´mara impl´
                    e                  a            ıcito de Wei y Ma [Wei and Ma, 1993].
     Por lo tanto, se puede expresar el mapeo de (ui , vi ) a (ui , vi ) como:


                  ui          1    ui + ui (a1 ri + a2 ri ) + 2a3 ui vi + a4(ri + 2ui2 )
                                                2       4                     2
                          =                     2       4          2       2                        (3.23)
                  vi          G    vi + vi (a1 ri + a2 ri ) + a3(ri + 2vi ) + 2a4 ui vi

     y


                                           2                        2
                                  G = (a5 ri + a6 ui + a7 vi + a8 )ri + 1                           (3.24)

     donde:


                                              (ui −u0 )            (vi −v0 )
                                       ui =    (sx su )
                                                          , vi =      sy                            (3.25)

     y
     ri =     ui2 + vi2
     Si se comparara el modelo inverso impl´
                                           ıcito al modelo de la c´mara pinhole m´s el
                                                                  a              a
     componente de la distorsi´n radial y tangencial, se podr´ observar que el modelo
                              o                              ıa

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                                       30
CAP´
   ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal
                     o          a          a

     impl´
         ıcito tiene componentes que reemplazan a la distorsi´n radial y a la distorsi´n
                                                             o                        o
     tangencial.
     Para conocer los par´metros desconocidos del modelo inverso, (ui , vi ) y (ui , vi ), es
                           a
     necesaria una grilla, para lo cual, se define:


             ui = [−ui ri , −ui ri , −2ui vi , −(ri + 2ui2 ), ui ri , ui ui ri , ui vi ri , ui ri ]T
                           2          4                      2          4       2         2        2

             vi = [−vi ri , −vi ri , −(ri + 2vi2 ), −2ui vi , vi ri , vi ui ri , vi vi ri , vi ri ]T
                          2          4          2                     4       2         2       2
                                                               T
             T = [u1 , v1 , . . . , ui , vi , . . . , un , vn ]                                        (3.26)
             p = [a1 , a2 , a3 , a4 , a5 , a6 , a7 , a8 ]T
             e = [u1 − u1 , v1 − v1 , . . . , ui − ui , vi − vi , . . . , un − un , vn − vn ]T

     Usando la ecuaci´n 3.23 y la ecuaci´n 3.24, se obtiene la siguiente relaci´n:
                     o                  o                                      o


                                                    e = Tp                                             (3.27)

     Ahora, el vector p es estimado a trav´s de m´
                                          e      ınimos cuadrados:


                                             p = (T T T )−1 T T e                                      (3.28)

     Los par´metros calculados en la ecuaci´n 3.28 son usados en la ecuaci´n 3.23 y
             a                                 o                                o
     en la ecuaci´n 3.24 para corregir los coordenadas de la imagen arbitraria (u, v).
                 o
     Entonces las coordenadas reales son obtenidas, por interpolaci´n, en las coordenadas
                                                                   o
     calculadas entre (ui , vi ) y (ui , vi ).


3.4.2.    El m´todo de Zhengyou Zhang
              e

     Zhengyou Zhang desarrollo un m´todo de calibraci´n flexible y robusto [Zhang, 2000]
                                        e                 o
[Zhang, 1999], donde el criterio utilizado fue el siguiente:

      Sea un punto 2D x = [u v]T y un punto 3D p = [X Y Z]T . Se usa x para denotar
ambos puntos en coordenadas homog´neas, por lo tanto, nuevo par de puntos es: x =
                                       e
[u v 1]T y p = [X Y Z 1]T . La relaci´n entre un punto 3D M y su proyecci´n imagen m
                                     o                                   o
est´ definido por:
   a


                                             sx = K [R t]p                                             (3.29)

     Donde s es un factor arbitrario y (R, t) es la matriz de par´metros extr´
                                                                 a           ınsecos (matriz
de rotaci´n y traslaci´n), que relaciona el sistema de coordenadas globales al sistema de
         o            o
coordenadas de la c´mara; K es la matriz de par´metros intr´
                    a                               a            ınsecos.

     Plano homogr´fico
                 a

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                                          31
3.4. M´todos de calibraci´n
                                                                            e                  o

      Dado un plano en el espacio 3D existe una unica matriz que mapea este plano
                                                   ´
homogr´fico a un plano imagen. Si se asume que el eje Z del plano modelo est´ ubicado
        a                                                                       a
en la posici´n cero (Z = 0) del sistema de coordenadas globales, se tiene lo siguiente:
            o


                          s[u v   1]T   =   K[r1   r2   r3 t][X Y Z 1]T
                          s[u v   1]T   =   K[r1   r2   r3 t][X Y 0 1]T
                                                                                             (3.30)
                          s[u v   1]T   =   K[r1   r2   t][X Y 1]T
                          s[u v   1]T   =   H[X    Y    1]T

      Como se puede observar, en la ecuaci´n 3.30, H = K[r1 r2 t] y es la matriz homo-
                                          o
gr´fica que mapea el punto p del plano modelo al punto x del plano imagen. Por lo tanto,
  a
la ecuaci´n general para el mapeamiento est´ definida por:
         o                                 a


                                            sx = H p                                         (3.31)

      Para conocer la matriz H de la ecuaci´n 3.31, es necesario crear el siguiente sistema
                                           o
lineal:


                                            CH =0                                            (3.32)



                                                                         H11
                                                                                
            X1 Y1 Z 1 1        0 −u1 X1        −u1 Y1       −u1 Z1 1
                                                                      H
            0 X1 Y1 Z1         1 −v1 X1        −v1 Y1       −v1 Z1 1   12
                                                                                  
                                                                                  
             .  .  .  .        .   .             .            .    .   H13
                                                                                
        
            .
             .  .
                .  .
                   .  .
                      .        .
                               .   .
                                   .             .
                                                 .            .
                                                              .    . 
                                                                   . 
                                                                                   
                                                                                   
                                                                        H         
           Xi Yi Zi 1         0 −ui Xi        −ui Yi       −ui Zi 1   21        
                                                                      H              = 0   (3.33)
                                                                                
            0 Xi Yi Zi         1 −vi Xi        −vi Yi       −vi Zi 1   22
                                                                                  
                                                                                  
             .  .  .  .        .   .             .            .    .   H23
                                                                                
        
            .
             .  .
                .  .
                   .  .
                      .        .
                               .   .
                                   .             .
                                                 .            .
                                                              .    . 
                                                                   .   H31
                                                                                   
                                                                                   
                                                                                  
        
           Xn Yn Z n 1        0 −un Xn −un Yn              −un Zn 1   H32
                                                                     
                                                                                   
                                                                                   
            0 Xn Yn Zn         1 −vn Xn −vn Yn              −vn Zn 1     H33
                                        C                                      H

     Donde C es una matriz de 2n × 9. La variable n representa al n´mero de puntos.
                                                                    u
Para resolver el sistema homog´neo de la ecuaci´n 3.32 son necesarios al menos ocho
                                  e               o
puntos para la matriz C . A trav´s de los autovalores y los autovectores de la matriz
                                     e
sim´trica C T C , se hallan los par´metros de la matriz H .
   e                                a

      Debido a la existencia de ruido, el punto xi ha sido movido de su posici´n inicial,
                                                                              o
por lo que, a trav´s de la siguiente funci´n, se minimiza el problema.
                  e                       o

                                                              2
                                        minH   i   xi − xi
                                                        ˇ                                    (3.34)

Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP
        ıa      a                              o                                                32
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA
RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA

Más contenido relacionado

Destacado (20)

Google analytics
Google analyticsGoogle analytics
Google analytics
 
Pres3
Pres3Pres3
Pres3
 
Globalizacion y redes agroalimentarias
Globalizacion y redes agroalimentariasGlobalizacion y redes agroalimentarias
Globalizacion y redes agroalimentarias
 
Gandhi
GandhiGandhi
Gandhi
 
Diapositivas de diana yolima paya malagón
Diapositivas de diana yolima paya malagónDiapositivas de diana yolima paya malagón
Diapositivas de diana yolima paya malagón
 
Power poin tecnologia 4
Power poin tecnologia 4Power poin tecnologia 4
Power poin tecnologia 4
 
nancy tejeda
 nancy tejeda nancy tejeda
nancy tejeda
 
Reformas al reglamento Interno de la Asamblea Legislativa
Reformas al reglamento Interno de la Asamblea LegislativaReformas al reglamento Interno de la Asamblea Legislativa
Reformas al reglamento Interno de la Asamblea Legislativa
 
Agenda 37 comisión de hacienda 18de febrero
Agenda 37 comisión de hacienda 18de febreroAgenda 37 comisión de hacienda 18de febrero
Agenda 37 comisión de hacienda 18de febrero
 
Admiten denuncia contra Marcos Rodríguez por difamación
Admiten denuncia contra Marcos Rodríguez por difamaciónAdmiten denuncia contra Marcos Rodríguez por difamación
Admiten denuncia contra Marcos Rodríguez por difamación
 
Social Media in der Krise
Social Media in der KriseSocial Media in der Krise
Social Media in der Krise
 
DAG WS
DAG WSDAG WS
DAG WS
 
DVNT WOMENS WINTER 2015 - FIGHT FOR YOUR RIOT - FORWEB
DVNT WOMENS WINTER 2015 - FIGHT FOR YOUR RIOT - FORWEBDVNT WOMENS WINTER 2015 - FIGHT FOR YOUR RIOT - FORWEB
DVNT WOMENS WINTER 2015 - FIGHT FOR YOUR RIOT - FORWEB
 
La licitación de obra oficial en Castilla y León
La licitación de obra oficial en Castilla y LeónLa licitación de obra oficial en Castilla y León
La licitación de obra oficial en Castilla y León
 
Quim2unidad1
Quim2unidad1Quim2unidad1
Quim2unidad1
 
Eco y pol
Eco y polEco y pol
Eco y pol
 
Inbound Marketing - Conceptos Generales
Inbound Marketing - Conceptos GeneralesInbound Marketing - Conceptos Generales
Inbound Marketing - Conceptos Generales
 
Citas 26
Citas 26Citas 26
Citas 26
 
Miele event
Miele eventMiele event
Miele event
 
Desarrollo Sostenible
Desarrollo SostenibleDesarrollo Sostenible
Desarrollo Sostenible
 

Similar a RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA

Linear & Logistic Regression Analysis.
Linear & Logistic Regression Analysis.Linear & Logistic Regression Analysis.
Linear & Logistic Regression Analysis.Pablo Vargas Ibarra
 
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...CIMAT
 
Detección de Bordes Tumorales Mediante Contornos Activos (Snake) y Caracteriz...
Detección de Bordes Tumorales Mediante Contornos Activos (Snake) y Caracteriz...Detección de Bordes Tumorales Mediante Contornos Activos (Snake) y Caracteriz...
Detección de Bordes Tumorales Mediante Contornos Activos (Snake) y Caracteriz...Aileen Quintana
 
Tesis claudiacruzmtz
Tesis claudiacruzmtzTesis claudiacruzmtz
Tesis claudiacruzmtzkeaton22
 
Teaching tool for searching algorithms in artificial intelligence
Teaching tool for searching algorithms in artificial intelligenceTeaching tool for searching algorithms in artificial intelligence
Teaching tool for searching algorithms in artificial intelligenceJosé Carlos Martínez Velázquez
 
Construccycontrol
ConstruccycontrolConstruccycontrol
Construccycontrolsgcskyone
 
Sistemas operativos -_luis_la_red_martinez
Sistemas operativos -_luis_la_red_martinezSistemas operativos -_luis_la_red_martinez
Sistemas operativos -_luis_la_red_martinezHarold Velez
 
Sistemaoperativos lared-martinez
Sistemaoperativos lared-martinezSistemaoperativos lared-martinez
Sistemaoperativos lared-martinezDouglas Crampton
 
Mi proyecto de pre-tesis
Mi proyecto de pre-tesisMi proyecto de pre-tesis
Mi proyecto de pre-tesisErwin Salas
 
Estimacion de la orientacion de un cuerpo rigido: Estudio experimental compar...
Estimacion de la orientacion de un cuerpo rigido: Estudio experimental compar...Estimacion de la orientacion de un cuerpo rigido: Estudio experimental compar...
Estimacion de la orientacion de un cuerpo rigido: Estudio experimental compar...Edwin Rosario Gabriel
 
Introducción a la_neuro_computación
Introducción a la_neuro_computaciónIntroducción a la_neuro_computación
Introducción a la_neuro_computaciónAlex Pin
 
Algoritmo Iterativo Eficiente para el Análisis de Interferogramas con Corrimi...
Algoritmo Iterativo Eficiente para el Análisis de Interferogramas con Corrimi...Algoritmo Iterativo Eficiente para el Análisis de Interferogramas con Corrimi...
Algoritmo Iterativo Eficiente para el Análisis de Interferogramas con Corrimi...Sotero Ordones
 
Sistema de posicionamiento de objetos mediante visión estéreo embarcable en v...
Sistema de posicionamiento de objetos mediante visión estéreo embarcable en v...Sistema de posicionamiento de objetos mediante visión estéreo embarcable en v...
Sistema de posicionamiento de objetos mediante visión estéreo embarcable en v...Jorge Tarlea
 
Tesis Licenciatura
Tesis LicenciaturaTesis Licenciatura
Tesis LicenciaturaCIMAT
 

Similar a RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA (20)

Tfm ignacio-arriola
Tfm ignacio-arriolaTfm ignacio-arriola
Tfm ignacio-arriola
 
Patrones
PatronesPatrones
Patrones
 
doc
docdoc
doc
 
Linear & Logistic Regression Analysis.
Linear & Logistic Regression Analysis.Linear & Logistic Regression Analysis.
Linear & Logistic Regression Analysis.
 
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
Algoritmo de Reconocimiento de Objetos en Escenas Complejas para Aplicaciones...
 
Detección de Bordes Tumorales Mediante Contornos Activos (Snake) y Caracteriz...
Detección de Bordes Tumorales Mediante Contornos Activos (Snake) y Caracteriz...Detección de Bordes Tumorales Mediante Contornos Activos (Snake) y Caracteriz...
Detección de Bordes Tumorales Mediante Contornos Activos (Snake) y Caracteriz...
 
Aspecto caracteristicas
Aspecto caracteristicasAspecto caracteristicas
Aspecto caracteristicas
 
Análisis Espacial con R
Análisis Espacial con RAnálisis Espacial con R
Análisis Espacial con R
 
Tesis claudiacruzmtz
Tesis claudiacruzmtzTesis claudiacruzmtz
Tesis claudiacruzmtz
 
Teaching tool for searching algorithms in artificial intelligence
Teaching tool for searching algorithms in artificial intelligenceTeaching tool for searching algorithms in artificial intelligence
Teaching tool for searching algorithms in artificial intelligence
 
Construccycontrol
ConstruccycontrolConstruccycontrol
Construccycontrol
 
TrabajoEspecialdeGrado
TrabajoEspecialdeGradoTrabajoEspecialdeGrado
TrabajoEspecialdeGrado
 
Sistemas operativos -_luis_la_red_martinez
Sistemas operativos -_luis_la_red_martinezSistemas operativos -_luis_la_red_martinez
Sistemas operativos -_luis_la_red_martinez
 
Sistemaoperativos lared-martinez
Sistemaoperativos lared-martinezSistemaoperativos lared-martinez
Sistemaoperativos lared-martinez
 
Mi proyecto de pre-tesis
Mi proyecto de pre-tesisMi proyecto de pre-tesis
Mi proyecto de pre-tesis
 
Estimacion de la orientacion de un cuerpo rigido: Estudio experimental compar...
Estimacion de la orientacion de un cuerpo rigido: Estudio experimental compar...Estimacion de la orientacion de un cuerpo rigido: Estudio experimental compar...
Estimacion de la orientacion de un cuerpo rigido: Estudio experimental compar...
 
Introducción a la_neuro_computación
Introducción a la_neuro_computaciónIntroducción a la_neuro_computación
Introducción a la_neuro_computación
 
Algoritmo Iterativo Eficiente para el Análisis de Interferogramas con Corrimi...
Algoritmo Iterativo Eficiente para el Análisis de Interferogramas con Corrimi...Algoritmo Iterativo Eficiente para el Análisis de Interferogramas con Corrimi...
Algoritmo Iterativo Eficiente para el Análisis de Interferogramas con Corrimi...
 
Sistema de posicionamiento de objetos mediante visión estéreo embarcable en v...
Sistema de posicionamiento de objetos mediante visión estéreo embarcable en v...Sistema de posicionamiento de objetos mediante visión estéreo embarcable en v...
Sistema de posicionamiento de objetos mediante visión estéreo embarcable en v...
 
Tesis Licenciatura
Tesis LicenciaturaTesis Licenciatura
Tesis Licenciatura
 

Último

Actividad 14_ Diseño de Algoritmos Paralelos.pdf
Actividad 14_ Diseño de Algoritmos Paralelos.pdfActividad 14_ Diseño de Algoritmos Paralelos.pdf
Actividad 14_ Diseño de Algoritmos Paralelos.pdfalejandrogomezescoto
 
Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...
Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...
Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...RaymondCode
 
Inteligencia artificial dentro de la contabilidad
Inteligencia artificial dentro de la contabilidadInteligencia artificial dentro de la contabilidad
Inteligencia artificial dentro de la contabilidaddanik1023m
 
Los mejores simuladores de circuitos electrónicos.pdf
Los mejores simuladores de circuitos electrónicos.pdfLos mejores simuladores de circuitos electrónicos.pdf
Los mejores simuladores de circuitos electrónicos.pdfodalistar77
 
Matriz de integración de tecnologías- Paola Carvajal.docx
Matriz de integración de tecnologías- Paola Carvajal.docxMatriz de integración de tecnologías- Paola Carvajal.docx
Matriz de integración de tecnologías- Paola Carvajal.docxPaolaCarolinaCarvaja
 
TENDENCIAS DE IA Explorando el futuro de la tecnologia.pdf
TENDENCIAS DE IA Explorando el futuro de la tecnologia.pdfTENDENCIAS DE IA Explorando el futuro de la tecnologia.pdf
TENDENCIAS DE IA Explorando el futuro de la tecnologia.pdfJoseAlejandroPerezBa
 
Hazte partner: Club Festibity 2024 - 2025
Hazte partner: Club Festibity 2024 - 2025Hazte partner: Club Festibity 2024 - 2025
Hazte partner: Club Festibity 2024 - 2025Festibity
 
VIDEOS DE APOYO.docx E
VIDEOS DE APOYO.docx                                  EVIDEOS DE APOYO.docx                                  E
VIDEOS DE APOYO.docx Emialexsolar
 
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdf
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdfInmersión global en ciberseguridad e IA en la conferencia RSA.pdf
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdfOBr.global
 
De Código a Ejecución: El Papel Fundamental del MSIL en .NET
De Código a Ejecución: El Papel Fundamental del MSIL en .NETDe Código a Ejecución: El Papel Fundamental del MSIL en .NET
De Código a Ejecución: El Papel Fundamental del MSIL en .NETGermán Küber
 
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdfPresentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdfymiranda2
 
El diseño de Algoritmos Paralelos.pdf - analisis de algortimos
El diseño de Algoritmos Paralelos.pdf - analisis de algortimosEl diseño de Algoritmos Paralelos.pdf - analisis de algortimos
El diseño de Algoritmos Paralelos.pdf - analisis de algortimosLCristinaForchue
 

Último (14)

Actividad 14_ Diseño de Algoritmos Paralelos.pdf
Actividad 14_ Diseño de Algoritmos Paralelos.pdfActividad 14_ Diseño de Algoritmos Paralelos.pdf
Actividad 14_ Diseño de Algoritmos Paralelos.pdf
 
Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...
Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...
Actividad 14: Diseño de Algoritmos Paralelos Actividad 14: Diseño de Algoritm...
 
BEDEC Sostenibilidad, novedades 2024 - Laura Silva
BEDEC Sostenibilidad, novedades 2024 - Laura SilvaBEDEC Sostenibilidad, novedades 2024 - Laura Silva
BEDEC Sostenibilidad, novedades 2024 - Laura Silva
 
Inteligencia artificial dentro de la contabilidad
Inteligencia artificial dentro de la contabilidadInteligencia artificial dentro de la contabilidad
Inteligencia artificial dentro de la contabilidad
 
BEDEC Proyecto y obra , novedades 2024 - Xavier Folch
BEDEC Proyecto y obra , novedades 2024 - Xavier FolchBEDEC Proyecto y obra , novedades 2024 - Xavier Folch
BEDEC Proyecto y obra , novedades 2024 - Xavier Folch
 
Los mejores simuladores de circuitos electrónicos.pdf
Los mejores simuladores de circuitos electrónicos.pdfLos mejores simuladores de circuitos electrónicos.pdf
Los mejores simuladores de circuitos electrónicos.pdf
 
Matriz de integración de tecnologías- Paola Carvajal.docx
Matriz de integración de tecnologías- Paola Carvajal.docxMatriz de integración de tecnologías- Paola Carvajal.docx
Matriz de integración de tecnologías- Paola Carvajal.docx
 
TENDENCIAS DE IA Explorando el futuro de la tecnologia.pdf
TENDENCIAS DE IA Explorando el futuro de la tecnologia.pdfTENDENCIAS DE IA Explorando el futuro de la tecnologia.pdf
TENDENCIAS DE IA Explorando el futuro de la tecnologia.pdf
 
Hazte partner: Club Festibity 2024 - 2025
Hazte partner: Club Festibity 2024 - 2025Hazte partner: Club Festibity 2024 - 2025
Hazte partner: Club Festibity 2024 - 2025
 
VIDEOS DE APOYO.docx E
VIDEOS DE APOYO.docx                                  EVIDEOS DE APOYO.docx                                  E
VIDEOS DE APOYO.docx E
 
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdf
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdfInmersión global en ciberseguridad e IA en la conferencia RSA.pdf
Inmersión global en ciberseguridad e IA en la conferencia RSA.pdf
 
De Código a Ejecución: El Papel Fundamental del MSIL en .NET
De Código a Ejecución: El Papel Fundamental del MSIL en .NETDe Código a Ejecución: El Papel Fundamental del MSIL en .NET
De Código a Ejecución: El Papel Fundamental del MSIL en .NET
 
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdfPresentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
Presentación - Diseño de Algoritmos Paralelos - Grupo 2.pdf
 
El diseño de Algoritmos Paralelos.pdf - analisis de algortimos
El diseño de Algoritmos Paralelos.pdf - analisis de algortimosEl diseño de Algoritmos Paralelos.pdf - analisis de algortimos
El diseño de Algoritmos Paralelos.pdf - analisis de algortimos
 

RECONSTRUCCIÓN VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA

  • 1. ´ RECONSTRUCCION VISUAL 3-D : UNA PERSPECTIVA DEL SISTEMA Guillermo Enrique Medina Zegarra Orientador : Dr. Edgar Lobaton 1 Co-Orientador : Dr. Nestor Calvo 2 Tesis profesional presentada al Programa Profesional de Ingenier´a Inform´tica (Ciencias de la Computaci´n) ı a o como parte de los requisitos para obtener el T´tulo Pro- ı fesional en Ingenier´a Inform´tica. ı a Universidad Cat´lica San Pablo (UCSP) o Arequipa - Per´u Mayo de 2012 1 http://www.ece.ncsu.edu/people/ejlobato 2 https://plus.google.com/102163044101441746442/about
  • 2. Dedico la presente tesis a Dios, sobre todas las cosas, a mis padres y a mi ma- m´ Beatriz. a
  • 3. Abreviaturas 2D Dos Dimensiones 3D Tres Dimensiones CG Corte de Grafos CNC Correlaci´n Normalizada Cruzada o IMPA Instituto de Matem´tica Pura y Aplicada a NCC Normalized Cross-Correlation PD Programaci´n Din´mica o a SDC Suma de las Diferencias al Cuadrado SVA Suma de los Valores Absolutos TLD Transformaci´n Lineal Directa o 3
  • 4. Agradecimientos Agradezco a Dios, a la Virgen Mar´ y a mi mam´ Beatriz por cuidarme y guiarme a lo ıa a largo de mi vida! Agradezco a mis padres por haberme dado la oportunidad de estudiar en la mejor uni- versidad del pa´ Ellos siempre estuvier´n conmigo en los momentos m´s dif´ ıs. o a ıciles en mi vida personal y profesional. Agradezco a la universidad, por haber contribuido en mi formaci´n profesional y humana, o en la carrera que estar´ pr´ximo a culminar. Porque durante mi estad´ en la universi- e o ıa, dad, ha permitido moldear en m´ un futuro profesional con una excelente formaci´n ı, o integral . Agradezco a la familia Barrios Neyra, por todo el tiempo que me prest´ su c´mara digital o a e instalaciones de su casa, para llevar a cabo la presente investigaci´n. o Agradezco a las siguientes personas: Alex Cuadros, Alfredo Miranda, Alfredo Paz, Carlos Leyton, Christian L´pez del Alamo, Cynthia Pinto, Edgar Lobat´n, Eduardo Tejada, Jes´s o o u Mena, John Branch, Jos´ Corrales-Nieves, Juan Carlos Gutierrez, Julio Guevara, Lu´ e ıs Pareja, Marcel Lazo de la Vega, Nestor Calvo, Olga Senyukova, Regina Ticona y Russell Stimpson por sus sabios consejos, sugerencias y/o cr´ ıticas constructivas. Los enumer´ en e orden alfab´tico seg´n el primer nombre. e u Agradezco a mi jurado: Ana Cuadros, Ernesto Cuadros y Raquel Pati˜o por su paciencia n y comprensi´n en la edici´n del presente documento de tesis, sin su apoyo esto no hubiera o o sido posible.
  • 5. Resumen El modelar una superficie 3D de un objeto a partir de sus dos im´genes a estereosc´picas tiene muchas aplicaciones, tales como: en el campo de los v´ o ıdeo juegos, en la industria del cine y en las simulaciones de vuelo. El proceso se basa en la recuperaci´n de la estructura 3D a partir de dos reproyecciones. o Una ventaja de generar un modelo de superficie, es permitir la manipulaci´n o de los datos en un espacio tridimensional (por ejemplo, girar el objeto o crear deformaciones del mismo) a fin de generar nuevos puntos de vista. Una arquitectura f´ısica simple fue dise˜ada y creada, para llegar a con- n seguir la reconstrucci´n de la superficie de un objeto en donde la secuencia de o pasos fue la siguiente: calibraci´n de las c´maras a trav´s del m´todo de Zheng- o a e e you Zhang, para obtener la matriz de mapeamiento; rectificaci´n de ambas o im´genes, (vistas laterales), para conseguir una alineaci´n de las mismas; ha- a o llar los puntos correspondientes con la correlaci´n normalizada cruzada (CNC) o de ambas vistas laterales rectificadas; crear la nube de puntos a partir de la triangulaci´n (intersecci´n) de los puntos correspondientes hallados en las dos o o im´genes rectificadas; crear la superficie de la nube de puntos a partir de la a triangulaci´n de Delaunay del mapa de disparidad procesado y, finalmente, o mapear la textura de la imagen derecha rectificada a la superficie creada de la triangulaci´n de Delaunay del mapa de disparidad procesado. o
  • 6. Abstract Modeling a 3D surface of an object through two stereo images has many applications, such as: video games, movie flight simulation. The process is ba- sed on the recovery of 3D structure from two reprojection. One advantage of generating a surface model is to allow manipulation of data in three dimensio- nal space ( i.e., rotate the object or create distortions ) to generate new points of view. A simple physical architecture was designed and created to be able to get the reconstruction of the surface of an object where the sequence of steps was as follows: calibration of the cameras with the Zhengyou Zhang method to obtain the mapping matrix; rectification of both images (side views) to achieve an alignment of the same; find the points corresponding to the normalized cross- correlation (NCC) of the two side views rectified; creating a cloud of points through the triangulation (intersection) of the corresponding points found in the two rectified images; create the surface of the cloud of points from the Delaunay triangulation of the disparity map processed and finally mapping of the texture of the rectified right image to the surface created from the Delaunay triangulation of the processed disparity map.
  • 7. ´ Indice general 1. Introducci´n o 14 1.1. Motivaci´n y contexto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 o 1.2. Planteamiento del Problema . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.3. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.4. Objetivos espec´ ıficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.5. Organizaci´n de la tesis o . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2. Trabajos relacionados 19 2.1. Consideraciones Iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.2. Paradigma est´reo computacional . . . . . . . . . . . . . . . . . . . . . . . 19 e 2.3. Reconstrucci´n 3D de un modelo . . . . . . . . . . . . . . . . . . . . . . . 20 o 2.4. Consideraciones Finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3. Calibraci´n de las c´maras y an´lisis bifocal o a a 22 3.1. Consideraciones Iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3.2. Modelo de c´mara pinhole . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 a 3.3. Calibraci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 o 3.3.1. Par´metros intr´ a ınsecos . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.3.2. Par´metros extr´ a ınsecos . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.3.3. Distorsi´n del lente . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 o 3.4. M´todos de calibraci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 e o 7
  • 8. ´ INDICE GENERAL 3.4.1. El m´todo de Heikkil¨ y Silv´n . . . . . . . . . . . . . . . . . . . . 27 e a e 3.4.2. El m´todo de Zhengyou Zhang . . . . . . . . . . . . . . . . . . . . . 31 e 3.5. Geometr´ epipolar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 ıa 3.5.1. Propiedades de la matriz fundamental F . . . . . . . . . . . . . . . 38 3.6. Consideraciones Finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 4. Reconstrucci´n de una nube de puntos a partir de dos vistas o 39 4.1. Consideraciones Iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 4.2. El problema de correspondencia . . . . . . . . . . . . . . . . . . . . . . . . 39 4.3. Tipos de restricciones de correspondecia . . . . . . . . . . . . . . . . . . . 40 4.4. T´cnicas de correspondencia . . . . . . . . . . . . . . . . . . . . . . . . . . 40 e 4.4.1. Block matching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.5. Rectificaci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 o 4.6. C´lculo de disparidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 a 4.7. Consideraciones Finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 5. Propuesta 47 5.1. Consideraciones Iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 5.2. Pipeline de la propuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 5.3. Consideraciones Finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 6. Pruebas y resultados 50 6.1. Componentes del sistema de visi´n est´reo . . . . . . . . . . . . . . . . . . 50 o e 6.1.1. Arquitectura f´ ısica para dos c´maras digitales . . . . . . . . . . . . 51 a 6.1.2. Calibraci´n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 o 6.2. Resultados con dos c´maras . . . . . . . . . . . . . . . . . . . . . . . . . . 53 a 6.3. Limitaciones y problemas encontrados . . . . . . . . . . . . . . . . . . . . 59 Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 8
  • 9. ´ INDICE GENERAL 7. Conclusiones y Trabajos Futuros 61 7.1. Recomendaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 7.2. Trabajos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 Ap´ndices e 63 A. Caracter´ ısticas t´cnicas de las dos c´maras digitales e a 64 B. Posiciones del tablero de ajedrez 67 C. Triangulaci´n de Delaunay en el plano 2D o 69 Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 9
  • 10. ´ Indice de cuadros 4.1. Medidas de semejanza en Block Matching . . . . . . . . . . . . . . . . . . . 41 6.1. Par´metros usados para la reconstrucci´n de cada uno de los modelos. . . . 50 a o 6.2. Ajustes t´cnicos en las dos c´maras digitales. . . . . . . . . . . . . . . . . . 51 e a A.1. Cuadros comparativos de las caracter´ ıstica t´cnicas entre las dos c´maras e a digitales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 A.2. Caracter´ ısticas de la imagen. . . . . . . . . . . . . . . . . . . . . . . . . . . 64 A.3. Caracter´ ısticas de la exposici´n. . . . . . . . . . . . . . . . . . . . . . . . . 65 o A.4. Caracter´ ısticas de la ´ptica. . . . . . . . . . . . . . . . . . . . . . . . . . . 65 o A.5. Caracter´ ısticas del flash. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 A.6. Caracter´ ısticas del control del disparo. . . . . . . . . . . . . . . . . . . . . 65 A.7. Caracter´ ısticas de la visualizaci´n. . . . . . . . . . . . . . . . . . . . . . . . 66 o A.8. Caracter´ ısticas f´ ısicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 10
  • 11. ´ Indice de figuras 1.1. Pintura pre-renacentista y renacentista. (a) Jes´s entrando a Jerusal´n y u e (b) La Escuela de Atenas [Ma et al., 2004]. . . . . . . . . . . . . . . . . . . 14 1.2. M´quina de perspectiva [Faugeras, 1993] . . . . . . . . . . . . . . . . . . . 15 a 1.3. (a) Dos vistas y (b) m´ltiples vistas [Hartley and Zisserman, 2004]. . . . . 15 u 1.4. (a) Posici´n de una sola c´mara; (b) iluminaci´n artificial para la adquisi- o a o ci´n de im´genes y (c) posici´n de m´ltiples c´maras [Zitnick et al., 2004]. o a o u a 16 1.5. ¿C´mo hallar los puntos correspondientes? [Szeliski, 2011]. . . . . . . . . . 17 o 3.1. Modelo de c´mara pinhole frontal [Ma et al., 2004] . . . . . . . . . . . . . 23 a 3.2. Modelo de c´mara pinhole [Ma et al., 2004] . . . . . . . . . . . . . . . . . . 24 a 3.3. Proyecci´n de perspectiva de un cuadrado [Bakstein., 1999] . . . . . . . . . 26 o 3.4. Proyecci´n de perspectiva de un c´ o ırculo [Heikkil¨ and Silv´n, 1997] a e . . . . 29 3.5. Analisis geom´trico de dos vistas [Ma et al., 2004] . . . . . . . . . . . . . . 36 e 4.1. Las Figuras 4.1a y 4.1b de la primer fila son las im´genes originales del a sistema de visi´n est´reo; las Figuras 4.1c y 4.1d son las im´genes rectifi- o e a cadas. Los c´ırculos de color rojo representan a los puntos correspondientes de ambos planos imagen y las l´ ıneas de color azul a las l´ ıneas epipolares [Fusiello et al., 2000]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.2. (a) y (b) son el par de im´genes correspondientes de Tsukuba y (c) mapa de a disparidad de ambas im´genes correspondientes [Scharstein and Szeliski, 2002]. 45 a 5.1. Pipeline de la propuesta de tesis. . . . . . . . . . . . . . . . . . . . . . . . 47 6.1. (a) Distancias entre las dos c´maras digitales y (b) dos tornillos, cuatro a volandas y dos mariposas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 11
  • 12. ´ INDICE DE FIGURAS 6.2. (a) Posici´n frontal de ambas c´maras digitales y (b) visor de las dos c´- o a a maras laterales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 6.3. Dos posiciones del tablero de ajedrez. . . . . . . . . . . . . . . . . . . . . . 52 6.4. (a) Selecci´n de las cuatro esquinas de la Figura 6.3a; (b) detecci´n de los o o puntos internos de la Figura 6.3b. . . . . . . . . . . . . . . . . . . . . . . . 52 6.5. (a) y (b) im´genes originales del par est´reo, (c) y (d) im´genes rectificadas, a e a (e) y (f) im´genes pre-procesadas. . . . . . . . . . . . . . . . . . . . . . . . 53 a 6.6. (a) Mapa de disparidad procesado, (b) nube de puntos, (c) enmallado tri- dimensional, (d) creaci´n de la superficie. . . . . . . . . . . . . . . . . . . . 54 o 6.7. (a) Suavizamiento de la superficie, (b) texturizaci´n de la superficie, (c) o vista de costado de la superficie texturizada. . . . . . . . . . . . . . . . . . 54 6.8. (a) y (b) im´genes originales del par est´reo, (c) y (d) im´genes rectificadas, a e a (e) y (f) im´genes pre-procesadas. . . . . . . . . . . . . . . . . . . . . . . . 55 a 6.9. (a) Mapa de disparidad procesado, (b) nube de puntos, (c) enmallado tri- dimensional, (d) creaci´n de la superficie. . . . . . . . . . . . . . . . . . . . 56 o 6.10. (a) Suavizamiento de la superficie, (b) texturizaci´n de la superficie, (c) o vista de costado de la superficie texturizada. . . . . . . . . . . . . . . . . . 56 6.11. (a) y (b) im´genes originales del par est´reo, (c) y (d) im´genes rectificadas, a e a (e) y (f) im´genes pre-procesadas. . . . . . . . . . . . . . . . . . . . . . . . 57 a 6.12. (a) Mapa de disparidad procesado, (b) nube de puntos, (c) enmallado tri- dimensional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 6.13. (a) Vista del costado del rostro sin suavizar, (b) vista de frente del rostro sin suavizar, (c) vista del costado del rostro suavizado, (d) vista de frente del rostro suavizado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 6.14. (a) Reducci´n del ancho del rostro humano sin texturizar, (b) reducci´n o o del ancho del rostro texturizado, (c) vista frontal del rostro sin texturizar y (d) vista frontal del rostro texturizaci´n. . . . . . . . . . . . . . . . . . . 59 o 6.15. (a) Reconstrucci´n fallida del “cubo m´gico” y (b) fen´meno de “gradas” o a o en la reconstrucci´n de la superficie del modelo del “cubo m´gico”. . . . . . 59 o a 6.16. (a) y (b) Im´genes originales defectuosas, (c) mapa de disparidad err´neo a o y (d) reconstrucci´n 3D amorfa del “cubo m´gico”. . . . . . . . . . . . . . . 60 o a B.1. Treinta posiciones de tablero de calibraci´n. . . . . . . . . . . . . . . . . . 67 o B.0. Treinta posiciones de tablero de calibraci´n (cont...) . . . . . . . . . . . . . 68 o Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 12
  • 13. ´ INDICE DE FIGURAS C.1. Conjunto de puntos (v´rtices) de P . . . . . . . . . . . . . . . . . . . . . . . 69 e C.2. Ilustraci´n de la primera propiedad de Delaunay. o . . . . . . . . . . . . . . 70 C.3. Ilustraci´n de la segunda propiedad de Delaunay. . . . . . . . . . . . . . . 70 o C.4. (a) Arista ilegal y (b) correcci´n de la arista ilegal. . . . . . . . . . . . . . 71 o Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 13
  • 14. Cap´ ıtulo 1 Introducci´n o 1.1. Motivaci´n y contexto o En el mundo de las Bellas Artes (Arquitectura, Pintura, Escultura y M´sica) hasta u la ´poca del Renacimiento (Siglo XVI), los artistas no pod´ dibujar en un cuadro la e ıan profundidad de una escena, porque no hab´ los m´todos necesarios para lograrlo, al no ıan e existir las t´cnicas para conseguir la tridimensionalidad de una escena en una pintura. e Filippo Brunelleschi, Piero della Francesca, Leonardo da Vinci [DaVinci, 2005] y Albert Durer, llevaron a cabo investigaciones sobre c´mo la visi´n del ojo humano observaba a o o un objeto. Dando origen a los puntos de fuga y a la m´quina de perspectiva [Mery, 2004]. a En la Figura 1.1a se puede ver una pintura pre-renacentista sin un efecto 3D y en la Figura 1.1b se observa que las l´ ıneas de color celeste convergen en un punto de fuga, lo cual hace que la pintura tenga profundidad. Los puntos de fuga son rayos imaginarios que llegan a converger en un solo punto. (a) (b) Figura 1.1: Pintura pre-renacentista y renacentista. (a) Jes´s entrando a Jerusal´n y (b) u e La Escuela de Atenas [Ma et al., 2004]. 14
  • 15. CAP´ ITULO 1. Introducci´n o En la Figura 1.2, se puede observar la m´quina de perspectiva, en donde, se visualiza a con claridad un punto fijo (punto de fuga), que corresponde a los ojos del artista, en el cual, convergen todos los rayos (l´ ıneas de color rojo) del objeto. Tambi´n se puede ver un e plano que sirve de ayuda al dibujante, para hallar la relaci´n con el objeto. o Figura 1.2: M´quina de perspectiva [Faugeras, 1993] a Una de las funciones del cerebro humano es crear un escenario en 3D con la infor- maci´n que percibe de ambos ojos. Llevar a cabo dicho proceso se conoce como visi´n o o estereosc´pica [Forsyth and J., 2002] y el area cient´ o ´ ıfica encargada, se conoce como visi´n o computacional [Faugeras, 1993] [Cipolla et al., 2010]. Un ejemplo cl´sico, para ver la di- a ferencia que percibe cada ojo, es situar el dedo ´ındice de cualquiera de sus dos manos a una distancia no mayor de 5 cm. delante de su entrecejo, seguidamente cierra los dos ojos y alternativamente abre y cierra cada ojo. Se observar´ que cada ojo tiene una percepci´n a o un poco distinta del dedo ´ ındice y que la distancia entre cada uno de los ojos es conocida como disparidad binocular [Wildes, 1991]. La visi´n computacional puede reconstruir modelos [Vasudevan et al., 2011] a trav´s o e de dos, tres, cuatro o m´ltiples vistas [Ma et al., 2004] [Hartley and Zisserman, 2004] de u un mismo objeto; entre m´s im´genes (vistas) exista de un mismo objeto, mejor ser´ la a a a reconstrucci´n. En la Figura 1.3a se puede ver la nube de puntos de dos im´genes est´reo o a e tomadas a un edificio, y en la Figura 1.3b, se observa otra nube de puntos de un dinosaurio. Dado que el segundo objeto, el dinosaurio, tiene m´ltiples im´genes o vistas, la nube de u a puntos del dinosaurio es mucho mejor a diferencia del primer objeto (el edificio). (a) (b) Figura 1.3: (a) Dos vistas y (b) m´ltiples vistas [Hartley and Zisserman, 2004]. u Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 15
  • 16. 1.1. Motivaci´n y contexto o Cada una de las vistas puede representar a la misma c´mara o a diferentes c´maras. a a Cada c´mara debe estar correctamente posicionada y adecuadamente distribuida en una a arquitectura f´ısica [Cipolla et al., 2010]. La posici´n de cada c´mara es muy importante o a porque tiene informaci´n de la proyecci´n del objeto a reconstruir. La iluminaci´n na- o o o tural o artificial es otro de los problemas en la reconstrucci´n 3D de un modelo, porque o determina la intensidad de luz sobre la superfice del objeto. En la Figura 1.4a se puede ver una imagen representativa de una sola c´mara que to- a ma varias im´genes a un buda, que est´ encima de una superficie plana giratoria. El buda a a tiene como fuente de iluminaci´n a un foco. En la Figura 1.4b se visualiza la iluminaci´n o o artificial para la adquisici´n de im´genes del laboratorio de fotograf´ computacional y v´ o a ıa ı- deo del Instituto de Matem´tica Pura y Aplicada (IMPA) [VISGRAF., 2012]. En la Figura a 1.4c se observa la posici´n y distribuci´n de m´ltiples c´maras sobre otro arquitectura o o u a f´ ısica [Zitnick et al., 2004]. (a) (b) (c) Figura 1.4: (a) Posici´n de una sola c´mara; (b) iluminaci´n artificial para la adquisici´n o a o o de im´genes y (c) posici´n de m´ltiples c´maras [Zitnick et al., 2004]. a o u a Una de las ventajas de la Figura 1.4a es el uso de una superficie plana giratoria debajo del objeto (buda). El uso de la superficie plana giratoria facilita una mayor preci- si´n en el ´ngulo de giro del buda. Una desventaja de la Figura 1.4a es el uso de un solo o a foco hacia la superficie del objeto. El uso de una sola buj´ es un inconveniente, porque ıa no tiene una adecuada iluminaci´n sobre toda la superficie del objeto a reconstruir, dado o Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 16
  • 17. CAP´ ITULO 1. Introducci´n o que la distribuci´n de la iluminaci´n no es la correcta. En la Figura 1.4b hay una correcta o o iluminaci´n, porque se puede observar que hay un ambiente controlado con cuatro reflec- o tores, que est´n encerrados con un c´ a ırculo de color verde. Otra ventaja de la Figura 1.4b es el uso de una franela de color negra, que est´ encerrado con un cuadrado de color rojo. a El uso de los cuatro reflectores y la franela negra ayudan bastante en el proceso de adqui- sici´n de im´genes [Barnard and Fischler, 1982] [Gonz´lez and Woods, 1996], porque no o a a s´lo se tiene una adecuada iluminaci´n, sino que tambi´n, el uso de la franela negra ayuda o o e a eliminar el background del objeto a reconstruir. En la Figura 1.4c se puede ver que dos tr´ ıpodes sujetan a ocho c´maras a trav´s de un pedazo de fierro. Al lado izquierdo de a e cada c´mara existe un cable, con el cual se logra la sincronicidad de las ocho c´maras en a a un solo instante de tiempo, consiguiendo con ello, tener varias vista del objeto a recons- truir [Hartley and Zisserman, 2004]. Por lo tanto se concluye que es necesario tener una adecuada arquitectura f´ ısica para el correcto posicionamiento, distribuci´n e iluminaci´n o o de la(s) c´mara(s). a 1.2. Planteamiento del Problema Un primer problema para la reconstrucci´n 3D de un modelo es dise˜ar y crear o n una arquitectura f´ısica para la correcta ubicaci´n e ideal distribuci´n de cada c´mara. o o a Por lo que, en la presente investigaci´n, se desea ubicar adecuadamente ambas c´maras o a sobre una arquitectura f´ısica, para la correcta adquisici´n [Barnard and Fischler, 1982] del o par de im´genes estereosc´picas. Se debe de tomar en cuenta una adecuada iluminaci´n a o o artificial o natural para el proceso de adquisici´n de im´genes. Un segundo problema es o a la calibraci´n de las c´maras [Salvi et al., 2002], lo que significa obtener los par´metros o a a necesarios [Heikkil¨ and Silv´n, 1997] para realizar el mapeamiento de un objeto al plano a e imagen. En la Figura 1.5 se observa que el tercer problema, para la reconstrucci´n 3D de un o modelo, es saber c´mo hallar los puntos correspondientes [Szeliski, 2011] del par de im´- o a genes estereosc´picas. Llevar a cabo la correspondencia de los puntos correspondientes, es o un problema demasiado ambiguo y complejo [Forsyth and J., 2002], porque no es sencillo determinar con precisi´n la correspondencia de dichos puntos, debido a la variaci´n de la o o intensidad luminosa, oclusi´n, ruido o textura [Cochran and Medioni, 1992]. o Figura 1.5: ¿C´mo hallar los puntos correspondientes? [Szeliski, 2011]. o Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 17
  • 18. 1.3. Objetivo general Un m´todo estad´ e ıstico est´ndar [Mulligan and Daniilidis, 2001], en la b´squeda de a u similitudes de dos im´genes estereosc´picas, es la Correlaci´n Normalizada Cruzada (CNC) a o o [Ma et al., 2004]. Un cuarto problema es hallar la posici´n correcta de ambos puntos 2D correspon- o dientes en el espacio 3D (proceso de rectificaci´n y triangulaci´n) [Fusiello et al., 2000] o o [Hartley and Sturm, 1997]. El quinto problema es reconstruir [W¨hler, 2009] y suavizar o [Piegl and Tiller, 1997] la superficie a partir de la nube de puntos [Linsen, 2001] resultante del problema anterior. 1.3. Objetivo general Proponer un modelo para la reconstrucci´n de una imagen 3D de un objeto, a partir o de dos im´genes capturadas por dos c´maras ubicadas adecuadamente. a a 1.4. Objetivos espec´ ıficos 1. Posicionar correctamente las dos c´maras digitales, en una arquitectura f´ a ısica, para la adquisici´n de im´genes y calibraci´n. o a o 2. Hacer la rectificaci´n de las im´genes, para calcular un adecuado mapa de disparidad o a a trav´s de la Correlaci´n Normalizada Cruzada. e o 3. Crear la superficie del objeto a partir de la triangulaci´n de Delaunay del mapa de o disparidad. 1.5. Organizaci´n de la tesis o En el cap´ ıtulo 2 se hizo una descripci´n sobre el paradigma est´reo computacional o e y las etapas de la reconstrucci´n 3D de un modelo. En el cap´ o ıtulo 3 se habla sobre la calibraci´n de las c´maras y el an´lisis bifocal. En el cap´ o a a ıtulo 4 se comenta sobre la rectificaci´n y el c´lculo de disparidad. En el cap´ o a ıtulo 5 est´ descrita la secuencia de a pasos de la propuesta de tesis. En el cap´ ıtulo 6, se muestran las pruebas y resultados obtenidos de los objetos utilizados. Finalmente, en el cap´ ıtulo 7 est´n las conclusiones, a recomendaciones y trabajos futuros. En el ap´ndice A est´n las caracter´ e a ısticas t´cnicas de las dos c´maras digitales usadas e a en la presente investigaci´n. En el ap´ndice B est´n las treinta posiciones tomadas al o e a tablero de ajedrez, para la calibraci´n de la c´mara. En el ap´ndice C, est´n descritas las o a e a propiedades de la triangulaci´n de Delaunay en el plano 2D. o Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 18
  • 19. Cap´ ıtulo 2 Trabajos relacionados 2.1. Consideraciones Iniciales Con el objetivo de contextualizar, entender los conceptos y trabajos relacionados en la presente investigaci´n, este cap´ o ıtulo se ha dividido en dos secciones. En la primera se des- criben los seis pasos del paradigma est´reo computacional [Barnard and Fischler, 1982]. e En la segunda, se comenta sobre las etapas, en com´n, que tiene la reconstrucci´n 3D de u o un modelo [Hartley and Zisserman, 2004] [Ma et al., 2004] [Koch et al., 2000]. 2.2. Paradigma est´reo computacional e El concepto de la reconstrucci´n 3D a trav´s de la visi´n computacional est´ definido o e o a como la recuperaci´n (reconstrucci´n) de las caracter´ o o ısticas (estructura) tridimensionales de una escena a partir de dos im´genes (vistas) tomadas de diferentes puntos angulares a [Mery, 2004], y en donde el paradigma est´reo computacional [Barnard and Fischler, 1982] e envuelve los siguientes pasos: 1. Adquisici´n de im´genes.- Las im´genes est´reo pueden ser adquiridas o tomadas de o a a e diferentes formas, es decir, pueden variar con respecto al tipo de c´mara (marca), el a n´mero de c´maras, la posici´n de las c´maras, la distancia de las c´maras y la re- u a o a a soluci´n. Estas son algunas de las consideraciones que se deben de tener en cuenta en o el proceso de adquisici´n de las im´genes. La oclusi´n, iluminaci´n y la textura for- o a o o man parte de la complejidad del dominio de la escena [Barnard and Fischler, 1982]. 2. Modelaci´n de las c´maras.- El modelamiento de las c´maras proyecta las caracter´ o a a ıs- ticas geom´tricas y f´ e ısicas del mapeamiento de un punto 3D a coordenadas p´ ıxeles. Seg´n [Weng et al., 2002] el proceso de calibraci´n de una c´mara tiene dos pasos. u o a El primer paso es una transformaci´n lineal, en donde, se hallan los par´metros de la o a c´mara. El segundo paso resuelve el problema no lineal de la distorsi´n [Tsai, 1987]. a o 19
  • 20. 2.3. Reconstrucci´n 3D de un modelo o 3. Selecci´n de caracter´ o ısticas.- Consiste en eligir a los candidatos de una imagen de acuerdo a sus atributos geom´tricos, intensidad, color o textura en una regi´n, borde e o o p´ [Ma et al., 2004] [Barnard and Fischler, 1982]. ıxel 4. B´squeda de correspondencias.- Encontrar los puntos correspondientes o puntos ho- u m´logos [Birchfield., 1998] en un sistema de visi´n est´reo con dos, tres o m´ltiples o o e u vistas es un proceso demasiado complejo y ambiguo, porque no necesariamente se puede hallar el punto hom´logo en la imagen correspondiente. Esto se debe a cau- o sa de los siguientes factores: variaci´n de la intensidad luminosa, oclusi´n, ruido, o o textura de los objetos y/o errores de calibraci´n [Cochran and Medioni, 1992]. o 5. Determinaci´n de la profundidad.- Seguidamente de haber resuelto el problema de la o b´squeda de correspondencia y hallados los puntos hom´logos, la reconstrucci´n del u o o punto tridimensional estar´ dada por la triangulaci´n [Hartley and Sturm, 1997]. a o 6. Interpolaci´n.- Despu´s de haber hallado la profundidad de cada par de puntos o e correspondientes, en el paso anterior. Ahora se puede interpolar ciertas zonas o areas en donde exista una escasez de puntos tridimensionales. ´ 2.3. Reconstrucci´n 3D de un modelo o Shankar Sastry [Ma et al., 2004], Andrew Zisserman [Hartley and Zisserman, 2004] y Marc Pollefeys [Koch et al., 2000] dividen la reconstrucci´n 3D de su modelo en los o siguientes pasos: 1. Calibraci´n.- Paso en el cual se hallan los par´metros necesarios [Salvi et al., 2002] o a para el mapeamiento de un punto 3D al plano imagen. La matriz de mapeamiento o proyecci´n de perspectiva [Hearn and Baker, 1995] de o un punto 3D al plano, se lleva a cabo a trav´s de la matriz de par´metros intr´ e a ınse- cos [Heikkil¨ and Silv´n, 1997] o matriz de calibraci´n [Ma et al., 2004], que son la a e o presentaci´n de las propiedades f´ o ısicas de la c´mara y su optica. Los par´metros de a ´ a la matriz de calibraci´n son: la distancia focal (f ), punto principal (ox , oy ), factor o de torcimiento (sθ ) y los coeficientes para el cambio de unidades m´tricas a p´ e ıxeles. La matriz de par´metros extr´ a ınsecos es la posici´n y orientaci´n de la c´mara con o o a respecto al punto 3D y est´ representada por una matriz de rotaci´n R y una matriz a o de traslaci´n t [Weng et al., 2002] [Zhang, 1999]. o 2. Rectificaci´n.- Seguidamente de haber realizado la calibraci´n de las c´maras y haber o o a hallado la matriz de par´metros intr´ a ınsecos y la matriz de par´metros extr´ a ınsecos, se procede a la rectificaci´n [Fusiello et al., 2000] [Trucco and Verri, 1998] de los o planos imagen del par de im´genes del sistema de visi´n estereosc´pica. a o o Generalmente la rectificaci´n [Fusiello., 1998] se realiza a trav´s del eje horizontal o e con la finalidad de conseguir una alineaci´n del par de l´ o ıneas epipolares correspon- dientes. Haciendo que la b´squeda de correspondencias sea l´ u ıneal y no cuadr´tica a [Cormen et al., 2001]. Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 20
  • 21. CAP´ ITULO 2. Trabajos relacionados Despu´s de haber realizado el proceso de rectificaci´n, el emparejamiento de los e o puntos correspondientes [Szeliski, 2011] [Scharstein and Szeliski, 2002] se realiza en su correspondiente l´ ınea epipolar y no en toda la imagen. 3. C´lculo de disparidad.- Despu´s de haber rectificado al par de im´genes estereos- a e a c´picas, los puntos correspondientes se hallan alineados en forma horizontal, pero o a´n existe una diferencia entre las coordenadas de dichos puntos hom´logos. Esta u o diferencia se llama disparidad [Lecumberry, 2005] [Scharstein and Szeliski, 2002]. 4. Reconstrucci´n 3D.- Despu´s de haber llevado a cabo el c´lculo de disparidad o o e a distancia asociada a los puntos correspondientes del par de im´genes rectificadas del a sistema de visi´n estereosc´pica y, tambi´n haber calculado la matriz de par´metros o o e a intr´ ınsecos y la matriz de par´metros extr´ a ınsecos, entonces, ahora se puede encontrar la localizaci´n de un punto 3D a trav´s de la intersecci´n de dos rectas en el espacio. o e o El proceso de intersecci´n de dos rectas en el espacio, se conoce como triangulaci´n o o [Hartley and Sturm, 1997]. Cada recta representa a la reproyecci´n del mismo punto o 3D en cada plano imagen del mismo sistema de visi´n estereosc´pica. o o 2.4. Consideraciones Finales B´sicamente la reconstrucci´n 3D de un modelo est´ determinada por la calibraci´n, a o a o rectificaci´n, c´lculo de disparidad y finalmente la triangulaci´n de puntos 3D. El para- o a o digma est´reo computacional es el m´s completo en hacer una descripci´n de cada uno e a o de los pasos asociados para la recuperaci´n de la estructura tridimensional de un objeto, o porque tiene una secuencia de pasos bien estructurada y definida. Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 21
  • 22. Cap´ ıtulo 3 Calibraci´n de las c´maras y an´lisis o a a bifocal 3.1. Consideraciones Iniciales Llevar a cabo la proyecci´n de un punto 3D a coordenadas p´ o ıxeles se hace a trav´s e de un conjunto de par´metros, que est´n representados en una matriz de mapeamiento a a [Heikkil¨ and Silv´n, 1997]. Este conjunto de par´metros se divide en intr´ a e a ınsecos y ex- tr´ ınsecos. Los par´metros intr´ a ınsecos est´n relacionados con las propiedades f´ a ısicas de la c´mara y su optica, y los par´metros extr´ a ´ a ınsecos con un movimiento de rotaci´n y o traslaci´n. La geometr´ epipolar [Ma et al., 2004] [Hartley and Zisserman, 2004] permite o ıa entender el an´lisis matem´tico del plano imagen de la c´mara lateral izquierda y el plano a a a imagen de la c´mara lateral derecha del sistema de visi´n est´reo. a o e 3.2. Modelo de c´mara pinhole a El modelo de c´mara pinhole no s´lo es el modelo de c´mara m´s b´sico, sino a o a a a tambi´n, el modelo m´s utilizado en el area de visi´n de computacional, porque ayuda a e a ´ o entender la formaci´n de una imagen desde un punto de vista geom´trico, utilizando la o e proyecci´n de perspectiva. Tambi´n existen otros modelos de c´mara [Mer´., 2008] que no o e a e ser´n tratados en la presente investigaci´n porque no tienen una relaci´n directa con la a o o tesis. El m´delo de c´mara pinhole consiste en un centro optico o en donde convergen o a ´ todos los rayos de la proyecci´n y un plano imagen I, en el cual, la imagen es proyectada. o El plano imagen est´ ubicado a una distancia focal f del centro ´ptico y es perpendicular a o al eje z, como se muestra en la Figura 3.1. Tambi´n se puede observar que, para cualquier e punto arbitrario que est´ dentro de dicha l´ e ınea, su proyecci´n ser´ la misma en el plano o a imagen I. 22
  • 23. CAP´ ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal o a a Figura 3.1: Modelo de c´mara pinhole frontal [Ma et al., 2004] a Sea p un punto cualquiera en 3D, que est´ expresado en coordenadas no homog´neas a e T 3 [Coxeter, 2003] p = [X, Y, Z] ∈ R , ser´ proyectado en el plano imagen I como un a punto 2D x. El punto 2D x tambi´n est´ representado en coordenadas no homog´neas e a e T 2 x = [x, y] ∈ R . El punto x es la intersecci´n de la recta entre el centro ´ptico o y el o o punto p con el plano imagen I. En la ecuaci´n 3.1 se puede observar la representaci´n o o matem´tica de la intersecci´n del centro optico o con el punto p de la Figura 3.1 y la a o ´ notaci´n matem´tica op representa la l´ o a ¯ ınea recta entre el centro optico o y el punto p. ´ x = op ∩ I ¯ (3.1) Dado que el plano cartesiano R2 se identifica como un plano en un espacio vectorial, se puede asociar cualquier punto bidimensional como un vector. Ahora, se usar´ la nota- a ci´n x como la representaci´n de un vector en coordenadas homog´neas [Coxeter, 2003]. o o e Tambi´n se utilizar´ la letra en negrita, para expresar un punto cualquiera como un vector. e a Una de las ventajas de la Geometr´ Proyectiva es el uso de las coordenadas homog´neas ıa e [Coxeter, 2003]. Utilizar coordenadas homog´neas permite colocar un 1 al final del par e ordenado, posibilitando la eficiencia en las rotaciones y traslaciones en las transformacio- nes lineales. En la ecuaci´n 3.2, los puntos x y p est´n en coordenadas homog´nas, y π o a e representa a la matriz de mapeamiento [Ma et al., 2004]. π X       x f 0 0 0 R t  Y  Z y = 0 f 0 0       λ := Z , λ ∈ R+ (3.2) 0 1 Z      1 0 0 1 0 1 x π p La matriz π es la multiplicaci´n de la matriz Kf y la matriz Π0 de la ecuaci´n 3.3. o o En las dos primeras diagonales de la matriz Kf se tiene la distancia focal, y la matriz Π0 Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 23
  • 24. 3.3. Calibraci´n o a menudo es llamada la matriz de proyecci´n est´ndar o matriz de proyecci´n can´nica o a o o [Ma et al., 2004].      f 0 0 0 f 0 0 1 0 0 0 π =  0 f 0 0  =  0 f 0  0 1 0 0       (3.3) 0 0 1 0 0 0 1 0 0 1 0 Kf ×Π0 Kf Π0 Para el caso que el plano imagen I est´ ubicado detr´s de las coordenadas de la e a c´mara pinhole, como se muestra en la Figura 3.2, la distancia focal f de la matriz π de a la ecucaci´n 3.4 ser´ negativa, porque, el plano imagen I est´ ubicado detr´s del eje de o a a a coordenadas de la c´mara. La proyecci´n de cualquier escena u objeto del mundo real, a o ser´ proyectada de forma inversa. a Figura 3.2: Modelo de c´mara pinhole [Ma et al., 2004] a π X       x f 0 0 0 R t  Y  Z y = 0 f 0 0  λ := Z , λ ∈ R+ , f ∈ R− (3.4)       0 1 Z     1 0 0 1 0 1 x π p 3.3. Calibraci´n o La calibraci´n de las c´maras consiste en hallar la matriz de mapeamiento, en- o a tre las coordenadas globales a las coordenadas p´ ıxeles. Dicha matriz de mapeamiento [Ma et al., 2004] o matriz de transformaci´n de perspectiva [Fusiello et al., 2000] tiene o definido los par´metros intr´ a ınsecos y extr´ ınsecos [Mer´., 2008] [Heikkil¨ and Silv´n, 1997] e a e [Tsai, 1987] que son detallados a continuaci´n: o Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 24
  • 25. CAP´ ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal o a a 3.3.1. Par´metros intr´ a ınsecos Debido a que el sistema de medidas de una imagen (coordenadas p´ ıxeles), y el sistema de medidas de un punto homog´neo 2D x (coordenadas m´tricas) proyectado en e e el plano imagen, no son lo mismo, se tiene que hacer una conversi´n entre ambos sistemas o de coordenadas a trav´s de la matriz de los par´metros intr´ e a ınsecos. La matriz de los par´metros intr´ a ınsecos est´ conformado por la distancia focal (f ); el a punto principal (ox , oy ), que es la intersecci´n entre el plano imagen I y el eje z del sistema o de coordenadas de la c´mara; el factor de torcimiento (sθ ) y los coeficientes (sx , sy ), para a el cambio de unidades m´tricas a p´ e ıxeles. La matriz de par´metros intr´ a ınsecos representa a las propiedades f´ ısicas de la c´mara y su optica. a ´ En la ecuaci´n 3.5, se puede observar que la matriz K es la multiplicaci´n de las o o matrices Ks y Kf . La matriz K es la matriz que contiene a los par´metros intr´ a ınsecos. Dicha matriz tambi´n es conocida como matriz de calibraci´n [Ma et al., 2004]. e o      f sx f sθ ox sx sθ o x f 0 0  0 f sy oy  =  0 sy oy   0 f 0  (3.5)      0 0 1 0 0 1 0 0 1 K Ks Kf 3.3.2. Par´metros extr´ a ınsecos Los par´metros extr´ a ınsecos definen el movimiento r´ ıgido de traslaci´n y rotaci´n de o o las coordenadas globales de un punto cualquiera p = (Xi , Yi , Zi ) del objeto, con respecto al centro de coordenadas de la c´mara o=(xi , yi , zi ). En la ecuaci´n 3.6, la variable R re- a o presenta a la matriz de rotaci´n y t es la matriz de traslaci´n [Heikkil¨ and Silv´n, 1997]. o o a e        xi m11 m12 m13 Xi x0   yi  =  m21 m22 m23   Yi  +  y0        (3.6) zi m31 m32 m33 Zi z0 o R p t La ecuaci´n 3.7 est´ el modelo generalizado para el mapeamiento de un punto 3D a o a coordenadas p´ ıxeles; en dicha ecuaci´n se puede observar la variable lambda (λ), la cual o representa a un valor escalar que pertenece a los n´meros reales, y un punto x que ha u sido transformado a coordenadas p´ ıxeles homog´neas. Seguidamente, despu´s del signo de e e igualdad, est´ la matriz de par´metros intr´ a a ınsecos (K), la matriz de proyecci´n can´nica o o (Π0 ), la matriz de par´metros extr´ a ınsecos (R y t) y un punto cualquiera p del objeto en coordenadas homog´neas. e Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 25
  • 26. 3.4. M´todos de calibraci´n e o π X        u f sx f sθ ox 1 0 0 0 R t  Y  λ  v  =  0 f sy oy   0 1 0 0  λ∈R (3.7)        0 1 Z     1 0 0 1 0 0 1 0 1 x K Π0 p 3.3.3. Distorsi´n del lente o Existen dos tipos de distorsi´n durante el mapeamiento de las coordenadas globales o a las coordenadas p´ ıxeles. La primera es una distorsi´n lineal [Bakstein., 1999], que se o produce debido a la proyecci´n de perspectiva. Mientras mayor sea la distancia focal, me- o nor ser´ la distorsi´n [Mer´., 2008]. En la Figura 3.3 se puede observar, que la proyecci´n a o e o de perspectiva de un cuadrado, no conserva la originalidad de su forma (geometr´ ıa). Figura 3.3: Proyecci´n de perspectiva de un cuadrado [Bakstein., 1999] o La segunda distorsi´n es no lineal [Tsai, 1987] [Mer´., 2008] y se debe a la curvatura o e del lente. La concavidad de la optica hace que se produzca una deformaci´n en la imagen, ´ o lo cual har´ que las l´ a ıneas rectas no se observen como tales, sino como curvas. 3.4. M´todos de calibraci´n e o Si bien las dos partes del proceso de calibraci´n son: la transformaci´n lineal y la o o correcci´n de la distorsi´n [Weng et al., 2002]. Hay m´todos que resuelven cada parte de o o e dicho proceso de diferentes formas [Salvi et al., 2002] [Faugeras and Toscani., 1987]. Se ha elegido el m´todo de Heikkil¨ y Silv´n [Heikkil¨ and Silv´n, 1997] por la mane- e a e a e ra de como da a conocer ambas partes del proceso de calibraci´n y el m´todo de Zhengyou o e Zhang [Zhang, 2000], por su robustez y flexibilidad. Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 26
  • 27. CAP´ ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal o a a 3.4.1. El m´todo de Heikkil¨ y Silv´n e a e El m´todo de Heikkil¨ y Silv´n [Heikkil¨ and Silv´n, 1997] consta de los siguientes e a e a e cuatro pasos: 1. El primer paso consiste en hacer una Transformaci´n Lineal Directa (TLD) de las o coodenadas homog´neas del objeto (Xi , Yi , Zi , 1) a coordenadas de la imagen (ui , vi ). e Para llevar a cabo ello, se utiliza una matriz homog´nea de 3 × 4 llamada matriz e A. La ecuaci´n matricial ser´ de la siguiente forma: o ıa Xi       ui w i a11 a12 a13 a14  Yi   vi wi  =  a21 a22 a23 a24      (3.8) Zi      wi a31 a32 a33 a34 1 A Heikkil¨ y Silv´n [Heikkil¨ and Silv´n, 1997] resuelven los par´metros a11 , . . . , a34 a e a e a de la matriz A de la TLD eliminando wi . Por consiguiente, el sistema lineal, se denotar´ de la siguiente manera: ıa La = 0 (3.9)   X1 Y1 Z1 1 0 0 0 0 −X1 u1 −Y1 u1 Z1 u1 −u1 0 0 0 0 X1 Y1 Z1 1 −X1 v1 −Y1 v1 Z1 v1 −v1     . . . . . . . . . . . .      . . . . . . . . . . . . . . . . . . . . . . .  .    Xi Yi Zi 1 0 0 0 0 −Xi ui −Yi ui Zi ui −ui  L=   (3.10)  0 0 0 0 X i Yi Z i 1 −Xi vi −Yi vi Zi vi −vi    . . . . . . . . . . . .      . . . . . . . . . . . . . . . . . . . . . . .  .     Xn Yn Zn 1 0 0 0 0 −Xn un −Yn un Zn un −un   0 0 0 0 Xn Yn Zn 1 −Xn vn −Yn vn Zn vn −vn a = [a11 , a12 , a13 , a14 , a21 , a22 , a23 , a24 , a31 , a32 , a33 , a34 ]T (3.11) Para evitar una soluci´n trivial, en el sistema lineal de la ecuaci´n 3.9, el par´metro o o a a34 de la matriz A debe ser uno y Faugeras y Toscani [Faugeras and Toscani., 1987] sugieren que los par´metros a31 , a32 y a33 , cumplan la siguiente igualdad: a31 + a32 + a a33 = 1, la cual garantiza la no singularidad de la matriz A, por lo cual, se encontrar´ a una soluci´n. o Una vez obtenidos los par´metros de la matriz A, Melen [Melen., 1994] hace una a descomposici´n RQ a la matriz A, obteniendo la siguiente ecuaci´n: o o Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 27
  • 28. 3.4. M´todos de calibraci´n e o A = λV −1 B −1 F M T (3.12) R Q donde las matrices M y T forman la matriz de rotaci´n y traslaci´n del sistema de o o coordenadas del objeto al sistema de coordenadas de la c´mara de la ecuaci´n 3.6. a o Las matrices V, B y F representan al punto principal (ox , oy ), los coeficientes para la distorsi´n lineal (b1 , b2 ) y la distancia focal f respectivamente. o       1 0 −ox 1 + b1 b2 0 f 0 0 V =  0 1 −oy  , B =  b2 1 − b1 0  , F =  0 f 0  (3.13)       0 0 1 0 0 1 0 0 1 2. El segundo paso consiste en corregir los componentes de distorsi´n radial y tangen- o cial [Tsai, 1987] [Mer´., 2008] de la proyecci´n del punto 3D al plano imagen. El e o problema de la existencia de ruido en las im´genes, se resuelve a trav´s de m´ a e ınimos cuadrados. La funci´n objetivo a minimizar es la siguiente: o N N F = i=1 (Ui − ui )2 + i=1 (Vi − vi )2 (3.14) Donde: (Ui , Vi ) representa a los datos reales (ui , vi ) representa a los datos observados o ideales Debido a que la funci´n objetivo F a minimizar en la ecuaci´n 3.14 es no lineal, o o se utiliza el m´todo de Levenberg-Marquardt [Mor´, 1978] para su optimizaci´n. e e o El m´todo de Levenberg-Marquardt es un algoritmo iterativo que busca la mejor e soluci´n al problema de m´ o ınimos cuadrados. 3. El tercer paso consiste en corregir la distorsi´n a causa del ´ngulo y el desplazamiento o a entre el objeto y el plano imagen. Como se puede observar en la Figura 3.4, la distancia focal f es la distancia ortogonal entre O y el plano Π2 . Tambi´n se puede mirar que Γ2 es la proyecci´n de Γ1 en e o el plano Π2 . Se utiliza un cono porque es la figura geom´trica m´s representativa e a para la proyecci´n del c´ o ırculo Γ1 del plano Π1 al plano Π2 . La proyecci´n puede ser o expresada de la siguiente forma: (X − αZ)2 + (Y − βZ)2 = γ 2 Z 2 (3.15) Los par´metros α y β especifican la asimetr´ del cono en la direcci´n X y Y. a ıa o El par´metro γ especifica la “nitidez” del cono. Dado que el sistema de coordenas a Ω1 (X, Y, Z) ∈ R3 , que est´ centrado en el foco de la c´mara O y su eje Z, es a a Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 28
  • 29. CAP´ ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal o a a Figura 3.4: Proyecci´n de perspectiva de un c´ o ırculo [Heikkil¨ and Silv´n, 1997] a e perpendicular al plano Π1 , y dado que el sistema de coordenadas Ω2 (x, y, z) ∈ R3 , que tambi´n est´ centrado en el foco de la c´mara O, y que su eje z es ortogonal al e a a plano imagen Π2 , se realiza una transformaci´n de Ω2 a Ω1 , la cual, est´ expresada o a en la siguiente ecuaci´n: o      X a11 a11 a13 x  Y  =  a21 a22 a23   y  (3.16)      Z a31 a32 a33 z Si formamos una base ortonormal de la transpuesta de cada vector columna de la matriz de 3 × 3 de la ecuaci´n 3.16, entonces la ecuaci´n 3.15 puede ser expresada o o en coordenadas de la c´mara de la siguiente forma: a [ (a11 − αa31 )x + (a12 − αa32 )y + (a13 − αa33 )z]2 + [(a21 − βa31 )x + (a22 − βa32 )y + (a23 − βa33 )z]2 = γ 2 (a31 + a32 y + a33 z)2 (3.17) Ahora, la intersecci´n de C y el plano Π2 , es Γ2 , y est´ expresada como: o a (n2 + k 2 − r2 )x2 + 2(kl + np − rs)xy + (l2 + p2 − s2 )y 2 + 2(km + nq − rt)x + 2(lm + pq − st) + m2 + q 2 − t2 = 0 (3.18) Donde: k = a11 − ta31 n = a21 − sa31 r = γa31 l = a12 − ta32 p = a22 − sa32 s = γa32 (3.19) m = (a13 − ta33 )f q = (a23 − sa33 )f t = γa33 f En la ecuaci´n 3.18, se puede observar que tiene una forma cuadr´tica y que la o a imagen proyectada puede ser un c´ ırculo o una elipse. Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 29
  • 30. 3.4. M´todos de calibraci´n e o Si partimos del supuesto que es una elipse, entonces el centro(uc , vc ) puede ser ex- presado como: uc = (kp−nl)(lq−pm)−(ks−lr)(tl−ms)−(ns−pr)(wp−qs) (kp−nl)2 −(ks−lr)2 −(ns−pr)2 (kp−nl)(mn−kq)−(ks−lr)(mr−kt)−(ns−pr)(qr−nt) (3.20) vc = (kp−nl)2 −(ks−lr)2 −(ns−pr)2 Para conocer cu´l es la proyecci´n del centro del c´ a o ırculo, se considera la situaci´n o donde el radio del c´ ırculo es cero (γ = 0). Consecuentemente r, s y t se convierten en cero, por lo tanto, se obtiene la posici´n de la proyecci´n del punto y la proyecci´n o o o del centro del c´ ırculo. lq−pm mn−kq u0 = kp−nl , v0 = kp−nl (3.21) Una vez calculados los datos de la ecuaci´n 3.20 y la ecuaci´n 3.21, se procede hacer o o una correcci´n de la proyecci´n a trav´s de la siguiente ecuaci´n: o o e o Ui = Ui − sx su (uc,i − u0,i ) (3.22) Vi = Vi − sy (vc,i − v0,i ) 4. En el cuarto y ultimo paso, se resuelve el problema del back-projection [Pollefeys, 2009], ´ en el cual, se desea recuperar la l´ ınea o recta de las coordenadas de la imagen; esto se hace a trav´s del modelo de c´mara impl´ e a ıcito de Wei y Ma [Wei and Ma, 1993]. Por lo tanto, se puede expresar el mapeo de (ui , vi ) a (ui , vi ) como: ui 1 ui + ui (a1 ri + a2 ri ) + 2a3 ui vi + a4(ri + 2ui2 ) 2 4 2 = 2 4 2 2 (3.23) vi G vi + vi (a1 ri + a2 ri ) + a3(ri + 2vi ) + 2a4 ui vi y 2 2 G = (a5 ri + a6 ui + a7 vi + a8 )ri + 1 (3.24) donde: (ui −u0 ) (vi −v0 ) ui = (sx su ) , vi = sy (3.25) y ri = ui2 + vi2 Si se comparara el modelo inverso impl´ ıcito al modelo de la c´mara pinhole m´s el a a componente de la distorsi´n radial y tangencial, se podr´ observar que el modelo o ıa Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 30
  • 31. CAP´ ITULO 3. Calibraci´n de las c´maras y an´lisis bifocal o a a impl´ ıcito tiene componentes que reemplazan a la distorsi´n radial y a la distorsi´n o o tangencial. Para conocer los par´metros desconocidos del modelo inverso, (ui , vi ) y (ui , vi ), es a necesaria una grilla, para lo cual, se define: ui = [−ui ri , −ui ri , −2ui vi , −(ri + 2ui2 ), ui ri , ui ui ri , ui vi ri , ui ri ]T 2 4 2 4 2 2 2 vi = [−vi ri , −vi ri , −(ri + 2vi2 ), −2ui vi , vi ri , vi ui ri , vi vi ri , vi ri ]T 2 4 2 4 2 2 2 T T = [u1 , v1 , . . . , ui , vi , . . . , un , vn ] (3.26) p = [a1 , a2 , a3 , a4 , a5 , a6 , a7 , a8 ]T e = [u1 − u1 , v1 − v1 , . . . , ui − ui , vi − vi , . . . , un − un , vn − vn ]T Usando la ecuaci´n 3.23 y la ecuaci´n 3.24, se obtiene la siguiente relaci´n: o o o e = Tp (3.27) Ahora, el vector p es estimado a trav´s de m´ e ınimos cuadrados: p = (T T T )−1 T T e (3.28) Los par´metros calculados en la ecuaci´n 3.28 son usados en la ecuaci´n 3.23 y a o o en la ecuaci´n 3.24 para corregir los coordenadas de la imagen arbitraria (u, v). o Entonces las coordenadas reales son obtenidas, por interpolaci´n, en las coordenadas o calculadas entre (ui , vi ) y (ui , vi ). 3.4.2. El m´todo de Zhengyou Zhang e Zhengyou Zhang desarrollo un m´todo de calibraci´n flexible y robusto [Zhang, 2000] e o [Zhang, 1999], donde el criterio utilizado fue el siguiente: Sea un punto 2D x = [u v]T y un punto 3D p = [X Y Z]T . Se usa x para denotar ambos puntos en coordenadas homog´neas, por lo tanto, nuevo par de puntos es: x = e [u v 1]T y p = [X Y Z 1]T . La relaci´n entre un punto 3D M y su proyecci´n imagen m o o est´ definido por: a sx = K [R t]p (3.29) Donde s es un factor arbitrario y (R, t) es la matriz de par´metros extr´ a ınsecos (matriz de rotaci´n y traslaci´n), que relaciona el sistema de coordenadas globales al sistema de o o coordenadas de la c´mara; K es la matriz de par´metros intr´ a a ınsecos. Plano homogr´fico a Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 31
  • 32. 3.4. M´todos de calibraci´n e o Dado un plano en el espacio 3D existe una unica matriz que mapea este plano ´ homogr´fico a un plano imagen. Si se asume que el eje Z del plano modelo est´ ubicado a a en la posici´n cero (Z = 0) del sistema de coordenadas globales, se tiene lo siguiente: o s[u v 1]T = K[r1 r2 r3 t][X Y Z 1]T s[u v 1]T = K[r1 r2 r3 t][X Y 0 1]T (3.30) s[u v 1]T = K[r1 r2 t][X Y 1]T s[u v 1]T = H[X Y 1]T Como se puede observar, en la ecuaci´n 3.30, H = K[r1 r2 t] y es la matriz homo- o gr´fica que mapea el punto p del plano modelo al punto x del plano imagen. Por lo tanto, a la ecuaci´n general para el mapeamiento est´ definida por: o a sx = H p (3.31) Para conocer la matriz H de la ecuaci´n 3.31, es necesario crear el siguiente sistema o lineal: CH =0 (3.32) H11    X1 Y1 Z 1 1 0 −u1 X1 −u1 Y1 −u1 Z1 1  H 0 X1 Y1 Z1 1 −v1 X1 −v1 Y1 −v1 Z1 1   12     . . . . . . . . .   H13      . . . . . . . . . . . . . . . . .  .     H   Xi Yi Zi 1 0 −ui Xi −ui Yi −ui Zi 1   21   H = 0 (3.33)    0 Xi Yi Zi 1 −vi Xi −vi Yi −vi Zi 1   22     . . . . . . . . .   H23      . . . . . . . . . . . . . . . . .  .   H31       Xn Yn Z n 1 0 −un Xn −un Yn −un Zn 1   H32    0 Xn Yn Zn 1 −vn Xn −vn Yn −vn Zn 1 H33 C H Donde C es una matriz de 2n × 9. La variable n representa al n´mero de puntos. u Para resolver el sistema homog´neo de la ecuaci´n 3.32 son necesarios al menos ocho e o puntos para la matriz C . A trav´s de los autovalores y los autovectores de la matriz e sim´trica C T C , se hallan los par´metros de la matriz H . e a Debido a la existencia de ruido, el punto xi ha sido movido de su posici´n inicial, o por lo que, a trav´s de la siguiente funci´n, se minimiza el problema. e o 2 minH i xi − xi ˇ (3.34) Ingenier´ Inform´tica (Ciencias de la Computaci´n) - UCSP ıa a o 32