Sustentación de tesis (español)

RECONSTRUCCIÓN 3-D DE UN
MODELO BASADO EN SU VISIÓN
ESTEREOSCÓPICA
Tesista
Guillermo Enrique Medina Zegarra
Orientador
Dr. Edgar Lobaton, USA
Co-Orientador
Dr. Nestor Calvo, Argentina
Arequipa - Perú
07 de Mayo del 2012

1
Contenido
Contenido
1 Introducci´on
2 Geometr´ıa de una vista
3 Geometr´ıa de dos vistas
4 Propuesta
5 Pruebas y resultados
6 L´ımitaciones y problemas encontrados
7 Conclusiones y trabajos futuros

2
Contenido
1 Introducción
Motivación y contexto
Planteamiento del problema
Objetivos general
Objetivos espec´ıficos
4 Propuesta

3
Limitaciones en la época pre-renacentista para crear en 3D.
(a) Jesús entrando
a Jerusalén

3
Los art´ıstas en la ´epoca del renacimiento y la profundidad.
Los puntos de fuga y la tridimensionalidad.
(b) La Escuela de Atenas

3
Limitaciones en la época pre-renacentista para crear en 3D.
Los art´ıstas en la época del renacimiento y la profundidad.
Los puntos de fuga y la tridimensionalidad.
(a) Jesús entrando
a Jerusalén
(b) La Escuela de Atenas
Figura: Pintura pre-renacentista y renacentista [Ma et al., 2004].

4
Planteamiento del problema
Arquitectura f´ısica, posición, distribución e iluminación.
(a) Una sola cámara
[Cipolla et al., 2010]
(b) Iluminación artificial
[VISGRAF., 2012]

5
Planteamiento del problema (cont...)
Figura: ¿ C´omo obtener los par´ametros necesarios para realizar un
mapeamiento de un objeto al plano imagen ? [Faugeras, 1993].

6
Figura: ¿ C´omo hallar los puntos correspondientes ? [Szeliski, 2011].

7
Figura: ¿ C´omo hallar un punto en 3D de cada par de puntos
correspondientes ? [Szeliski, 2011].

8
Figura: ¿ C´omo reconstruir y suavizar una superﬁcie a partir de una nube
de puntos ? [Hartley and Zisserman, 2004].

9
Objetivos general
Objetivo general
Proponer un modelo para la reconstrucción de una imagen 3D de
un objeto, a partir de dos imágenes capturadas por dos cámaras
ubicadas adecuadamente.

10
Posicionar correctamente las dos cámaras digitales, en una
arquitectura f´ısica, para la adquisición de imágenes y calibración.
Hacer la rectificación de las imágenes, para calcular un adecuado
mapa de disparidad a través de la correlación normalizada cruzada.
Crear la superficie del objeto a partir de la triangulación de
Delaunay del mapa de disparidad.

11
Contenido
1 Introducci´on
4 Propuesta

12
Modelo de cámara pinhole
Ayuda a entender la formación de una imagen desde un punto de
vista geométrico.
Partes del modelo de cámara pinhole: centro óptico(o), distancia
focal(f ) y plano imagen(I).
x = ¯op ∩ I x ∈ R2
, p ∈ R3
Figura: Modelo de cámara pinhole [Ma et al., 2004].

13
Modelo de c´amara pinhole (cont...)
Figura: Ejemplo de proyecci´on de un objeto en un plano imagen.

14
Contenido
1 Introducci´on
4 Propuesta

15
Geometr´ıa epipolar
Estudia la relación geométrica y análisis matemático de un punto
3D p en sus planos imagen.
Figura: Analisis geométrico de dos vistas [Ma et al., 2004].

16
Geometr´ıa epipolar (cont...)
Figura: Ejemplo de la proyecci´on de un cubo en sus dos planos imagen.

17
Rectificación
Figura: Rectificación del par de imágenes estéreo [Fusiello et al., 2000].

18
C´alculo de disparidad
(a) (b) Mapa de disparidad
(a - b) Par de im´agenes de Tsukuba [Scharstein and Szeliski, 2002].

19
Contenido
1 Introducci´on
4 Propuesta

21
Descripci´on del pipeline de la propuesta
Arquitectura f´ısica
Canon SD1200 Sony DSC-S750

21
Adquisición de imágenes
Caracter´ıstica Sony DSC-S750 Canon SD1200 IS
Tipo de sensor CCD CCD
Tamaño de la imagen 640 × 480 640 × 480
ISO 100 100
Flash desactivado desactivado
Ajustes técnicos en las dos cámaras dig´ıtales

21
Adquisición de imágenes
Calibración
Patrón de calibración (7 × 10)

22
Rectificación
Hace la búsqueda lineal
La correspondencia de puntos
está en la misma l´ınea horizontal
Imágenes originales Imágenes rectificadas

23
Pre-procesamiento
Segmentación manual
Filtro Gaussiano
Imágenes rectificadas Imágenes pre-procesadas

24
Mapa de disparidad
Correlaci´on Normalizada Cruzada
Filtro de la mediana
Imagen izquierda pre-procesada Imagen derecha pre-procesada Mapa de disparidad

25
Malla 3D
Triangulaci´on de Delaunay
Intersecci´on de rectas
Enmallado tridimensional
Mapa de disparidad Nube de puntos Enmallado tridimensional

26
Modelo reconstruido
Suavización de la superficie
Texturización de la imagen derecha
Creación de la superficie Suavización de la superficie Texturización del modelo

27
“Cubo mágico”
Imágenes originales Imágenes rectificadas Imágenes pre-procesadas

28
“Cubo mágico” (cont...)
Creación de la superficie Suavización de la superficie Texturizado de la superficie

29
Varias vistas del “Cubo m´agico”

30
Contenido
1 Introducci´on
4 Propuesta
Oso de peluche
Rostro humano

31
Oso de peluche

32
Oso de peluche (cont...)
Creación de la superficie Suavización de la superficie Texturización del modelo

33
Rostro humano

34
Rostro humano (cont...)
Nube de puntos Modelo sin suavizar Modelo suavizado Modelo “transformado”
Enmallado tridimensional Modelo sin suavizar Modelo suavizado Modelo “transformado”

35
Contenido
1 Introducci´on
4 Propuesta

36
L´ımitaciones y problemas encontrados
Problemas en el tama˜no del vecindario Imperfecciones en el modelo creado

37
L´ımitaciones y problemas encontrados (cont...)
Imagen original defectuosa Imagen original defectuosa
Mapa de disparidad erróneo Reconstrucción 3D amorfa del “cubo mágico”

38
Contenido
1 Introducci´on
4 Propuesta

39
Conclusiones
Se diseñó un arquitectura f´ısica simple y económica.
Las condiciones de iluminación deben ser las adecuadas.
Se propusó un pipeline con una secuencia de pasos necesarios para
conseguir una reconstrucción 3D de un par estéreo de imágenes.
El método usado para el proceso de cálculo de disparidad es simple
y no robusto.
Existe una fuerte dependencia entre cada uno de los pasos de la
reconstrucción.

40
Trabajos futuros
Crear un ambiente con las adecuadas
condiciones para la calibración, ilumi-
nación y adquisición de imágenes.
Arquitectura f´ısica e iluminación artificial [Bradley et al., 2008]

40
Trabajos futuros
Crear un ambiente con las adecuadas
condiciones para la calibración, ilumi-
nación y adquisición de imágenes.
Arquitectura f´ısica e iluminación artificial [Bradley et al., 2008]
Hacer una extensión a
múltiples cámaras.
Múltiples vistas [Hartley and Zisserman, 2004]

41
Trabajos futuros (cont...)
Utilizar m´etodos robustos.

42
Publicación realizada
Art´ıculo en Simposio
“Reconstrucción visual 3-D : una perspectiva del sis-
tema.”
G. Medina-Zegarra y E. Lobaton
2nd International Symposium on Innovation and Techno-
logy (2011)
páginas 102-107, Noviembre 28-30, Lima - Perú
ISBN: 978-612-45917-1-6
Lugar: Universidad Tecnológica del Perú (UTP)
Editor: International Institute of Innovation and Techno-
logy (IIITEC)
Chair: Mario Chauca Saavedra

43
Agradecimientos
Dr. Alfedro Miranda
Mag. Alfedro Paz
Dr. Carlos Leyton
Dr(c). Christian López del Alamo
Dr. Edgar Lobaton
Dr. Eduardo Tejada
Dr. Jesús Mena
Dr. José Corrales-Nieves
Dr(c). Juan Carlos Gutierrez
Lic. Lu´ıs Pareja
Dr. Nestor Calvo
Dra(c). Regina Ticona
Familia Barrios Neyra

44
Referencias
Bradley, D., Popa, T., Sheffer, A., Heidrich, W., and Boubekeur, T. (2008).
Markerless garment capture.
ACM Transactions on Graphics (TOG), 27:99:1–99:9.
Cipolla, R., Battiato, S., and Farinella, G. M. (2010).
Computer Vision: Detection, Recognition and Reconstruction.
Springer.
Faugeras, O. (1993).
Three-dimensional Computer Vision: A Geometric Viewpoint.
The MIT Press. ISBN: 0262061589.
Fusiello, A., Trucco, E., and Verri, A. (2000).
A compact algorithm for rectification of stereo pairs.
Machine Vision and Applications, 12:16–22.
Hartley, R. and Zisserman, A. (2004).
Multiple View Geometry in Computer Vision. Second Edition.
Cambridge University Press. ISBN: 0521540518.
Ma, Y., Soatto, S., Koˇsecká, J., and Sastry, S. S. (2004).
An Invitation to 3D Vision from Images to Geometric Models.
Springer. ISBN: 0387008934.
Scharstein, D. and Szeliski, R. (2002).
A taxonomy and evaluation of dense two-frame stereo correspondence algorithms.
International Journal of Computer Vision, 47:7–42.
Szeliski, R. (2011).
Computer Vision: Algorithms and Applications.
Springer. ISBN: 9781848829343.

RECONSTRUCCIÓN 3-D DE UN
MODELO BASADO EN SU VISIÓN
ESTEREOSCÓPICA
Tesista
Guillermo Enrique Medina Zegarra
Orientador
Dr. Edgar Lobaton, USA
Co-Orientador
Dr. Nestor Calvo, Argentina
Arequipa - Perú
07 de Mayo del 2012
44

45
Puntos de vista (percepci´on)
(a) ¿ El vaso esta medio
lleno o medio vacio ?
(b) ¿ Es un pato o un conejo ?

46
Contenido extra
Contenido extra
1 Datos de procesamiento
4 Rectificación e intersección de rectas
5 Mapa de disparidad
6 Filtro Gaussiano y filtro de la mediana
7 Propiedades de la triangulación de Delaunay

47
Datos de procesamiento
Un procesador Intel (R) Core (TM) 2 CPU 1.66 GHz y una
memoria RAM 2GB.
El costo computacional del algoritmo en el peor caso es O(n3
) y en
el mejor caso es Θ(n2
).
El tiempo del procesamiento del algoritmo es de 25 minutos.

48
Modelamiento geom´etrico (matriz de mapeamiento)
propuesta
slide
π : R4
→ R3
; p → x


fsx fsθ ox
0 fsy oy
0 0 1


K
=


sx sθ ox
0 sy oy
0 0 1


Ks


f 0 0
0 f 0
0 0 1


Kf
(1)


u
v
1


x
= K


1 0 0 0
0 1 0 0
0 0 1 0


Π0
R t
0 1
g
π




X
Y
Z
1




p
(2)

49
Ecuaciones de la Geometr´ıa Epipolar
slide
Restricci´on epipolar
xT
2 Fx1 = 0

49
slide
xT
2 Fx1 = 0
Matriz Fundamental
F = K−T
2 EK−1
1

49
slide
xT
2 Fx1 = 0
Matriz Fundamental
F = K−T
2 EK−1
1
Matriz esencial
E = [t]x R

49
slide
xT
2 Fx1 = 0
Matriz Fundamental
F = K−T
2 EK−1
1
Matriz esencial
E = [t]x R
Matriz antisim´etrica
[t]x =


0 −c b
c 0 −a
−b a 0

 (3)

50
Sistema lineal para la matriz F
ui , vi , 1 T


F11 F12 F13
F21 F22 F23
F31 F32 F33

 ui , vi , 1 = 0 , i ∈ R
+
(4)
uu F11 + uv F21 + uF31 + vu F12 + vv F22 + vF32 + u F13 + v F23 + F33 = 0 (5)












u1u1 u1v1 u1 v1u1 v1v1 v1 u1 v1 1
u2u2 u2v2 u2 v2u1 v2v2 v2 u2 v2 1
u3u3 u3v3 u3 v3u1 v3v3 v3 u3 v3 1
u4u4 u4v4 u4 v4u1 v4v4 v4 u4 v4 1
u5u5 u5v5 u5 v5u1 v5v5 v5 u5 v5 1
u6u6 u6v6 u6 v6u1 v6v6 v6 u6 v6 1
u7u7 u7v7 u7 v7u1 v7v7 v7 u7 v7 1
u8u8 u8v8 u8 v8u1 v8v8 v8 u8 v8 1












A













F11
F12
F13
F21
F22
F23
F31
F32
F33













F
= 0 (6)

51
Sistema lineal para la matriz F (cont...)
Minimizar:
A F
2
=
8
i=1
(u
T
i Fui )
2
(7)
Sujeto a:
F 2
= 1 (8)
Por lo tanto, se forma la siguiente función de Lagrange:
L(F, λ) = A F 2
− λ( F 2
− 1) (9)
Por consiguiente, se aplica el método de los multiplicadores de Lagrange:
JL(F, λ){
2AT
AF − λ(2F)
F 2
− 1
, λ ∈ R
+
(10)
Ahora, se procede a resolver la ecuación JL(f , λ) = 0. La cual, es equivalente a hallar los autovalores y
autovectores de la matriz simétrica AT
A:
AT
AF = λ.F
F 2
= 1
(11)
Al calcular los autovectores, se habra encontrado la matriz fundamental F.

52
Calculando los autovalores de una matriz (ejemplo)
A =


1 1 0
2 0 1
0 0 3

 A − λI =


1 − λ 1 0
2 −λ 1
0 0 3 − λ

 (12)
det( A - λ I ) = (1 - λ)(- λ )(3 - λ ) - 2( 3 - λ )
det( A - λ I ) = ( - λ + λ2 )(3 - λ )- 6 + 2 λ
det( A - λ I ) = - λ3 + 4 λ2 - λ - 6
det( A - λ I ) = λ3 - 4 λ2 + λ + 6
Resolviendo el polinomio se encuentran las raices (autovalores), los
cuales son: -1, 2 y 3

53
Calculando los autovectores de una matriz (ejemplo)
A =


1 1 0
2 0 1
0 0 3

 A − λI =


1 − λ 1 0
2 −λ 1
0 0 3 − λ

 (13)
I) Para λ = -1
(A - λ I)v =0
(A - (-1) I)v =0
(A + I)v =0


2 1 0
2 1 1
0 0 4


(A+I)


a
b
c

 =


0
0
0

 (14)

54
Haciendo el m´etodo de Gauss tenemos:


1 1
2 0
0 0 1
0 0 0

 (15)
c=0 (a, b, c) = (−b
2 , b, 0)
a + b
2 = 0 ⇒ a = −b
2 (a, b, c) = b(−1
2, 1, 0)

55
II) Para λ = 2


−1 1 0
2 −2 1
0 0 1


(A−2×I)


1 −1 0
0 0 1
0 0 0

 (16)
c=0 (a,b,c) = (b,b,0)
a-b=0 ⇒ a = b (a,b,c) = b(1,1,0)

56
III) Para λ = 3


−2 1 0
2 −3 1
0 0 0


(A−3×I)


1 −1
2 0
0 1 −1
2
0 0 0

 (17)
b − c
2 = 0 a − b
2 = 0 (a,b,c) = (c
4 , c
2 , c)
b = c
2 a = b
2 (a,b,c) = c(1
4, 1
2, 1)
a = c
4
Los autovalores son: {(−1
2, 1, 0), (1, 1, 0), (1
4, 1
2, 1)}

57
Planteamiento inicial de la rectificación
propuesta
slide
La variable π representa a la matriz de mapeamiento
x ∼= π p (18)
Factorización QR de la matriz π
π = K[R | t] (19)
La matriz π se re-escribe como:
π =


qT
1 |q14
qT
2 |q24
qT
3 |q34

 = Q|q (20)

58
Planteamiento inicial de la rectificación (cont...)
Las coordenadas del centro óptico c está definido como:
c = −Q−1
q (21)
Se hace un despeje de la ecuación 21 en función de q.
π = [Q| − Qc] (22)

59
Desarrollo de la rectificación
Matriz de transformación
xr1 = λ Qr1Q−1
o1
Tl
xo1 λ ∈ R+
(23)
Para lo cual:
πo1 = [Qo1|qo1] πo1 MPP imagen izquierda inicial
πr1 = [Qr1 |qr1] πr1 MPP imagen izquierda rectificada

60
Pasos para hallar la matriz de transformación
Se hace una factorización QR de las matrices iniciales
π1 = K[R | − R c1] π1 MPP de la imagen izquierda
π2 = K[R | − R c2] π2 MPP de la imagen derecha
(24)
Los centros ópticos se hallan con la ecuación 21
La matriz K es la matriz de parámetros intr´ınsecos
La matriz de rotación R es la misma para ambas matrices de
mapeamiento

61
Pasos para hallar la matriz de transformaci´on (cont...)
Hallando la matriz de rotaci´on R
R =


rT
1
rT
2
rT
3

 (25)
El nuevo eje X es paralelo a la l´ınea base: r1 = ( c1−c2
c1−c2
)
El nuevo eje Y es ortogonal a X, k : r2 = k ∧r1
El nuevo eje Z es ortogonal a XY r3 = r1 ∧ r2

62
Vector unitario k
Demostraci´on de la ortogonalidad del vector Y a trav´es del
vector unitario k.
Plano R3
Z × X =
i j k
0 0 1
1 0 0
Z × X = i(0) - j(-1) + k(0)
Z × X = 0i + 1j + 0k
Z × X
Y
= (0,1,0)
return

63
Intersecci´on de rectas (triangulaci´on)
slide
p = c1 + tQ−1
r1 x1 t ∈ R
p = c2 + sQ−1
r2 x2 s ∈ R
(26)

64
Intersecci´on de rectas (ejemplo)
return
L1 : (X, Y , Z)
p
= (1, 2, 1)
c1
+t (2, 0, 3)
Q−1
r1 x1
L2 : (X, Y , Z)
p
= (5, 4, 1)
c2
+s (−2, −2, 3)
Q−1
r2 x2
L1 : (X, Y , Z) = (1 + 2t, 2, 1 + 3t)
L2 : (X, Y , Z) = (5 − 2s, 4 − 2s, 1 + 3s)
t = 1 , s = 1
(X, Y , Z) = (3, 2, 4)
(27)

65
Representaci´on del punto medio
Calculando el punto medio
c1Q1 + λ = R1 tx1 +
Q2−Q1
2
= R1 tx1 +
(c2+sx2)−(c1+tx1)
2
= R1 tx1 +
(c2−c1)+(sx2−tx1)
2
= R1
c2Q2 − λ = R2 sx2 −
Q1−Q2
2
= R2 sx2 −
(c1+tx1)−(c2+sx2)
2
= R2 sx2 −
(c1−c2)+(tx1−sx2)
2
= R2
L1 = c1 + mR1 M = (
Q1+Q2
2
)
L2 = c2 + nR2 M = (
c1+tx1+c2+sx2
2
)
L1 ∩ L2 = M M = (
c1+c2
2
+
tx1+sx2
2
)

66
Factorización QR
La factorización de la matriz de mapeamiento π consta de la
siguientes dos matrices:
π = Q × R
donde:
La matriz Q se obtiene a través del proceso de Gram-Schmidt
La matriz R se consigue a través de la siguiente multiplicación
R = QT × π
return

67
Proceso Gram-Schmidt
u1 = v1,
uk = vk - k−1
j=1
vk ,uj
uj
2 , ; j = 2,. . .,k
return

68
Proceso Gram-Schmidt (ejemplo)
A = {(1, 0, 1)
v1
, (0, 0, 1)
v2
, (1, 1, −1)
v3
}
u1 = v1 = (1, 0, 1)
u2 = (0, 0, 1) − 1
2(1, 0, 1)
u2 = (- 1
2 ,0, 1
2 )
u3 = (1,1,-1) - 0
2 (1,0,1) - (−1)
1
2
(- 1
2 ,0, 1
2 )
u3 = (1,1,-1) + 2(- 1
2 ,0, 1
2 )
u3 = (0,1,0)
La base ortogonal de A es {(1, 0, 1), (−1
2, 0, 1
2), (0, 1, 0)}

69
Pseudo-código del algoritmo de cálculo de disparidad
dispComp(imDerecha,imIzquierda,maxDisp)
1 thNorm ← escalar ∗ (2 ∗ r + 1)
2 for i = 1 + r to col − r do
3 for j = 1 + r to fil − maxDisp − r do
5 pBase ← imDerecha(i − r : i + r, j − r : j + r)
6 pBase ← pBase − promedio(pBase)
7 nBase ← norma(pBase)
8 if nBase <= thNorm then
9 continue
10 end if
11 pBase ← pBase/nBase
12 for sh = 1 to maxDisp do
13 pShift ← imIzquierda(i − r : i + r, j + sh − r : j + sh + r)
14 pShift ← pShift − promedio(pShift)
15 nShift ← norma(pShift)
16 if nShift <= thNorm then
17 corr[sh] ← 0
18 continue
19 end if
20 corr[sh] ← sum((pShift/nShift). ∗ (pBase))
21 end for
22 [valor indice] ← max(corr)
23 if valor == 0 then
24 imDisp[i, j] ← 0
25 else
26 imDisp[i, j] ← indice
27 end if
28 end for
29 end for
30 return(imDisp)

70
Mapa de disparidad
propuesta
slide
Correlaci´on Normalizada Cruzada (CNC)
u,v (I1(u,v)−I1)(I2(u+d,v)−I2)
u,v (I1(u,v)−I1)2
u,v (I2(u+d,v)−I2)2

70
Mapa de disparidad
propuesta
slide
Correlaci´on Normalizada Cruzada (CNC)
u,v (I1(u,v)−I1)(I2(u+d,v)−I2)
u,v (I1(u,v)−I1)2
u,v (I2(u+d,v)−I2)2
d(x, y) = arg supr∈RC(x, y, r) (28)

71
Filtro Gaussiano
slide
Valores de la m´ascara
1 2 1
2 3 2
1 2 1
Matriz deslizante de ﬁltrado en el dominio espacial

72
slide
Valores de ejemplo
6 2 0
3 97 4
19 3 10
En orden ascendente los
n´umeros ser´ıan : 0, 2, 3,
3, 4, 6, 10, 15, 97

72
slide
Valores de ejemplo
6 2 0
3 97 4
19 3 10
En orden ascendente los
n´umeros ser´ıan : 0, 2, 3,
3, 4, 6, 10, 15, 97
Valor actualizado
* * *
* 4 *
* * *
El valor inicial fue 97 y
luego de utilizar el ﬁltro
de la mediana fue
reemplazado por 4

73
Suavización del Laplaciano
slide
Calcula la posición de un
vértice q a partir del
promedio de los vértices
adyacentes.
Ejemplo:
3,6
5,4
9,2
14,3
16,10
7,6
———
54, 31
p(9,5) = 54
6 , 31
6
Representación de la suavización del Laplaciano [Vollmer et al., 1999]

74
Propiedades de la Triangulación de Delaunay
slide
Figura: Ilustración de la primera propiedad de la Triangulación de
Delaunay.

75
Propiedades de la Triangulación de Delaunay (cont...)
Figura: Ilustración de la segunda propiedad de la Triangulación de
Delaunay.

76
Propiedades de la Triangulaci´on de Delaunay (cont...)
(a) Arista ilegal (b) Correcci´on de la
arista ilegal

77
Consideraciones del patrón de calibración
Detección de las esquinas del patrón Detección de los puntos internos del patrón

78
Algoritmo de reducci´on de pol´ıgonos
Reducci´on de pol´ıgonos

Sustentación de tesis (español)

Recomendados

Recomendados

Más contenido relacionado

Similar a Sustentación de tesis (español)

Similar a Sustentación de tesis (español) (20)

Sustentación de tesis (español)