This was a pre-final presentation of "Active Appearance Models with Occlusion", written by Ralph Gross, Iain Matthews and Simon Baker as a seminar work at Saarland University
24. Basisform s0
1. Erstelle ein Netz s0 auf jedem Trainingsbild,
das handmarkierte Netz sei s
2. Wiederhole nun bis s0 konvergiert:
7
25. Basisform s0
1. Erstelle ein Netz s0 auf jedem Trainingsbild,
das handmarkierte Netz sei s
2. Wiederhole nun bis s0 konvergiert:
a. Passe s an s0 mit Hilfe von zweidimensionalen
Ähnlichkeitsumformungen an.
7
26. Basisform s0
1. Erstelle ein Netz s0 auf jedem Trainingsbild,
das handmarkierte Netz sei s
2. Wiederhole nun bis s0 konvergiert:
a. Passe s an s0 mit Hilfe von zweidimensionalen
Ähnlichkeitsumformungen an.
b. Setze s0 auf den Mittelwert aller Netze s
7
27. Basisform s0
1. Erstelle ein Netz s0 auf jedem Trainingsbild,
das handmarkierte Netz sei s
2. Wiederhole nun bis s0 konvergiert:
a. Passe s an s0 mit Hilfe von zweidimensionalen
Ähnlichkeitsumformungen an.
b. Setze s0 auf den Mittelwert aller Netze s
Nur wenn 50% der Punkte sichtbar sind !
7
29. Berechnung der
Formvektoren si
• Passe die sichtbaren Dreiecke von s in das
i
Basisnetz s0 ein
8
30. Berechnung der
Formvektoren si
• Passe die sichtbaren Dreiecke von s in das
i
Basisnetz s0 ein
• Ziehe s0 von jedem si ab
8
31. Berechnung der
Formvektoren si
• Passe die sichtbaren Dreiecke von s in das
i
Basisnetz s0 ein
• Ziehe s von jedem s ab
0 i
• Benutze “PCA mit fehlenden Daten”
8
32. Berechnung der
Formvektoren si
• Passe die sichtbaren Dreiecke von s in das
i
Basisnetz s0 ein
• Ziehe s von jedem s ab
0 i
• Benutze “PCA mit fehlenden Daten”
• Verwende die othonormalsierten Eigenvektoren
mit dem größten Eigenwert als si
8
40. Berechnung der
Darstellungsbilder Ai
• Passe A an A an
i 0
• Ziehe A von jedem A ab
0 i
• Benutze “PCA mit fehlenden Daten”
• Verwende die othonormalisierten Eigenvektoren
mit dem größten Eigenwert als Ai
11
49. Basisnetzabstand
Pixelabstand
0.50
durchschn. Pixelabstand [px]
zwischen den
0.40
Netzen aus
0.30
überdeckten und
0.20
überdeckungs-
0.10
freien
Bildsequenzen 0.05 0.15 0.25 0.35 0.45
% Überdeckung
14
50. Basisnetzabstand
Pixelabstand
0.50
durchschn. Pixelabstand [px]
zwischen den
0.40
Netzen aus
0.30
überdeckten und
0.20
überdeckungs-
0.10
freien
Bildsequenzen 0.05 0.15 0.25 0.35 0.45
% Überdeckung
Bleibt unter ½ px für bis zu 50% Überdeckung!
14
52. Formenergie Überlappung
1 u )T
2
SE = (si o
sj
n i j
siu: Formvektoren für überdeckungsfreie Daten
sjo: Formvektoren für überdeckte Daten
15
53. Formenergie Überlappung
zwischen den 1.00
shape energy overlap [%]
Formen aus 0.95
überdeckten und
0.90
überdeckungs-
freien 0.85
Bildsequenzen
0.05 0.15 0.25 0.35 0.45
% Überdeckung
16
54. Formenergie Überlappung
zwischen den 1.00
shape energy overlap [%]
Formen aus 0.95
überdeckten und
0.90
überdeckungs-
freien 0.85
Bildsequenzen
0.05 0.15 0.25 0.35 0.45
% Überdeckung
Bleibt über 95% für bis zu 45% Überdeckung!
16
66. Project-Out Algorithmus
• Vorberechnungen
• Gradientenbildung der Basisdarstellung ∇A0
• Berechnung der Jacobi Matrix des Warp in (x;0)
• Berechnung des Gradientenbilds SD (x)
ic
19
67. Project-Out Algorithmus
• Vorberechnungen
• Gradientenbildung der Basisdarstellung ∇A 0
• Berechnung der Jacobi Matrix des Warp in (x;0)
• Berechnung des Gradientenbilds SD (x)ic
• “Project out” Darstellung aus SD (x)
ic
19
68. Project-Out Algorithmus
• Vorberechnungen
• Gradientenbildung der Basisdarstellung ∇A 0
• Berechnung der Jacobi Matrix des Warp in (x;0)
• Berechnung des Gradientenbilds SD (x)ic
• “Project out” Darstellung aus SD (x)
ic
• Berechnung der Hesse-Matrix H po
19
69. Project-Out Algorithmus
• Iteration
• Warp I mit W(x;p) um I(W(x;p)) zu erhalten
• Berechnung des Fehlerbilds
E(x) = I(W(x;p)) - A0(x)
• Berechne Σx SDTpo(x) E(x)
• Aktualisiere den Warp W(x;p)
← W(x;p) ❍ W(x;Δp)
20
75. Robust fitting Algorithmus
• von der Vorberechnung in die Iteration verschoben:
• Gradientenbilder SD (x)
ic
23
76. Robust fitting Algorithmus
• von der Vorberechnung in die Iteration verschoben:
• Gradientenbilder SD (x)
ic
• Project out der Darstellung SD (x)
ic
23
77. Robust fitting Algorithmus
• von der Vorberechnung in die Iteration verschoben:
• Gradientenbilder SD (x)
ic
• Project out der Darstellung SD (x)
ic
• Berechnung der Hesse-Matrix H po
23
78. Robust fitting Algorithmus
• von der Vorberechnung in die Iteration verschoben:
• Gradientenbilder SD (x)
ic
• Project out der Darstellung SD (x)
ic
• Berechnung der Hesse-Matrix H po
Robust, aber sehr langsam !
23
84. Efficient robust
normalization algorithm
• Vorberechnung
• Berechne den Gradienten der Basisdarstellung: ∇A0
• Berechne die Jacobimatrix des Warp in (x;0)
• Berechne die Gradientenbilder SDic
• Berechne die Hesse-Matrix Hpi für jedes Dreieck
• Berechne die Darstellungs-Matrix HAi für jedes
Dreieck
26
85. Efficient robust
normalization algorithm
• Iteration
• Warp I with W(x;p) to compute I(W(x;p))
• Berechne das Fehlerbild Eapp(x)
• Berechne HA = Σiς’i·HiA
• Berechne Δλ und aktualisiere λ und Eapp
• Berechne die Hesse-Matrix Hp und invertiere sie
• Berechne Σxς’ (Eapp(x)2) SDTic(x) Eapp(x)
• Berechne Δp
• Aktualisiere den Warp
27
88. Experiment
• Vergleich der verschiedenen
Algorithmen mit verschiedenen
Überdeckungsanteilen und
verschiedenen Darstellungsbildern
28
89. Experiment
• Vergleich der verschiedenen
Algorithmen mit verschiedenen
Überdeckungsanteilen und
verschiedenen Darstellungsbildern
• inklusive Hager-Belhumeur
28
94. Konvergenz
Konvergenz bei
10% Überdeckung
bei verschiedenen
Algorithmen und
verschiedenen
Darstellungsbildern
Alle konvergieren ähnlich
außer Hager-Belhumeur
30
96. Konvergenz
Konvergenz bei
50% Überdeckung
bei verschiedenen
Algorithmen und
verschiedenen
Darstellungsbildern
Hager-Belhumeur zeigt
deutliche Defizite
31
97. Laufzeitvergleich
Efficient
pro Robust
Project Out Robust
Frame Normalization
Normalization
Matlab 27 ms 1280 ms 129 ms
C 4.3 ms 203.9 ms 20.5 ms
32
98. Laufzeitvergleich
Efficient
pro Robust
Project Out Robust
Frame Normalization
Normalization
Matlab 27 ms 1280 ms 129 ms
C 4.3 ms 203.9 ms 20.5 ms
Datenset: Testhardware:
547 Frames
11 Formparameter 3 GHz Pentium 4
20 Darstellungsparameter
9981 Farbpixel
32