CV2011-2. Lecture 09. Single view reconstructin.

Реконструкция по 1 изображению

Антон Конушин
http://courses.graphicon.ru/vision2

Этот курс подготовлен
при поддержке Microsoft
Research

Благодарности

• В презентации использованы слайды курса
«Using geometric information in recognition and
scene analysis» от Martial Herbert, CVML 2010

Основная задача

3D
2D

• Нужно построить 3-х мерную модель по одному
изображению (одной проекции на плоскость)

Неоднозначность реконструкции

• Нужно построить 3-х
мерную модель по одной
проекции на плоскость

• Существует множество
возможных решений

• В общем виде –
неразрешимо

from [Sinha and Adelson 1993]

Структурированный мир

Абстрактный Наш мир
хаотический мир упорядоченный и
структурированный

Модель и структура
• Выберем «параметрическую
модель» для описания мира
• MIT «Block world» как первая модель
трехмерного мира
• Каждый набор параметров
задает некоторую возможную
«конфигурацию мира»
• Модель накладывает
ограничения на возможные виды
сцен
• Наша задача – вычислить
параметры модели, наиболее
точно соответствующей
изображению
• Это называется вывод
(inference) MIT «Block world»

Ранние работы

[Guzman 1968] [Ohta & Kanade 1978]

• Guzman (SEE), 1968 • Brooks (ACRONYM), 1979
• Hansen & Riseman • Marr, 1982
(VISIONS), 1978 • Ohta & Kanade, 1978
• Barrow & Tenenbaum 1978 • Yakimovsky & Feldman, 1973

Переход к современности

Объединим
«современные» подходы
на основе данных
(классификаторы,
обученные на
тренировочных данных) с
представлением знаний и
процедурами вывода в
единую управляющую
структуру
(control structure)

Общая схема

• Можем использовать стандартную схему
распознавания изображений с классификацией по
признакам изображения

Признаки ML box:
Интерпретация
изображения классификаторы

Общая схема

• Можем строить набор гипотез описания сцены и
использовать их интерпретацию повторно для
улучшения результата

Гипотезы

ML box:
классификаторы
Признаки
Интерпретация
изображения
Построение
гипотез

Итерируем

Автоматизация
• Если что-то невозможно вывести автоматически из
изображения, то мы можем попросить кое-что
задать пользователя
• Ряд методов реконструкции по одному
изображению для сложных реальных сцен был
вначале предложен именно в интерактивном
варианте

Автоматические Интерактивные
методы методы

Уровень реконструкции

• Качественная информация
• Области (земля, стены, небо)
• Перекрытия

• Точная реконструкция
• Грубая трехмерная поверхность
• Детализированная трехмерная поверхность

План

• Вначале рассмотрим определенные геометрические
своиства одного изображения (точки и линии схода)
• Затем пройдёмся по разным методам
реконструкции
• Интерактивный вывод модели
• Автоматический вывод модели
– Однозначные методы на основе сегментации изображений
» Automatic photo pop-up
» GML fast urban-reconstruction
» Границы перекрытий и применение в распознавании
» Make3D
– Методы на основе множества гипотез
» Geometric image reasoning
» Block world revisited

Точки схода (Vanishing point)
• Проекция точки в бесконечности
Плоскость

Точка схода

Центр
Проекции

Поверхность земли
Плоскость

Точка схода

Центр
Проекции

Линия на поверхности земли

Свойства точек схода

Плоскость

Точка схода V

Центр
Проекции
C Линия на поверхности земли

Линия на поверхности земли

• Луч из центра проекции C, проходящий через точку схода v,
параллелен линии, на которой лежит точка бесконечности
– Почему?
» Лежат в одной плоскости
» Не пересекаются
• У всех параллельных линий одна и та же точка схода v
• Точка схода – точка на изображении, где пересекаются проекции
параллельных в пространстве прямых
• На изображении может быть сколько угодно точек схода
– Каждый пиксель может быть точкой схода

Вычисление точек схода

V

P0 D
P  P0  tD
 PX  tD X   PX / t  DX   DX 
P  tDY   PY / t  DY  D 
Pt   Y   t P   Y 
 PZ  tDZ   PZ / t  DZ   DZ 
     
 1   1/ t  0 

Свойства v  ΠP
• P - точка в бесконечности, v – ее проекция
• Они зависят от направления прямой
• Все параллельные линии P0 + tD, P1 + tD пересекаются в P

Линия схода (vanishing line)

v1 v2

Множество точек схода
• Каждый пучок параллельных прямых на плоскости определяет
свою точку схода
• Совокупность таких точек схода называется линией схода (или
исчезающей линией )
• Для горизонтальной плоскости - линия горизонта
• Различные плоскости определяют различные линии схода

Линия горизонта

• Положение линии горизонта на изображении задает
ориентацию камеры относительно плоскости «земли»
• Если известна внутренняя калибровка камеры
• Для JPEG-файлов калибровку можем считать известной
• Определение линии горизонта дает внешнюю
калибровку камеры

• Поиск прямых отрезков / линий на изображении
• Группировка линий по точкам пересечения
• Робастные методы (схемы голосования, RANSAC)
• Уточнение точек схода для каждой группы линий

Вычисление линии горизонта

v1 v2

• В городских сценах много прямых линий (отрезков)
параллельных земле
• Линии не обязательно должны лежать на плоскости земли
• Самые «сильные» точки схода будут соответствовать линии
горизонта и направлению на зенит
• Выберем линию горизонта, как самую «горизонтальную»


Идея – одновременно выделять линии и группировать их по
точкам схода с помощью графической модели

E.Tretyak et al. Single-View geometric analysis of man-made environments, ECCV 2010

Графическая модель

Пиксели краев группируются в линии, линии группируются по
точкам схода, точки схода вляются на горизонт z

Сравнение

Предыдущие методы Предложенный метод

Применение горизонта
Плоскость

Центр
Проекции

Высота Поверхность земли
Камеры

• Определив линию горизонта (калибровку камеры) и
зафиксировав высоту камеры мы можем вычислять
положение и размер объектов, расположенных на земле
• Пересечение луча из ЦП проходящего через выделенную
точку здания с плоскостью земли определяет его положение
на земле
• Объекты можно моделировать их с помощью спрайта
(плоскости с маской прозрачности)

Высота камеры
Плоскость

Центр
Проекции

Поверхность земли
Высота
Камеры

• Высота камеры задает масштаб
реконструируемой сцены
• Известная высота камеры позволяет вычислять
истинные расстояния и размеры объектов
• Может быть задана как высота человека или
штатива

Tour into picture

• Интерактивная система реконструкции
• Модель сцены в виде «комнаты»
• Объекты в виде «спрайтов»

Y. Horry et al., "Tour Into the Picture: Using a spidery mesh user interface to make
animation from a single image", Proc. SIGGRAPH 97, 1997.

Схема

• Пользователь задает точку схода на изображении по
прямым линиям
• Прямоугольником задает заднюю «стенку» сцены

TIP: Моделирование объектов

Модель сцены

Спрайты

Глубина спрайтов
определяется по
Выделенные объекты положению на земле

TIP: Реконструкция текстуры

• Текстура, скрытая дополнительными объектами
должна быть реконструирована
• В простейшем случае – с помощью “cloning brush”

TIP: Результат

Сцена с другой точки зрения

Single View Metrology
• Измерения между параллельными линиями
• Измерения между параллельными плоскостями
• Определение позиции камеры

A. Criminisi et. al. Single-view metrology. ICCV 1999

Image-based modeling

• Интерактивное построение модели сцены
• Набор инструментов для более удобного задания моделей
• После построения модели мы можем редактировать изображения
с учетом перспективных искажений (клонирование текстуры,
переосвщенеие)

Oh et al., Image-based modeling and photo editing. SIGGRAPH 2001

Плоскость земли

Плоскость земли Соответствующая
карта глубины

Разделение на слои

Выделенные вручную Текстура в скрытых областях
реконструирована с
слои
помощью “cloning brush”

Моделирование основных слоев

• Нижняя линия слоя на
поверхности земли
определяет положение и
ориентацию слоя

Моделирование основных слоев

Выделенная Результат
пользователем линия

Моделирование глубины

Слои Карта глубины.
Для каждого слоя своя карты глубины и все они позиционируются
друг относительно друга

Модификация глубины вручную

• Пользователь вручную специальной кисточкой сдвигает
точки ближе/дальше по направлению зрения
• Есть набор предопределенных форм – шар, цилиндр,
плоскость и т.д.

Моделирование сложных фигур

• Предположения: объект «выпуклый»
• Края наиболее удалены
• Ближе к центру – ближе к камере
• Генерация соответствующей карты глубины

Моделирование лица
• Параметрическая
модель лица
• Ручное
сопоставление
ключевых точек
• Расчет
параметров,
ориентации и
положения
модели
• Текстурирование

Геометрия сцены

Грубая, первоначальная Модель после уточнения
модель

Результат

• Сегментация сцены на
слои
• Реконструкция
невидимых частей
текстуры с помощью
Cloning Brush
• 10 часов на примере (52
слоя)
• Моделирование глубины
• 3 часа

Финальная модель с другой точки зрения

Google SketchUp

http://sketchup.google.com/

Другие модели

Обобщенные цилиндры

Произвольные модели

• Интерактивное задание большого количества
ограничений

• Алгоритм:
• Поиск модели, удовлетворяющей ограничениям, путем
итерационной минимизации функционала
• Адаптивное разбиение полигональной сетки

Zhang et. Al. Single View Modeling of Free-Form Scenes, CVPR 2001

Типы ограничений

Automatic Photo Pop-Up

• Модель – «книжка-раскладушка», плоскость земли и несколько
вертикальных плоскостей на ней (здания, объекты)
• Вычисление модели в три этапа
• Вычисление горизонта по точкам схода и калибровка камеры
• Семантическая сегментация изображения на небо, землю, объекты
• Подгонка нижней линии по границе земля/объекты

Derek Hoiem, Alexei A. Efros, Martial Hebert, Automatic Photo Pop-up, SIGGRAPH 2005

Схема алгоритма

Вход Сегментация Стены Модель
относительно
Земля
земли
Изображение

Стены

Обучение

Небо

Признаки
Цвет Текстура

Положение Точки схода

Обратите внимание на использование точек схода

Семантическая сегментация

Суп сегментаций + бустинг

Результат сегментации

Исходное Сегментированное
изображение изображение
Земля – зеленый
Стены – красный
Небо - синий

Вычисление нижней линии

• Вычисление границ между «стенами» и «землей»
• Границы приближаются прямыми линиями
• Поиск прямых с помощью преобразования Хафа

Вычисление нижней линии

• Отдельные сегменты соединяются в ломаные
• Объединяются отрезки, пересекающиеся под малыми
углами
• Убираются небольшие пересекающиеся ломаные
• Вычисляется линия горизонта

Моделирование «стен»

• Определение положения и ориентации каждого
полигона по нижней ломаной линии
• Поиск верхней границы «стены» и «неба»
• «Обрезание» по верхней границе каждого полигона

Финальная модель

Примеры моделей

Входные Автоматическая
изображения реконструкция

Проект GML + SAIT

Комбинирование схемы AutoPopup + множества изображений

Vezhnevets V, Konushin A, Ignatenko A. Interactive image-based urban modeling.
In: PIA-2007.

Модель сцены

Идея – разбиение сцены на вертикальные плоскости, выделение точек
схода в каждой плоскости, оценка вертикального положения ломанной
линии разделения земля/здания
O.Barinova et. al. Fast automatic single-view 3-d reconstruction of urban scenes. ECCV 2008

Определение перекрытий

Оценка перекрытий

• Нет перекрытия
• Регион 1 перекрывает
• Регион 2 перекрывает

D. Hoiem, A. N. Stein, A. A. Efros, and M. Hebert. Recovering occlusion
boundaries from an image. In ICCV, 2007

Признаки по изображению

Регионы Опора Пористый

Вертикальный Небо
Края

Упорядочивание по глубине

Минимальная по глубине
интерпретация

Производный признак

Максимальная по глубине
интерпретация

Перекрытия

Изображение Пересегментация Подсказки перекрытий

Обучение

Совместная
кластеризация

Следующая P(перекрытия)
сегментация

Пример

1-ая итерация 2-ая итерация 3-я итерация

Make 3D
• Цель: восстановление карты глубины
• Карта глубины приближается сеткой, в узлах которой стоят
сегменты изображения

Параметры
глубины и наклона
плоскостей

Границы объектов
и перегибы

Признаки изображения

Ashutosh Saxena, Min Sun, Andrew Y NgMake3D: Learning 3-D Scene Structure from a
.
Single Still Image, In IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI),
2008

Make 3D
• Используется глобальная модель
• Марковское поле
• Модель настраивается на данных с лазерного
сканера

Примеры результатов

Задание ограничений

Контекст и распознавание
True
Detection

False
Detections

Missed
Missed
True Detections

Local Detector: [Dalal-Triggs 2005]

Замыкая круг

Поверхности

Глубина, границы

Поверхности Перекрытия

Размеры объектов

Объекты и точка зрения

Поверхности  Объекты
• Поверхности  Обнаружение объектов
• Основание
• Обнаруженные объекты  Поверхности
• Определяет тип поверхности

+

Обнаруженная Неверная разметка Улучшение разметки
машина машины, как машины
основания

Поверхности  Перекрытия
• Поверхности  Границы перекрытий
• Вероятны перекрытия вдоль границ поверхностей
• Нужны для оценки глубины
• Границы перекрытий  Поверхности
• Улучшают сегментацию
• Помогают определить ориентацию поверхностей

+

Найденные границы Часть поля Исправление
перекрытий помечена как ошибки
вертикальная
плоскость

Объекты  Перекрытия
• Обнаруженные объекты  Границы перекрытий
• Границы внутри объектов вряд ли перекрытия
• Границы между объектами вероятно перекрытия
• Границы перекрытий  Обнаружение объектов
• Обнаруженные объекты должны иметь соответствующие
границ

+

Обнаруженная Пропущен часть Правильно
машина области перекрытия восстановленное
машиной перекрытие
машиной

Независимая оценка

Изображение Поверхности

Границы перекрытий Объекты

Совместная оценка

Изображение Поверхности

Границы перекрытий Объекты

Множественные гипотезы
• Предположим, сцена состоит из набора плоскостей
• Но плоскости не хаотично расположены, а
группируются в структурные элементы
• Будем выдвигать гипотезы о группировке
плоскостей, исходя из наших представлений о том,
как строятся здания

D. Lee, T. Kanade, M. Hebert. Geometric Reasoning for Single Image Structure
Recovery. CVPR 2009

Манхеттенский мир

• Предположение, что все прямые линии в сцене соответствуют трём
ортогональным направлениям (трём «ортогональным» точкам схода)
• Будем считать, что сцена состоит из плоскостей, в которых лежат
прямые линии
• Предположение «манхеттеновский мир» нужно нам для уменьшения
количества возможных конфигураций сцены

Возможные конфигурации
Вогнутый угол Выпуклый угол Перекрытие

Возможные конфигурации

Схема метода

• Поиск прямых отрезков

• Вычисление точек схода и
группировака отрезков по точкам
схода

• Построение гипотез о структуре
сцены

• Проверка гипотез

Расширяем ограничения

• Ограниченные по
объёму объекты

• Пространственное
исключение

• Содержание

Смысл ограничений

Сегментация Убираем Вывод только по 2D
изображения объект

Изображение Моделируем Вывод с учетом 3D
объект объемов

Схема алгоритма

Изображение Линии и точки Гипотезы
схода комнаты

Отбраковка
невозможных
конфигураций

Геометрический Ориентация Гипотезы
контекст объектов

Оценка
Результат
Гипотезы конфигурации сцены

Возврат к блокам

• Переход от плоскостей к блокам позволяет расширить множество
ограничений, которые накладываются на сцену
• Интерпретация сцены становится более обоснованной

A. Gupta, A. Efros, and M. Hebert. Blocks World Revisited: Image
Understanding Using Qualitative Geometry and Mechanics. ECCV 2010

Блоки вместо плоскостей

• Ограничение 1 – плоскости должны объединяться в блоки

Стабильность

• Статическое равновесие – блок должен быть устойчивым

Устойчивость

• Внутренняя устойчивость – внутри одного блока основание
должно быть плотнее верха, а не наоборот

Схема

Инициализация – вычисление Последовательно добавляем
набора сегментов с блоки по одному в сцену
признаками по изображению

Резюме лекции
• Основой для реконструкции 3д моделей по одному
изображению является:
• Выбранная параметрическая модель сцены
• Набор ограничений, которым должна удовлетворять
модель
• Метод извлечения признаков из изображения
• Метод вывода (оценки параметров) модели по
извлеченным признакам

• Текущие направления:
• Генерация множества гипотез описания сцены и оценка
их соответствия изображению
• Усложнение модели и расширение набора ограничений

CV2011-2. Lecture 09. Single view reconstructin.

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (9)

Similar a CV2011-2. Lecture 09. Single view reconstructin.

Similar a CV2011-2. Lecture 09. Single view reconstructin. (20)

CV2011-2. Lecture 09. Single view reconstructin.