SlideShare una empresa de Scribd logo
1 de 129
Реконструкция по 1 изображению




                Антон Конушин
       http://courses.graphicon.ru/vision2
Этот курс подготовлен
при поддержке Microsoft
       Research
Благодарности

• В презентации использованы слайды курса
  «Using geometric information in recognition and
  scene analysis» от Martial Herbert, CVML 2010
Основная задача


                                                3D
                2D




• Нужно построить 3-х мерную модель по одному
  изображению (одной проекции на плоскость)
Неоднозначность реконструкции

• Нужно построить 3-х
  мерную модель по одной
  проекции на плоскость

• Существует множество
  возможных решений

• В общем виде –
  неразрешимо


                           from [Sinha and Adelson 1993]
Структурированный мир




   Абстрактный          Наш мир
 хаотический мир    упорядоченный и
                   структурированный
Модель и структура
•   Выберем «параметрическую
    модель» для описания мира
     •   MIT «Block world» как первая модель
         трехмерного мира
•   Каждый набор параметров
    задает некоторую возможную
    «конфигурацию мира»
•   Модель накладывает
    ограничения на возможные виды
    сцен
•   Наша задача – вычислить
    параметры модели, наиболее
    точно соответствующей
    изображению
     • Это называется вывод
       (inference)                             MIT «Block world»
Ранние работы




      [Guzman 1968]                [Ohta & Kanade 1978]


•   Guzman (SEE), 1968        •   Brooks (ACRONYM), 1979
•   Hansen & Riseman          •   Marr, 1982
    (VISIONS), 1978           •   Ohta & Kanade, 1978
•   Barrow & Tenenbaum 1978   •   Yakimovsky & Feldman, 1973
Переход к современности

                  Объединим
                  «современные» подходы
                  на основе данных
                  (классификаторы,
                  обученные на
                  тренировочных данных) с
                  представлением знаний и
                  процедурами вывода в
                  единую управляющую
                  структуру
                  (control structure)
Общая схема

• Можем использовать стандартную схему
  распознавания изображений с классификацией по
  признакам изображения




     Признаки        ML box:
                                  Интерпретация
   изображения   классификаторы
Общая схема

  • Можем строить набор гипотез описания сцены и
    использовать их интерпретацию повторно для
    улучшения результата



                                    Гипотезы

                  ML box:
              классификаторы
  Признаки
                                               Интерпретация
изображения
               Построение
                 гипотез



                            Итерируем
Автоматизация
• Если что-то невозможно вывести автоматически из
  изображения, то мы можем попросить кое-что
  задать пользователя
• Ряд методов реконструкции по одному
  изображению для сложных реальных сцен был
  вначале предложен именно в интерактивном
  варианте




         Автоматические     Интерактивные
             методы            методы
Уровень реконструкции

• Качественная информация
  • Области (земля, стены, небо)
  • Перекрытия



• Точная реконструкция
  • Грубая трехмерная поверхность
  • Детализированная трехмерная поверхность
План

• Вначале рассмотрим определенные геометрические
  своиства одного изображения (точки и линии схода)
• Затем пройдёмся по разным методам
  реконструкции
  • Интерактивный вывод модели
  • Автоматический вывод модели
     – Однозначные методы на основе сегментации изображений
        »   Automatic photo pop-up
        »   GML fast urban-reconstruction
        »   Границы перекрытий и применение в распознавании
        »   Make3D
     – Методы на основе множества гипотез
        » Geometric image reasoning
        » Block world revisited
План

• Вначале рассмотрим определенные геометрические
  своиства одного изображения (точки и линии схода)
• Затем пройдёмся по разным методам
  реконструкции
  • Интерактивный вывод модели
  • Автоматический вывод модели
     – Однозначные методы на основе сегментации изображений
        »   Automatic photo pop-up
        »   GML fast urban-reconstruction
        »   Границы перекрытий и применение в распознавании
        »   Make3D
     – Методы на основе множества гипотез
        » Geometric image reasoning
        » Block world revisited
Точки схода
Точки схода (Vanishing point)
• Проекция точки в бесконечности
  Плоскость
  изображения

                 Точка схода


     Центр
    Проекции



                           Поверхность земли
   Плоскость
   изображения

                      Точка схода


    Центр
   Проекции



                         Линия на поверхности земли
Свойства точек схода

    Плоскость
    изображения

                            Точка схода V


         Центр
        Проекции
           C                       Линия на поверхности земли


                               Линия на поверхности земли


• Луч из центра проекции C, проходящий через точку схода v,
  параллелен линии, на которой лежит точка бесконечности
   – Почему?
       » Лежат в одной плоскости
       » Не пересекаются
• У всех параллельных линий одна и та же точка схода v
• Точка схода – точка на изображении, где пересекаются проекции
  параллельных в пространстве прямых
• На изображении может быть сколько угодно точек схода
   – Каждый пиксель может быть точкой схода
Вычисление точек схода


                         V




                        P0                         D
                                                       P  P0  tD
          PX    tD X   PX   / t  DX                    DX 
         P      tDY   PY    / t  DY                   D 
    Pt   Y                             t       P   Y 
          PZ    tDZ   PZ    / t  DZ                    DZ 
                                                         
               1              1/ t                      0 

Свойства        v  ΠP
  • P - точка в бесконечности, v – ее проекция
  • Они зависят от направления прямой
  • Все параллельные линии P0 + tD, P1 + tD пересекаются в P
Линия схода (vanishing line)

v1                          v2




Множество точек схода
     • Каждый пучок параллельных прямых на плоскости определяет
       свою точку схода
     • Совокупность таких точек схода называется линией схода (или
       исчезающей линией )
     • Для горизонтальной плоскости - линия горизонта
     • Различные плоскости определяют различные линии схода
Линия горизонта




• Положение линии горизонта на изображении задает
  ориентацию камеры относительно плоскости «земли»
  • Если известна внутренняя калибровка камеры
  • Для JPEG-файлов калибровку можем считать известной
• Определение линии горизонта дает внешнюю
  калибровку камеры
Вычисление точек схода
•   Поиск прямых отрезков / линий на изображении
•   Группировка линий по точкам пересечения
    •   Робастные методы (схемы голосования, RANSAC)
•   Уточнение точек схода для каждой группы линий
Вычисление линии горизонта


                                        v1                      v2




•   В городских сценах много прямых линий (отрезков)
    параллельных земле
    •   Линии не обязательно должны лежать на плоскости земли
•   Самые «сильные» точки схода будут соответствовать линии
    горизонта и направлению на зенит
•   Выберем линию горизонта, как самую «горизонтальную»
Вычисление точек схода




    Идея – одновременно выделять линии и группировать их по
          точкам схода с помощью графической модели

E.Tretyak et al. Single-View geometric analysis of man-made environments, ECCV 2010
Графическая модель




Пиксели краев группируются в линии, линии группируются по
     точкам схода, точки схода вляются на горизонт z
Сравнение




Предыдущие методы   Предложенный метод
Применение горизонта
         Плоскость
         изображения




            Центр
           Проекции



Высота                    Поверхность земли
Камеры

 •   Определив линию горизонта (калибровку камеры) и
     зафиксировав высоту камеры мы можем вычислять
     положение и размер объектов, расположенных на земле
 •   Пересечение луча из ЦП проходящего через выделенную
     точку здания с плоскостью земли определяет его положение
     на земле
 •   Объекты можно моделировать их с помощью спрайта
     (плоскости с маской прозрачности)
Высота камеры
         Плоскость
         изображения




            Центр
           Проекции



                       Поверхность земли
Высота
Камеры



  • Высота камеры задает масштаб
    реконструируемой сцены
  • Известная высота камеры позволяет вычислять
    истинные расстояния и размеры объектов
  • Может быть задана как высота человека или
    штатива
План

• Вначале рассмотрим определенные геометрические
  своиства одного изображения (точки и линии схода)
• Затем пройдёмся по разным методам
  реконструкции
  • Интерактивный вывод модели
  • Автоматический вывод модели
     – Однозначные методы на основе сегментации изображений
        »   Automatic photo pop-up
        »   GML fast urban-reconstruction
        »   Границы перекрытий и применение в распознавании
        »   Make3D
     – Методы на основе множества гипотез
        » Geometric image reasoning
        » Block world revisited
Tour into picture




   • Интерактивная система реконструкции
   • Модель сцены в виде «комнаты»
   • Объекты в виде «спрайтов»



Y. Horry et al., "Tour Into the Picture: Using a spidery mesh user interface to make
animation from a single image", Proc. SIGGRAPH 97, 1997.
Схема




•   Пользователь задает точку схода на изображении по
    прямым линиям
•   Прямоугольником задает заднюю «стенку» сцены
TIP: Моделирование объектов




    Модель сцены




                     Спрайты

                        Глубина спрайтов
                         определяется по
Выделенные объекты     положению на земле
TIP: Реконструкция текстуры




• Текстура, скрытая дополнительными объектами
  должна быть реконструирована
• В простейшем случае – с помощью “cloning brush”
TIP: Результат




        Сцена с другой точки зрения
Пример
Single View Metrology
• Измерения между параллельными линиями
• Измерения между параллельными плоскостями
• Определение позиции камеры




      A. Criminisi et. al. Single-view metrology. ICCV 1999
Image-based modeling




• Интерактивное построение модели сцены
• Набор инструментов для более удобного задания моделей
• После построения модели мы можем редактировать изображения
с учетом перспективных искажений (клонирование текстуры,
переосвщенеие)

Oh et al., Image-based modeling and photo editing. SIGGRAPH 2001
Плоскость земли




Плоскость земли   Соответствующая
                  карта глубины
Разделение на слои




  Выделенные вручную   Текстура в скрытых областях
                            реконструирована с
         слои
                          помощью “cloning brush”
Моделирование основных слоев


                 • Нижняя линия слоя на
                   поверхности земли
                   определяет положение и
                   ориентацию слоя
Моделирование основных слоев




     Выделенная         Результат
 пользователем линия
Моделирование глубины




               Слои                     Карта глубины.
Для каждого слоя своя карты глубины и все они позиционируются
  друг относительно друга
Модификация глубины вручную




•   Пользователь вручную специальной кисточкой сдвигает
    точки ближе/дальше по направлению зрения
•   Есть набор предопределенных форм – шар, цилиндр,
    плоскость и т.д.
Моделирование сложных фигур




• Предположения: объект «выпуклый»
  • Края наиболее удалены
  • Ближе к центру – ближе к камере
• Генерация соответствующей карты глубины
Моделирование лица
                     • Параметрическая
                       модель лица
                     • Ручное
                       сопоставление
                       ключевых точек
                     • Расчет
                       параметров,
                       ориентации и
                       положения
                       модели
                     • Текстурирование
Геометрия сцены




 Грубая, первоначальная   Модель после уточнения
           модель
Результат

                                         •   Сегментация сцены на
                                             слои
                                         •   Реконструкция
                                             невидимых частей
                                             текстуры с помощью
                                             Cloning Brush
                                         •   10 часов на примере (52
                                             слоя)
                                         •   Моделирование глубины
                                         •   3 часа


Финальная модель с другой точки зрения
Видео
Google SketchUp




          http://sketchup.google.com/
Google SketchUp
Autodesk ImageModeler
Другие модели




                Обобщенные цилиндры
Произвольные модели

• Интерактивное задание большого количества
  ограничений

• Алгоритм:
  • Поиск модели, удовлетворяющей ограничениям, путем
    итерационной минимизации функционала
  • Адаптивное разбиение полигональной сетки




 Zhang et. Al. Single View Modeling of Free-Form Scenes, CVPR 2001
Типы ограничений
Примеры
Примеры
План

• Вначале рассмотрим определенные геометрические
  своиства одного изображения (точки и линии схода)
• Затем пройдёмся по разным методам
  реконструкции
  • Интерактивный вывод модели
  • Автоматический вывод модели
     – Однозначные методы на основе сегментации изображений
        »   Automatic photo pop-up
        »   GML fast urban-reconstruction
        »   Границы перекрытий и применение в распознавании
        »   Make3D
     – Методы на основе множества гипотез
        » Geometric image reasoning
        » Block world revisited
Automatic Photo Pop-Up




• Модель – «книжка-раскладушка», плоскость земли и несколько
  вертикальных плоскостей на ней (здания, объекты)
• Вычисление модели в три этапа
   • Вычисление горизонта по точкам схода и калибровка камеры
   • Семантическая сегментация изображения на небо, землю, объекты
   • Подгонка нижней линии по границе земля/объекты


   Derek Hoiem, Alexei A. Efros, Martial Hebert, Automatic Photo Pop-up, SIGGRAPH 2005
Схема алгоритма

  Вход        Сегментация      Стены       Модель
                            относительно
                 Земля
                               земли
Изображение



                 Стены



 Обучение

                 Небо
Признаки
                      Цвет             Текстура




                    Положение         Точки схода




 Обратите внимание на использование точек схода
Семантическая сегментация




     Суп сегментаций + бустинг
Результат сегментации




    Исходное            Сегментированное
  изображение               изображение
                         Земля – зеленый
                        Стены – красный
                           Небо - синий
Вычисление нижней линии




• Вычисление границ между «стенами» и «землей»
• Границы приближаются прямыми линиями
  • Поиск прямых с помощью преобразования Хафа
Вычисление нижней линии




• Отдельные сегменты соединяются в ломаные
  • Объединяются отрезки, пересекающиеся под малыми
    углами
  • Убираются небольшие пересекающиеся ломаные
• Вычисляется линия горизонта
Моделирование «стен»




• Определение положения и ориентации каждого
  полигона по нижней ломаной линии
• Поиск верхней границы «стены» и «неба»
• «Обрезание» по верхней границе каждого полигона
Финальная модель
Примеры моделей




    Входные       Автоматическая
  изображения      реконструкция
Примеры моделей




  Входные         Автоматическая
изображения        реконструкция
Проект GML + SAIT




   Комбинирование схемы AutoPopup + множества изображений

Vezhnevets V, Konushin A, Ignatenko A. Interactive image-based urban modeling.
In: PIA-2007.
Модель сцены




Идея – разбиение сцены на вертикальные плоскости, выделение точек
схода в каждой плоскости, оценка вертикального положения ломанной
линии разделения земля/здания
O.Barinova et. al. Fast automatic single-view 3-d reconstruction of urban scenes. ECCV 2008
Проект GML + SAIT
Определение перекрытий
Оценка перекрытий




                                           • Нет перекрытия
                                           • Регион 1 перекрывает
                                           • Регион 2 перекрывает



D. Hoiem, A. N. Stein, A. A. Efros, and M. Hebert. Recovering occlusion
boundaries from an image. In ICCV, 2007
Признаки по изображению




     Регионы        Опора        Пористый




                  Вертикальный    Небо
     Края
Упорядочивание по глубине




                        Минимальная по глубине
                            интерпретация



 Производный признак




                       Максимальная по глубине
                            интерпретация
Перекрытия




Изображение                 Пересегментация   Подсказки перекрытий


                                                         Обучение



                               Совместная
                              кластеризация




              Следующая                       P(перекрытия)
              сегментация
Перекрытия




Изображение                 Пересегментация   Подсказки перекрытий


                                                         Обучение



                               Совместная
                              кластеризация




              Следующая                       P(перекрытия)
              сегментация
Пример




 1-ая итерация   2-ая итерация   3-я итерация
Примеры
Примеры
Make 3D
  •   Цель: восстановление карты глубины
  •   Карта глубины приближается сеткой, в узлах которой стоят
      сегменты изображения


                                 Параметры
                                 глубины и наклона
                                 плоскостей


                                                 Границы объектов
                                                    и перегибы



                             Признаки изображения


Ashutosh Saxena, Min Sun, Andrew Y NgMake3D: Learning 3-D Scene Structure from a
                                      .
Single Still Image, In IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI),
2008
Make 3D
• Используется глобальная модель
  • Марковское поле
• Модель настраивается на данных с лазерного
  сканера
Примеры результатов
Видео
Примеры результатов
Задание ограничений
Контекст и распознавание
   True
 Detection



                                                          False
                                                        Detections




Missed
                                                           Missed
                 True Detections



                                   Local Detector: [Dalal-Triggs 2005]
Замыкая круг


                     Поверхности

                     Глубина, границы




 Поверхности                            Перекрытия




                                         Размеры объектов


               Объекты и точка зрения
Поверхности  Объекты
   • Поверхности  Обнаружение объектов
      • Основание
   • Обнаруженные объекты  Поверхности
      • Определяет тип поверхности




                    +

Обнаруженная            Неверная разметка   Улучшение разметки
машина                     машины, как      машины
                            основания
Поверхности  Перекрытия
   •   Поверхности  Границы перекрытий
       • Вероятны перекрытия вдоль границ поверхностей
       • Нужны для оценки глубины
   •   Границы перекрытий  Поверхности
       • Улучшают сегментацию
       • Помогают определить ориентацию поверхностей




                    +

Найденные границы          Часть поля              Исправление
    перекрытий            помечена как             ошибки
                          вертикальная
                            плоскость
Объекты  Перекрытия
    •   Обнаруженные объекты  Границы перекрытий
        • Границы внутри объектов вряд ли перекрытия
        • Границы между объектами вероятно перекрытия
    •   Границы перекрытий  Обнаружение объектов
        • Обнаруженные объекты должны иметь соответствующие
          границ




                   +

Обнаруженная             Пропущен часть               Правильно
машина                 области перекрытия          восстановленное
                            машиной                  перекрытие
                                                       машиной
Независимая оценка




     Изображение       Поверхности




  Границы перекрытий    Объекты
Совместная оценка




     Изображение       Поверхности




  Границы перекрытий    Объекты
Независимая оценка




     Изображение       Поверхности




  Границы перекрытий    Объекты
Совместная оценка




     Изображение       Поверхности




  Границы перекрытий    Объекты
План

• Вначале рассмотрим определенные геометрические
  своиства одного изображения (точки и линии схода)
• Затем пройдёмся по разным методам
  реконструкции
  • Интерактивный вывод модели
  • Автоматический вывод модели
     – Однозначные методы на основе сегментации изображений
        »   Automatic photo pop-up
        »   GML fast urban-reconstruction
        »   Границы перекрытий и применение в распознавании
        »   Make3D
     – Методы на основе множества гипотез
        » Geometric image reasoning
        » Block world revisited
Множественные гипотезы
   • Предположим, сцена состоит из набора плоскостей
   • Но плоскости не хаотично расположены, а
     группируются в структурные элементы
   • Будем выдвигать гипотезы о группировке
     плоскостей, исходя из наших представлений о том,
     как строятся здания




D. Lee, T. Kanade, M. Hebert. Geometric Reasoning for Single Image Structure
Recovery. CVPR 2009
Манхеттенский мир




•   Предположение, что все прямые линии в сцене соответствуют трём
    ортогональным направлениям (трём «ортогональным» точкам схода)
•   Будем считать, что сцена состоит из плоскостей, в которых лежат
    прямые линии
•   Предположение «манхеттеновский мир» нужно нам для уменьшения
    количества возможных конфигураций сцены
Возможные конфигурации
Вогнутый угол   Выпуклый угол   Перекрытие
Возможные конфигурации
Схема метода

• Поиск прямых отрезков

• Вычисление точек схода и
  группировака отрезков по точкам
  схода

• Построение гипотез о структуре
  сцены



• Проверка гипотез
Пример
Пример
Пример
Пример
Пример
Пример
Пример
Пример
Пример
Пример
Результаты
Результаты
Результаты
Расширяем ограничения

•   Ограниченные по
    объёму объекты



•   Пространственное
    исключение




•   Содержание
Смысл ограничений




Сегментация    Убираем     Вывод только по 2D
изображения     объект




Изображение   Моделируем    Вывод с учетом 3D
                объект          объемов
Схема алгоритма



  Изображение    Линии и точки   Гипотезы
                     схода       комнаты

                                                       Отбраковка
                                                      невозможных
                                                      конфигураций


Геометрический     Ориентация    Гипотезы
   контекст                      объектов




                  Оценка
   Результат
                                    Гипотезы конфигурации сцены
Примеры результатов
Возврат к блокам




•    Переход от плоскостей к блокам позволяет расширить множество
     ограничений, которые накладываются на сцену
•    Интерпретация сцены становится более обоснованной



    A. Gupta, A. Efros, and M. Hebert. Blocks World Revisited: Image
    Understanding Using Qualitative Geometry and Mechanics. ECCV 2010
Блоки вместо плоскостей




•   Ограничение 1 – плоскости должны объединяться в блоки
Стабильность




•   Статическое равновесие – блок должен быть устойчивым
Устойчивость




•   Внутренняя устойчивость – внутри одного блока основание
    должно быть плотнее верха, а не наоборот
Схема




Инициализация – вычисление   Последовательно добавляем
набора сегментов с           блоки по одному в сцену
признаками по изображению
Схема
Пример графа
Примеры
Пример
Резюме лекции
• Основой для реконструкции 3д моделей по одному
  изображению является:
  • Выбранная параметрическая модель сцены
  • Набор ограничений, которым должна удовлетворять
    модель
  • Метод извлечения признаков из изображения
  • Метод вывода (оценки параметров) модели по
    извлеченным признакам


• Текущие направления:
  • Генерация множества гипотез описания сцены и оценка
    их соответствия изображению
  • Усложнение модели и расширение набора ограничений

Más contenido relacionado

La actualidad más candente

CV2011-2. Lecture 06. Structure from motion.
CV2011-2. Lecture 06.  Structure from motion.CV2011-2. Lecture 06.  Structure from motion.
CV2011-2. Lecture 06. Structure from motion.Anton Konushin
 
CV2011-2. Lecture 03. Photomontage, part 2.
CV2011-2. Lecture 03.  Photomontage, part 2.CV2011-2. Lecture 03.  Photomontage, part 2.
CV2011-2. Lecture 03. Photomontage, part 2.Anton Konushin
 
CV2011-2. Lecture 04. Semantic image segmentation
CV2011-2. Lecture 04.  Semantic image segmentationCV2011-2. Lecture 04.  Semantic image segmentation
CV2011-2. Lecture 04. Semantic image segmentationAnton Konushin
 
CV2011 Lecture 5. Features
CV2011 Lecture 5. FeaturesCV2011 Lecture 5. Features
CV2011 Lecture 5. FeaturesAnton Konushin
 
CV2011 Lecture 6. Fitting
CV2011 Lecture 6. FittingCV2011 Lecture 6. Fitting
CV2011 Lecture 6. FittingAnton Konushin
 
Лекция 07 Обработка видео
Лекция 07 Обработка видеоЛекция 07 Обработка видео
Лекция 07 Обработка видеоVictor Kulikov
 
CV2011 Lecture 10. Image retrieval
CV2011 Lecture 10.  Image retrievalCV2011 Lecture 10.  Image retrieval
CV2011 Lecture 10. Image retrievalAnton Konushin
 
CV2015. Лекция 2. Простые методы распознавания изображений.
CV2015. Лекция 2. Простые методы распознавания изображений.CV2015. Лекция 2. Простые методы распознавания изображений.
CV2015. Лекция 2. Простые методы распознавания изображений.Anton Konushin
 
CV2011 Lecture 12. Action recognition
CV2011 Lecture 12. Action recognitionCV2011 Lecture 12. Action recognition
CV2011 Lecture 12. Action recognitionAnton Konushin
 
20100919 computer vision_konushin_lecture02
20100919 computer vision_konushin_lecture0220100919 computer vision_konushin_lecture02
20100919 computer vision_konushin_lecture02Computer Science Club
 
20120414 videorecognition konushin_lecture03
20120414 videorecognition konushin_lecture0320120414 videorecognition konushin_lecture03
20120414 videorecognition konushin_lecture03Computer Science Club
 
CV2015. Лекция 2. Основы обработки изображений.
CV2015. Лекция 2. Основы обработки изображений.CV2015. Лекция 2. Основы обработки изображений.
CV2015. Лекция 2. Основы обработки изображений.Anton Konushin
 
CV2011 Lecture 4. Image representation
CV2011 Lecture 4. Image representationCV2011 Lecture 4. Image representation
CV2011 Lecture 4. Image representationAnton Konushin
 
CV2011 Lecture 13. Real-time vision
CV2011 Lecture 13. Real-time visionCV2011 Lecture 13. Real-time vision
CV2011 Lecture 13. Real-time visionAnton Konushin
 
CV2011 Lecture 3. Basic image analysis
CV2011 Lecture 3. Basic image analysisCV2011 Lecture 3. Basic image analysis
CV2011 Lecture 3. Basic image analysisAnton Konushin
 
20120414 videorecognition konushin_lecture04
20120414 videorecognition konushin_lecture0420120414 videorecognition konushin_lecture04
20120414 videorecognition konushin_lecture04Computer Science Club
 
CV2011 Lecture 8. Detection
CV2011 Lecture 8. DetectionCV2011 Lecture 8. Detection
CV2011 Lecture 8. DetectionAnton Konushin
 
20120415 videorecognition konushin_lecture05
20120415 videorecognition konushin_lecture0520120415 videorecognition konushin_lecture05
20120415 videorecognition konushin_lecture05Computer Science Club
 
20111009 csseminar image feature detection and matching
20111009 csseminar image feature detection and matching20111009 csseminar image feature detection and matching
20111009 csseminar image feature detection and matchingComputer Science Club
 

La actualidad más candente (20)

CV2011-2. Lecture 06. Structure from motion.
CV2011-2. Lecture 06.  Structure from motion.CV2011-2. Lecture 06.  Structure from motion.
CV2011-2. Lecture 06. Structure from motion.
 
CV2011-2. Lecture 03. Photomontage, part 2.
CV2011-2. Lecture 03.  Photomontage, part 2.CV2011-2. Lecture 03.  Photomontage, part 2.
CV2011-2. Lecture 03. Photomontage, part 2.
 
CV2011-2. Lecture 04. Semantic image segmentation
CV2011-2. Lecture 04.  Semantic image segmentationCV2011-2. Lecture 04.  Semantic image segmentation
CV2011-2. Lecture 04. Semantic image segmentation
 
CV2011 Lecture 5. Features
CV2011 Lecture 5. FeaturesCV2011 Lecture 5. Features
CV2011 Lecture 5. Features
 
CV2011 Lecture 6. Fitting
CV2011 Lecture 6. FittingCV2011 Lecture 6. Fitting
CV2011 Lecture 6. Fitting
 
Лекция 07 Обработка видео
Лекция 07 Обработка видеоЛекция 07 Обработка видео
Лекция 07 Обработка видео
 
CV2011 Lecture 10. Image retrieval
CV2011 Lecture 10.  Image retrievalCV2011 Lecture 10.  Image retrieval
CV2011 Lecture 10. Image retrieval
 
CV2015. Лекция 2. Простые методы распознавания изображений.
CV2015. Лекция 2. Простые методы распознавания изображений.CV2015. Лекция 2. Простые методы распознавания изображений.
CV2015. Лекция 2. Простые методы распознавания изображений.
 
CV2011 Lecture 12. Action recognition
CV2011 Lecture 12. Action recognitionCV2011 Lecture 12. Action recognition
CV2011 Lecture 12. Action recognition
 
20100919 computer vision_konushin_lecture02
20100919 computer vision_konushin_lecture0220100919 computer vision_konushin_lecture02
20100919 computer vision_konushin_lecture02
 
20120414 videorecognition konushin_lecture03
20120414 videorecognition konushin_lecture0320120414 videorecognition konushin_lecture03
20120414 videorecognition konushin_lecture03
 
L05 features
L05 featuresL05 features
L05 features
 
CV2015. Лекция 2. Основы обработки изображений.
CV2015. Лекция 2. Основы обработки изображений.CV2015. Лекция 2. Основы обработки изображений.
CV2015. Лекция 2. Основы обработки изображений.
 
CV2011 Lecture 4. Image representation
CV2011 Lecture 4. Image representationCV2011 Lecture 4. Image representation
CV2011 Lecture 4. Image representation
 
CV2011 Lecture 13. Real-time vision
CV2011 Lecture 13. Real-time visionCV2011 Lecture 13. Real-time vision
CV2011 Lecture 13. Real-time vision
 
CV2011 Lecture 3. Basic image analysis
CV2011 Lecture 3. Basic image analysisCV2011 Lecture 3. Basic image analysis
CV2011 Lecture 3. Basic image analysis
 
20120414 videorecognition konushin_lecture04
20120414 videorecognition konushin_lecture0420120414 videorecognition konushin_lecture04
20120414 videorecognition konushin_lecture04
 
CV2011 Lecture 8. Detection
CV2011 Lecture 8. DetectionCV2011 Lecture 8. Detection
CV2011 Lecture 8. Detection
 
20120415 videorecognition konushin_lecture05
20120415 videorecognition konushin_lecture0520120415 videorecognition konushin_lecture05
20120415 videorecognition konushin_lecture05
 
20111009 csseminar image feature detection and matching
20111009 csseminar image feature detection and matching20111009 csseminar image feature detection and matching
20111009 csseminar image feature detection and matching
 

Destacado

Writing a computer vision paper
Writing a computer vision paperWriting a computer vision paper
Writing a computer vision paperAnton Konushin
 
CV2015. Лекция 8. Распознавание лиц людей.
CV2015. Лекция 8. Распознавание лиц людей.CV2015. Лекция 8. Распознавание лиц людей.
CV2015. Лекция 8. Распознавание лиц людей.Anton Konushin
 
Classifier evaluation and comparison
Classifier evaluation and comparisonClassifier evaluation and comparison
Classifier evaluation and comparisonAnton Konushin
 
CV2015. Лекция 6. Нейросетевые алгоритмы.
CV2015. Лекция 6. Нейросетевые алгоритмы.CV2015. Лекция 6. Нейросетевые алгоритмы.
CV2015. Лекция 6. Нейросетевые алгоритмы.Anton Konushin
 
Andrew Zisserman Talk - Part 1a
Andrew Zisserman Talk - Part 1aAndrew Zisserman Talk - Part 1a
Andrew Zisserman Talk - Part 1aAnton Konushin
 
Anton Konushin - TEDxRU 2009
Anton Konushin - TEDxRU 2009Anton Konushin - TEDxRU 2009
Anton Konushin - TEDxRU 2009Anton Konushin
 
Computer vision infrastracture
Computer vision infrastractureComputer vision infrastracture
Computer vision infrastractureAnton Konushin
 
CV2015. Лекция 1. Понятия и история компьютерного зрения. Свет и цвет.
CV2015. Лекция 1. Понятия и история компьютерного зрения. Свет и цвет.CV2015. Лекция 1. Понятия и история компьютерного зрения. Свет и цвет.
CV2015. Лекция 1. Понятия и история компьютерного зрения. Свет и цвет.Anton Konushin
 
Статистическое сравнение классификаторов
Статистическое сравнение классификаторовСтатистическое сравнение классификаторов
Статистическое сравнение классификаторовAnton Konushin
 

Destacado (9)

Writing a computer vision paper
Writing a computer vision paperWriting a computer vision paper
Writing a computer vision paper
 
CV2015. Лекция 8. Распознавание лиц людей.
CV2015. Лекция 8. Распознавание лиц людей.CV2015. Лекция 8. Распознавание лиц людей.
CV2015. Лекция 8. Распознавание лиц людей.
 
Classifier evaluation and comparison
Classifier evaluation and comparisonClassifier evaluation and comparison
Classifier evaluation and comparison
 
CV2015. Лекция 6. Нейросетевые алгоритмы.
CV2015. Лекция 6. Нейросетевые алгоритмы.CV2015. Лекция 6. Нейросетевые алгоритмы.
CV2015. Лекция 6. Нейросетевые алгоритмы.
 
Andrew Zisserman Talk - Part 1a
Andrew Zisserman Talk - Part 1aAndrew Zisserman Talk - Part 1a
Andrew Zisserman Talk - Part 1a
 
Anton Konushin - TEDxRU 2009
Anton Konushin - TEDxRU 2009Anton Konushin - TEDxRU 2009
Anton Konushin - TEDxRU 2009
 
Computer vision infrastracture
Computer vision infrastractureComputer vision infrastracture
Computer vision infrastracture
 
CV2015. Лекция 1. Понятия и история компьютерного зрения. Свет и цвет.
CV2015. Лекция 1. Понятия и история компьютерного зрения. Свет и цвет.CV2015. Лекция 1. Понятия и история компьютерного зрения. Свет и цвет.
CV2015. Лекция 1. Понятия и история компьютерного зрения. Свет и цвет.
 
Статистическое сравнение классификаторов
Статистическое сравнение классификаторовСтатистическое сравнение классификаторов
Статистическое сравнение классификаторов
 

Similar a CV2011-2. Lecture 09. Single view reconstructin.

Presentation Diplom
Presentation DiplomPresentation Diplom
Presentation Diplomguestc80a581
 
Лекция 8 Основы 3D обработки
Лекция 8 Основы 3D обработкиЛекция 8 Основы 3D обработки
Лекция 8 Основы 3D обработкиVictor Kulikov
 
распознавание автомобильного номера в условиях зашумлённости»
распознавание автомобильного номера в условиях зашумлённости»распознавание автомобильного номера в условиях зашумлённости»
распознавание автомобильного номера в условиях зашумлённости»seik0ixtem
 
CV2015. Лекция 5. Выделение объектов.
CV2015. Лекция 5. Выделение объектов.CV2015. Лекция 5. Выделение объектов.
CV2015. Лекция 5. Выделение объектов.Anton Konushin
 
20120413 videorecognition konushin_lecture01
20120413 videorecognition konushin_lecture0120120413 videorecognition konushin_lecture01
20120413 videorecognition konushin_lecture01Computer Science Club
 
Сегментация изображений в компьютерной графике.ppt
Сегментация  изображений в компьютерной графике.pptСегментация  изображений в компьютерной графике.ppt
Сегментация изображений в компьютерной графике.pptssuser413a98
 
Методы видеонавигации
Методы видеонавигацииМетоды видеонавигации
Методы видеонавигацииsimplicio1
 
Геометрическое моделирование
Геометрическое моделированиеГеометрическое моделирование
Геометрическое моделированиеViktoria Vlasenko
 
2016-12-03 01 Вадим Литвинов. От 2D к 3D обзор методов реконструкции поверхно...
2016-12-03 01 Вадим Литвинов. От 2D к 3D обзор методов реконструкции поверхно...2016-12-03 01 Вадим Литвинов. От 2D к 3D обзор методов реконструкции поверхно...
2016-12-03 01 Вадим Литвинов. От 2D к 3D обзор методов реконструкции поверхно...Омские ИТ-субботники
 
Random 121017223838-phpapp02
Random 121017223838-phpapp02Random 121017223838-phpapp02
Random 121017223838-phpapp02lenix94-94
 
20120413 videorecognition konushin_lecture02
20120413 videorecognition konushin_lecture0220120413 videorecognition konushin_lecture02
20120413 videorecognition konushin_lecture02Computer Science Club
 
Лабораторная работа №2
Лабораторная работа №2Лабораторная работа №2
Лабораторная работа №2Tanya1503
 
Построение видеомозаики на основе слабоконтрастных изображений донной поверхн...
Построение видеомозаики на основе слабоконтрастных изображений донной поверхн...Построение видеомозаики на основе слабоконтрастных изображений донной поверхн...
Построение видеомозаики на основе слабоконтрастных изображений донной поверхн...Ekaterina Sakharova
 

Similar a CV2011-2. Lecture 09. Single view reconstructin. (20)

Лекция по Трёхмерной графике
Лекция по Трёхмерной графикеЛекция по Трёхмерной графике
Лекция по Трёхмерной графике
 
3 d графика
3 d графика3 d графика
3 d графика
 
DV-Discovery
DV-DiscoveryDV-Discovery
DV-Discovery
 
Presentation Diplom
Presentation DiplomPresentation Diplom
Presentation Diplom
 
Лекция 8 Основы 3D обработки
Лекция 8 Основы 3D обработкиЛекция 8 Основы 3D обработки
Лекция 8 Основы 3D обработки
 
L06 detection
L06 detectionL06 detection
L06 detection
 
распознавание автомобильного номера в условиях зашумлённости»
распознавание автомобильного номера в условиях зашумлённости»распознавание автомобильного номера в условиях зашумлённости»
распознавание автомобильного номера в условиях зашумлённости»
 
CV2015. Лекция 5. Выделение объектов.
CV2015. Лекция 5. Выделение объектов.CV2015. Лекция 5. Выделение объектов.
CV2015. Лекция 5. Выделение объектов.
 
20120413 videorecognition konushin_lecture01
20120413 videorecognition konushin_lecture0120120413 videorecognition konushin_lecture01
20120413 videorecognition konushin_lecture01
 
Сегментация изображений в компьютерной графике.ppt
Сегментация  изображений в компьютерной графике.pptСегментация  изображений в компьютерной графике.ppt
Сегментация изображений в компьютерной графике.ppt
 
Методы видеонавигации
Методы видеонавигацииМетоды видеонавигации
Методы видеонавигации
 
Геометрическое моделирование
Геометрическое моделированиеГеометрическое моделирование
Геометрическое моделирование
 
3D-графика. ЗИЛ
3D-графика. ЗИЛ3D-графика. ЗИЛ
3D-графика. ЗИЛ
 
2016-12-03 01 Вадим Литвинов. От 2D к 3D обзор методов реконструкции поверхно...
2016-12-03 01 Вадим Литвинов. От 2D к 3D обзор методов реконструкции поверхно...2016-12-03 01 Вадим Литвинов. От 2D к 3D обзор методов реконструкции поверхно...
2016-12-03 01 Вадим Литвинов. От 2D к 3D обзор методов реконструкции поверхно...
 
Random 121017223838-phpapp02
Random 121017223838-phpapp02Random 121017223838-phpapp02
Random 121017223838-phpapp02
 
20120413 videorecognition konushin_lecture02
20120413 videorecognition konushin_lecture0220120413 videorecognition konushin_lecture02
20120413 videorecognition konushin_lecture02
 
Лабораторная работа №2
Лабораторная работа №2Лабораторная работа №2
Лабораторная работа №2
 
Построение видеомозаики на основе слабоконтрастных изображений донной поверхн...
Построение видеомозаики на основе слабоконтрастных изображений донной поверхн...Построение видеомозаики на основе слабоконтрастных изображений донной поверхн...
Построение видеомозаики на основе слабоконтрастных изображений донной поверхн...
 
Vladimir kozhayev isometry handmade
Vladimir kozhayev   isometry handmadeVladimir kozhayev   isometry handmade
Vladimir kozhayev isometry handmade
 
Vladimir kozhayev isometry handmade
Vladimir kozhayev   isometry handmadeVladimir kozhayev   isometry handmade
Vladimir kozhayev isometry handmade
 

CV2011-2. Lecture 09. Single view reconstructin.

  • 1. Реконструкция по 1 изображению Антон Конушин http://courses.graphicon.ru/vision2
  • 2. Этот курс подготовлен при поддержке Microsoft Research
  • 3. Благодарности • В презентации использованы слайды курса «Using geometric information in recognition and scene analysis» от Martial Herbert, CVML 2010
  • 4. Основная задача 3D 2D • Нужно построить 3-х мерную модель по одному изображению (одной проекции на плоскость)
  • 5. Неоднозначность реконструкции • Нужно построить 3-х мерную модель по одной проекции на плоскость • Существует множество возможных решений • В общем виде – неразрешимо from [Sinha and Adelson 1993]
  • 6. Структурированный мир Абстрактный Наш мир хаотический мир упорядоченный и структурированный
  • 7. Модель и структура • Выберем «параметрическую модель» для описания мира • MIT «Block world» как первая модель трехмерного мира • Каждый набор параметров задает некоторую возможную «конфигурацию мира» • Модель накладывает ограничения на возможные виды сцен • Наша задача – вычислить параметры модели, наиболее точно соответствующей изображению • Это называется вывод (inference) MIT «Block world»
  • 8. Ранние работы [Guzman 1968] [Ohta & Kanade 1978] • Guzman (SEE), 1968 • Brooks (ACRONYM), 1979 • Hansen & Riseman • Marr, 1982 (VISIONS), 1978 • Ohta & Kanade, 1978 • Barrow & Tenenbaum 1978 • Yakimovsky & Feldman, 1973
  • 9. Переход к современности Объединим «современные» подходы на основе данных (классификаторы, обученные на тренировочных данных) с представлением знаний и процедурами вывода в единую управляющую структуру (control structure)
  • 10. Общая схема • Можем использовать стандартную схему распознавания изображений с классификацией по признакам изображения Признаки ML box: Интерпретация изображения классификаторы
  • 11. Общая схема • Можем строить набор гипотез описания сцены и использовать их интерпретацию повторно для улучшения результата Гипотезы ML box: классификаторы Признаки Интерпретация изображения Построение гипотез Итерируем
  • 12. Автоматизация • Если что-то невозможно вывести автоматически из изображения, то мы можем попросить кое-что задать пользователя • Ряд методов реконструкции по одному изображению для сложных реальных сцен был вначале предложен именно в интерактивном варианте Автоматические Интерактивные методы методы
  • 13. Уровень реконструкции • Качественная информация • Области (земля, стены, небо) • Перекрытия • Точная реконструкция • Грубая трехмерная поверхность • Детализированная трехмерная поверхность
  • 14. План • Вначале рассмотрим определенные геометрические своиства одного изображения (точки и линии схода) • Затем пройдёмся по разным методам реконструкции • Интерактивный вывод модели • Автоматический вывод модели – Однозначные методы на основе сегментации изображений » Automatic photo pop-up » GML fast urban-reconstruction » Границы перекрытий и применение в распознавании » Make3D – Методы на основе множества гипотез » Geometric image reasoning » Block world revisited
  • 15. План • Вначале рассмотрим определенные геометрические своиства одного изображения (точки и линии схода) • Затем пройдёмся по разным методам реконструкции • Интерактивный вывод модели • Автоматический вывод модели – Однозначные методы на основе сегментации изображений » Automatic photo pop-up » GML fast urban-reconstruction » Границы перекрытий и применение в распознавании » Make3D – Методы на основе множества гипотез » Geometric image reasoning » Block world revisited
  • 17. Точки схода (Vanishing point) • Проекция точки в бесконечности Плоскость изображения Точка схода Центр Проекции Поверхность земли Плоскость изображения Точка схода Центр Проекции Линия на поверхности земли
  • 18. Свойства точек схода Плоскость изображения Точка схода V Центр Проекции C Линия на поверхности земли Линия на поверхности земли • Луч из центра проекции C, проходящий через точку схода v, параллелен линии, на которой лежит точка бесконечности – Почему? » Лежат в одной плоскости » Не пересекаются • У всех параллельных линий одна и та же точка схода v • Точка схода – точка на изображении, где пересекаются проекции параллельных в пространстве прямых • На изображении может быть сколько угодно точек схода – Каждый пиксель может быть точкой схода
  • 19. Вычисление точек схода V P0 D P  P0  tD  PX  tD X   PX / t  DX   DX  P  tDY   PY / t  DY  D  Pt   Y   t P   Y   PZ  tDZ   PZ / t  DZ   DZ         1   1/ t  0  Свойства v  ΠP • P - точка в бесконечности, v – ее проекция • Они зависят от направления прямой • Все параллельные линии P0 + tD, P1 + tD пересекаются в P
  • 20. Линия схода (vanishing line) v1 v2 Множество точек схода • Каждый пучок параллельных прямых на плоскости определяет свою точку схода • Совокупность таких точек схода называется линией схода (или исчезающей линией ) • Для горизонтальной плоскости - линия горизонта • Различные плоскости определяют различные линии схода
  • 21. Линия горизонта • Положение линии горизонта на изображении задает ориентацию камеры относительно плоскости «земли» • Если известна внутренняя калибровка камеры • Для JPEG-файлов калибровку можем считать известной • Определение линии горизонта дает внешнюю калибровку камеры
  • 22. Вычисление точек схода • Поиск прямых отрезков / линий на изображении • Группировка линий по точкам пересечения • Робастные методы (схемы голосования, RANSAC) • Уточнение точек схода для каждой группы линий
  • 23. Вычисление линии горизонта v1 v2 • В городских сценах много прямых линий (отрезков) параллельных земле • Линии не обязательно должны лежать на плоскости земли • Самые «сильные» точки схода будут соответствовать линии горизонта и направлению на зенит • Выберем линию горизонта, как самую «горизонтальную»
  • 24. Вычисление точек схода Идея – одновременно выделять линии и группировать их по точкам схода с помощью графической модели E.Tretyak et al. Single-View geometric analysis of man-made environments, ECCV 2010
  • 25. Графическая модель Пиксели краев группируются в линии, линии группируются по точкам схода, точки схода вляются на горизонт z
  • 26. Сравнение Предыдущие методы Предложенный метод
  • 27. Применение горизонта Плоскость изображения Центр Проекции Высота Поверхность земли Камеры • Определив линию горизонта (калибровку камеры) и зафиксировав высоту камеры мы можем вычислять положение и размер объектов, расположенных на земле • Пересечение луча из ЦП проходящего через выделенную точку здания с плоскостью земли определяет его положение на земле • Объекты можно моделировать их с помощью спрайта (плоскости с маской прозрачности)
  • 28. Высота камеры Плоскость изображения Центр Проекции Поверхность земли Высота Камеры • Высота камеры задает масштаб реконструируемой сцены • Известная высота камеры позволяет вычислять истинные расстояния и размеры объектов • Может быть задана как высота человека или штатива
  • 29. План • Вначале рассмотрим определенные геометрические своиства одного изображения (точки и линии схода) • Затем пройдёмся по разным методам реконструкции • Интерактивный вывод модели • Автоматический вывод модели – Однозначные методы на основе сегментации изображений » Automatic photo pop-up » GML fast urban-reconstruction » Границы перекрытий и применение в распознавании » Make3D – Методы на основе множества гипотез » Geometric image reasoning » Block world revisited
  • 30. Tour into picture • Интерактивная система реконструкции • Модель сцены в виде «комнаты» • Объекты в виде «спрайтов» Y. Horry et al., "Tour Into the Picture: Using a spidery mesh user interface to make animation from a single image", Proc. SIGGRAPH 97, 1997.
  • 31. Схема • Пользователь задает точку схода на изображении по прямым линиям • Прямоугольником задает заднюю «стенку» сцены
  • 32. TIP: Моделирование объектов Модель сцены Спрайты Глубина спрайтов определяется по Выделенные объекты положению на земле
  • 33. TIP: Реконструкция текстуры • Текстура, скрытая дополнительными объектами должна быть реконструирована • В простейшем случае – с помощью “cloning brush”
  • 34. TIP: Результат Сцена с другой точки зрения
  • 36. Single View Metrology • Измерения между параллельными линиями • Измерения между параллельными плоскостями • Определение позиции камеры A. Criminisi et. al. Single-view metrology. ICCV 1999
  • 37. Image-based modeling • Интерактивное построение модели сцены • Набор инструментов для более удобного задания моделей • После построения модели мы можем редактировать изображения с учетом перспективных искажений (клонирование текстуры, переосвщенеие) Oh et al., Image-based modeling and photo editing. SIGGRAPH 2001
  • 38. Плоскость земли Плоскость земли Соответствующая карта глубины
  • 39. Разделение на слои Выделенные вручную Текстура в скрытых областях реконструирована с слои помощью “cloning brush”
  • 40. Моделирование основных слоев • Нижняя линия слоя на поверхности земли определяет положение и ориентацию слоя
  • 41. Моделирование основных слоев Выделенная Результат пользователем линия
  • 42. Моделирование глубины Слои Карта глубины. Для каждого слоя своя карты глубины и все они позиционируются друг относительно друга
  • 43. Модификация глубины вручную • Пользователь вручную специальной кисточкой сдвигает точки ближе/дальше по направлению зрения • Есть набор предопределенных форм – шар, цилиндр, плоскость и т.д.
  • 44. Моделирование сложных фигур • Предположения: объект «выпуклый» • Края наиболее удалены • Ближе к центру – ближе к камере • Генерация соответствующей карты глубины
  • 45. Моделирование лица • Параметрическая модель лица • Ручное сопоставление ключевых точек • Расчет параметров, ориентации и положения модели • Текстурирование
  • 46. Геометрия сцены Грубая, первоначальная Модель после уточнения модель
  • 47. Результат • Сегментация сцены на слои • Реконструкция невидимых частей текстуры с помощью Cloning Brush • 10 часов на примере (52 слоя) • Моделирование глубины • 3 часа Финальная модель с другой точки зрения
  • 49. Google SketchUp http://sketchup.google.com/
  • 52. Другие модели Обобщенные цилиндры
  • 53. Произвольные модели • Интерактивное задание большого количества ограничений • Алгоритм: • Поиск модели, удовлетворяющей ограничениям, путем итерационной минимизации функционала • Адаптивное разбиение полигональной сетки Zhang et. Al. Single View Modeling of Free-Form Scenes, CVPR 2001
  • 57. План • Вначале рассмотрим определенные геометрические своиства одного изображения (точки и линии схода) • Затем пройдёмся по разным методам реконструкции • Интерактивный вывод модели • Автоматический вывод модели – Однозначные методы на основе сегментации изображений » Automatic photo pop-up » GML fast urban-reconstruction » Границы перекрытий и применение в распознавании » Make3D – Методы на основе множества гипотез » Geometric image reasoning » Block world revisited
  • 58. Automatic Photo Pop-Up • Модель – «книжка-раскладушка», плоскость земли и несколько вертикальных плоскостей на ней (здания, объекты) • Вычисление модели в три этапа • Вычисление горизонта по точкам схода и калибровка камеры • Семантическая сегментация изображения на небо, землю, объекты • Подгонка нижней линии по границе земля/объекты Derek Hoiem, Alexei A. Efros, Martial Hebert, Automatic Photo Pop-up, SIGGRAPH 2005
  • 59. Схема алгоритма Вход Сегментация Стены Модель относительно Земля земли Изображение Стены Обучение Небо
  • 60. Признаки Цвет Текстура Положение Точки схода Обратите внимание на использование точек схода
  • 61. Семантическая сегментация Суп сегментаций + бустинг
  • 62. Результат сегментации Исходное Сегментированное изображение изображение Земля – зеленый Стены – красный Небо - синий
  • 63. Вычисление нижней линии • Вычисление границ между «стенами» и «землей» • Границы приближаются прямыми линиями • Поиск прямых с помощью преобразования Хафа
  • 64. Вычисление нижней линии • Отдельные сегменты соединяются в ломаные • Объединяются отрезки, пересекающиеся под малыми углами • Убираются небольшие пересекающиеся ломаные • Вычисляется линия горизонта
  • 65. Моделирование «стен» • Определение положения и ориентации каждого полигона по нижней ломаной линии • Поиск верхней границы «стены» и «неба» • «Обрезание» по верхней границе каждого полигона
  • 67. Примеры моделей Входные Автоматическая изображения реконструкция
  • 68. Примеры моделей Входные Автоматическая изображения реконструкция
  • 69.
  • 70. Проект GML + SAIT Комбинирование схемы AutoPopup + множества изображений Vezhnevets V, Konushin A, Ignatenko A. Interactive image-based urban modeling. In: PIA-2007.
  • 71. Модель сцены Идея – разбиение сцены на вертикальные плоскости, выделение точек схода в каждой плоскости, оценка вертикального положения ломанной линии разделения земля/здания O.Barinova et. al. Fast automatic single-view 3-d reconstruction of urban scenes. ECCV 2008
  • 74. Оценка перекрытий • Нет перекрытия • Регион 1 перекрывает • Регион 2 перекрывает D. Hoiem, A. N. Stein, A. A. Efros, and M. Hebert. Recovering occlusion boundaries from an image. In ICCV, 2007
  • 75. Признаки по изображению Регионы Опора Пористый Вертикальный Небо Края
  • 76. Упорядочивание по глубине Минимальная по глубине интерпретация Производный признак Максимальная по глубине интерпретация
  • 77. Перекрытия Изображение Пересегментация Подсказки перекрытий Обучение Совместная кластеризация Следующая P(перекрытия) сегментация
  • 78. Перекрытия Изображение Пересегментация Подсказки перекрытий Обучение Совместная кластеризация Следующая P(перекрытия) сегментация
  • 79. Пример 1-ая итерация 2-ая итерация 3-я итерация
  • 82. Make 3D • Цель: восстановление карты глубины • Карта глубины приближается сеткой, в узлах которой стоят сегменты изображения Параметры глубины и наклона плоскостей Границы объектов и перегибы Признаки изображения Ashutosh Saxena, Min Sun, Andrew Y NgMake3D: Learning 3-D Scene Structure from a . Single Still Image, In IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI), 2008
  • 83. Make 3D • Используется глобальная модель • Марковское поле • Модель настраивается на данных с лазерного сканера
  • 88. Контекст и распознавание True Detection False Detections Missed Missed True Detections Local Detector: [Dalal-Triggs 2005]
  • 89. Замыкая круг Поверхности Глубина, границы Поверхности Перекрытия Размеры объектов Объекты и точка зрения
  • 90. Поверхности  Объекты • Поверхности  Обнаружение объектов • Основание • Обнаруженные объекты  Поверхности • Определяет тип поверхности + Обнаруженная Неверная разметка Улучшение разметки машина машины, как машины основания
  • 91. Поверхности  Перекрытия • Поверхности  Границы перекрытий • Вероятны перекрытия вдоль границ поверхностей • Нужны для оценки глубины • Границы перекрытий  Поверхности • Улучшают сегментацию • Помогают определить ориентацию поверхностей + Найденные границы Часть поля Исправление перекрытий помечена как ошибки вертикальная плоскость
  • 92. Объекты  Перекрытия • Обнаруженные объекты  Границы перекрытий • Границы внутри объектов вряд ли перекрытия • Границы между объектами вероятно перекрытия • Границы перекрытий  Обнаружение объектов • Обнаруженные объекты должны иметь соответствующие границ + Обнаруженная Пропущен часть Правильно машина области перекрытия восстановленное машиной перекрытие машиной
  • 93. Независимая оценка Изображение Поверхности Границы перекрытий Объекты
  • 94. Совместная оценка Изображение Поверхности Границы перекрытий Объекты
  • 95. Независимая оценка Изображение Поверхности Границы перекрытий Объекты
  • 96. Совместная оценка Изображение Поверхности Границы перекрытий Объекты
  • 97. План • Вначале рассмотрим определенные геометрические своиства одного изображения (точки и линии схода) • Затем пройдёмся по разным методам реконструкции • Интерактивный вывод модели • Автоматический вывод модели – Однозначные методы на основе сегментации изображений » Automatic photo pop-up » GML fast urban-reconstruction » Границы перекрытий и применение в распознавании » Make3D – Методы на основе множества гипотез » Geometric image reasoning » Block world revisited
  • 98. Множественные гипотезы • Предположим, сцена состоит из набора плоскостей • Но плоскости не хаотично расположены, а группируются в структурные элементы • Будем выдвигать гипотезы о группировке плоскостей, исходя из наших представлений о том, как строятся здания D. Lee, T. Kanade, M. Hebert. Geometric Reasoning for Single Image Structure Recovery. CVPR 2009
  • 99. Манхеттенский мир • Предположение, что все прямые линии в сцене соответствуют трём ортогональным направлениям (трём «ортогональным» точкам схода) • Будем считать, что сцена состоит из плоскостей, в которых лежат прямые линии • Предположение «манхеттеновский мир» нужно нам для уменьшения количества возможных конфигураций сцены
  • 100. Возможные конфигурации Вогнутый угол Выпуклый угол Перекрытие
  • 102. Схема метода • Поиск прямых отрезков • Вычисление точек схода и группировака отрезков по точкам схода • Построение гипотез о структуре сцены • Проверка гипотез
  • 116. Расширяем ограничения • Ограниченные по объёму объекты • Пространственное исключение • Содержание
  • 117. Смысл ограничений Сегментация Убираем Вывод только по 2D изображения объект Изображение Моделируем Вывод с учетом 3D объект объемов
  • 118. Схема алгоритма Изображение Линии и точки Гипотезы схода комнаты Отбраковка невозможных конфигураций Геометрический Ориентация Гипотезы контекст объектов Оценка Результат Гипотезы конфигурации сцены
  • 120. Возврат к блокам • Переход от плоскостей к блокам позволяет расширить множество ограничений, которые накладываются на сцену • Интерпретация сцены становится более обоснованной A. Gupta, A. Efros, and M. Hebert. Blocks World Revisited: Image Understanding Using Qualitative Geometry and Mechanics. ECCV 2010
  • 121. Блоки вместо плоскостей • Ограничение 1 – плоскости должны объединяться в блоки
  • 122. Стабильность • Статическое равновесие – блок должен быть устойчивым
  • 123. Устойчивость • Внутренняя устойчивость – внутри одного блока основание должно быть плотнее верха, а не наоборот
  • 124. Схема Инициализация – вычисление Последовательно добавляем набора сегментов с блоки по одному в сцену признаками по изображению
  • 129. Резюме лекции • Основой для реконструкции 3д моделей по одному изображению является: • Выбранная параметрическая модель сцены • Набор ограничений, которым должна удовлетворять модель • Метод извлечения признаков из изображения • Метод вывода (оценки параметров) модели по извлеченным признакам • Текущие направления: • Генерация множества гипотез описания сцены и оценка их соответствия изображению • Усложнение модели и расширение набора ограничений