SlideShare a Scribd company logo
1 of 59
Download to read offline
Обзор методов
сопоставления шаблона
и изображения
Алексей Федоров
Video Group
CS MSU Graphics & Media Lab
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Local Image Interest Point
 Template Matching Based on Fourier
Coefficients
 Linear Scale and Rotation Invariant Matching
 Дополненная реальность
 Заключение
2
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Введение
Постановка задачи
3
Устойчивый относительно геометрических
искажений поиск шаблона на изображении
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Введение
Геометрические преобразования
 Параллельный перенос
 Подобие (перенос,
масштабирование, поворот)
 Аффинное
 Проективное
4
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Введение
Простейший подход – «грубой силы»
1. Выбирается модель преобразования
2. Определяется набор параметров, описывающих
модель
3. Выбирается функция сопоставления изображений
Sum of Absolute Differences (SAD), Sum of Squared
Differences (SSD), Normalized Cross Correlation (NCC), etc.
4. Перебираются всевозможные значения параметров
в разумных пределах
5
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Local Image Interest Point
 Template Matching Based on Fourier
Coefficients
 Linear Scale and Rotation Invariant Matching
 Дополненная реальность
 Заключение
6
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Local Image Interest Point
Схема работы
7
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
1. Выбираем ключевые точки
2. Применяем классическое вейвлет-преобразование
к окрестностям ключевых точек и высокочастотные
компоненты считаем особенностями
3. Сопоставляем ключевые точки
Название предложенного метода:
Rotation and Scale Invariant Matching (RASIM)
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Блобы
А. Конушин, «Сопоставление изображений и локальные
особенности», лекции по курсу «Введение в компьютерное
зрение», 2012
8
Сигнал
Край
Сигнал
Блоб
Пример блобов
Поиск блобов
осуществляется
с помощью разницы
Гауссиан (DoG)
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Выбор ключевых точек
9
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
 Для поиска применяется псевдо-лог-полярная сетка
дискретизации
 Ключевые точки находятся при поиске максимумов
и минимумов в масштабированном изображении
 Масштабируется при помощи
разницы Гауссиан (DoG)
Псевдо-лог-полярная
сетка дискретизации
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Вейвлет-преобразование
10
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
– высокочастотный и низкочастотный фильтры
Быстрое вейвлет-
преобразование
– входной сигнал
– высокочастотная и низкочастотная компоненты
– старая высокочастотная компонента
– фильтр прогнозирования
– операция свертки
,
,
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
– размерность фильтра прогнозирования
– количество выбранных больших высокочастотных
компонент с индексами
Вейвлет-преобразование
Фильтр прогнозирования
11
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
Фильтр прогнозирования получается решением
системы для компонент, полученных от шаблонного
изображения
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Взвешенная адаптация
12
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
– система с предыдущего слайда
– максимальная и минимальная компонента,
– некоторая константа
– операция поэлементного умножения
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Измерение подобия (1)
13
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
Метод разделен на две части: «оффлайн» и «онлайн»
«Оффлайн»:
1. Выбираем вейвлет преобразование и значения
параметров и
2. Вычисляем фильтр прогнозирования
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Измерение подобия (2)
14
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
«Онлайн»:
1. Применяем вейвлет преобразование
2. Заполняем вектор
3. Суммируем вектор в окне
такой же длины (2L), как
и сигнал шаблона
Максимальное значение суммы достигается
при наилучшем соответствии
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Постобработка
Преобразование Хафа
15
http://en.wikipedia.org/wiki/Hough_transform
Метод предназначен для поиска объектов,
принадлежащих определённому классу фигур
с использованием процедуры голосования
Угол
Расстояние
Входное изображение Преобразованное изображение
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результат
Статистика качества детектирования
16
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
Правильно
обнаружены(%)
Масштабшаблона
(множитель)
Угол поворота (градусы)
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результат
Сравнение с конкурентом
17
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Статистика
производительности
18
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
Время работы на одном изображении
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Выводы
Достоинство:
 Устойчивость к поворотам
и масштабированию
Недостатки:
 Низкая скорость работы
 Неустойчивость к изменениям перспективы
19
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Local Image Interest Point
 Template Matching Based on Fourier
Coefficients
 Linear Scale and Rotation Invariant Matching
 Дополненная реальность
 Заключение
20
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Template Matching Based
on Fourier Coefficients
Обозначения:
Forapro – название предложенного алгоритма
A – исходное изображение
Q – шаблон
Стабильной называется точка,
которая имеет некоторую
окрестность, в которой направление
градиента сохраняется
21
H.Y. Kim, “Rotation-Discriminating Template Matching Based
on Fourier Coefficients of Radial Projections with Robustness
to Scaling and Partial Occlusion,” Pattern Recognition, 2010
Белые – стабильные
точки, красные – нет
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
 Значения цвета на радиальной
и круговой проекциях в точке
представляют собой значения
дискретных функций
 Приблизим их непрерывными
функциями и разложим
последние в ряды Фурье
 Вычислим первые L(K) комплексных
коэффициентов ci(ri) разложения круговой
(радиальной) функции в ряд Фурье
Forapro
Идеи метода (1)
22
H.Y. Kim, “Rotation-Discriminating Template Matching Based
on Fourier Coefficients of Radial Projections with Robustness
to Scaling and Partial Occlusion,” Pattern Recognition, 2010
Радиальная
проекция
в точке
C(A(x,y))
Круговая
проекция
в точке
R(A(x,y))
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Вычислим вектор особенностей vf, инвариантных
к поворотам и масштабированию
, – полярный угол и длина комплексного числа
Forapro
Идеи метода (2)
23
H.Y. Kim, “Rotation-Discriminating Template Matching Based
on Fourier Coefficients of Radial Projections with Robustness
to Scaling and Partial Occlusion,” Pattern Recognition, 2010
– функция расстояния между
двумя векторами особенностей
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
1. Вычисляются значения коэффициентов ci, ri и vf
для всех точек A и Q
2. Выбираются N стабильных точек из Q, которые
образуют множество {T}
3. Для i от 1 до N
Для каждого пикселя (x,y) из A вычисляются
Находится пиксель с самым малым отклонением
и добавляется в массив
4. С помощью преобразования Хафа уточняется
результат
Forapro
Шаги алгоритма
24
H.Y. Kim, “Rotation-Discriminating Template Matching Based
on Fourier Coefficients of Radial Projections with Robustness
to Scaling and Partial Occlusion,” Pattern Recognition, 2010
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты (1)
25
H.Y. Kim, “Rotation-Discriminating Template Matching Based
on Fourier Coefficients of Radial Projections with Robustness
to Scaling and Partial Occlusion,” Pattern Recognition, 2010
Исходное изображение Результат
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты (2)
26
H.Y. Kim, “Rotation-Discriminating Template Matching Based
on Fourier Coefficients of Radial Projections with Robustness
to Scaling and Partial Occlusion,” Pattern Recognition, 2010
Исходное изображение Результат
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Выводы
Достоинства:
 Устойчивость:
 к изменениям по яркости и контрасту
 к поворотам и масштабированию
Недостатки:
 Невысокая скорость работы
 Неустойчивость к изменениям перспективы
27
H.Y. Kim, “Rotation-Discriminating Template Matching Based
on Fourier Coefficients of Radial Projections with Robustness
to Scaling and Partial Occlusion,” Pattern Recognition, 2010
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Local Image Interest Point
 Template Matching Based on Fourier
Coefficients
 Linear Scale and Rotation Invariant
Matching
 Дополненная реальность
 Заключение
28
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Linear Scale and Rotation
Invariant Matching
29H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
Обозначения:
– множество точек шаблона
– множество пар точек из
– некоторые точки из множества
– точки, соответствующие
– стоимость сопоставления
(зависит от векторов особенностей)
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Основная идея метода
30H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
Сопоставляем точки шаблона и изображения,
решая задачу линейного программирования (ЛП)
Стандартная постановка задачи ЛП:
Максимизировать функцию
при условиях для i = 1, 2, …, m,
где cj, aij, bi – некоторые константы


n
j
jj xcxF
1
)(
i
n
j
jij bxa 1
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Идеи метода
Критерий сопоставления (1)
31H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
– локальная стоимость сопоставления
– пространственная стоимость
сопоставления
– весовой коэффициент
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
– стоимость сопоставления,
инвариантная относительно
масштабирования и поворота
– коэффициент масштабирования
– матрица поворота (2×2)
Идеи метода
Критерий сопоставления (2)
32H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Идеи метода
Критерий сопоставления (3)
33H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
– бинарная матрица сопоставления
точек шаблона и изображения
– транспонированная матрица
стоимостей сопоставления
– матрица инцидентности ребер
– координаты точки шаблона
– координаты точки изображения
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
 Добавляются масштабированные шаблоны поиска
 Изменяется матрица поворота
Идеи метода
Линеаризация
34H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
Линеаризованные параметры:
Исходные параметры:
– бинарная матрица сопоставления точек
масштабированного шаблона и изображения
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Шаги алгоритма
35H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
1. Вычисление матрицы С стоимостей сопоставления
точек шаблона и изображения
2. Выбор региона доверия для каждой точки шаблона
3. Вычисление минимальной выпуклой оболочки вершин
из региона доверия для каждой точки шаблона
4. Решение задачи линейного программирования
5. Уменьшение регионов доверия. Если точки
сопоставились хорошо, то выводятся результаты,
иначе – перейти на шаг 3
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Пример работы алгоритма
36H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
(а) – шаблон, (b) – начальное приближение,
(c)–(i) – итерации алгоритма, (j) – результат
Цветные прямоугольники – регионы доверия
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результат
Сравнение с конкурентами
37H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
O. Duchenne, et al.
“Tensor-Based
Algorithm for High-Order
Graph Matching,” 2009
Предложенный
алгоритм
Шаблон Кадры видеопоследовательности
S. Belongie, et al.
“Shape Matching Using
Shape Contexts,” 2002
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результат
Объекты с сильной деформацией (1)
38H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
Шаблон Кадры видеопоследовательности
Кадры видеопоследовательности
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результат
Объекты с сильной деформацией (2)
39H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
Шаблон Кадры видеопоследовательности
Кадры видеопоследовательности
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Статистика
производительности
40H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
#frames – количество кадров в видеопоследовательности
#model – количество точек в шаблоне
#target – количество точек на изображении
time – время работы на 1 кадре (сек) на 2.8 GHz PC
accuracy – средняя точность по всей видеопоследовательности
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Выводы
Достоинства:
 Стабильность
 Высокая скорость работы
Недостаток:
 Не оговаривается, как выбирать точки для
сопоставления
41H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Local Image Interest Point
 Template Matching Based on Fourier
Coefficients
 Linear Scale and Rotation Invariant Matching
 Дополненная реальность
 Заключение
42
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Пример применения
Дополненная реальность – добавление
к поступающим из реального мира
ощущениям мнимых объектов
43
http://vitodibari.com/ru/hit-lab.html
Пример
дополненной
реальности
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Дополненная реальность
Как это работает?
44
http://www.artag.net/index.html
Находятся и распознаются специальные маркеры,
затем дорисовывается нужная информация
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Дополненная реальность
Системы маркеров
45Martin Hirzer, “Marker Detection for Augmented Reality
Applications,” Project Image Analysis Graz, 2008
Некоторые системы маркеров
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Дополненная реальность
Библиотеки
На данный момент существует несколько
неплохих открытых реализаций поиска
и трекинга маркеров:
 ARToolKit (и дочерние)
 ZBar
…
В OpenCV по умолчанию трекинга
маркеров нет
46
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Дополненная реальность
Поиск маркеров
47Martin Hirzer, “Marker Detection for Augmented Reality
Applications,” Project Image Analysis Graz, 2008
Один из методов поиска маркеров
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результат
Сравнение с конкурентами (1)
48Martin Hirzer, “Marker Detection for Augmented Reality
Applications,” Project Image Analysis Graz, 2008
Предложенный алгоритм
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результат
Сравнение с конкурентами (2)
49Martin Hirzer, “Marker Detection for Augmented Reality
Applications,” Project Image Analysis Graz, 2008
ARToolKit
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результат
Сравнение с конкурентами (3)
50Martin Hirzer, “Marker Detection for Augmented Reality
Applications,” Project Image Analysis Graz, 2008
Предложенный
алгоритм
ARToolKit
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Выводы
Достоинства:
 Устойчивость к частичным перекрытиям
 Высокая скорость работы
Недостаток:
 Неустойчивость к изменениям яркости
(не работает на темных объектах)
51Martin Hirzer, “Marker Detection for Augmented Reality
Applications,” Project Image Analysis Graz, 2008
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Local Image Interest Point
 Template Matching Based on Fourier
Coefficients
 Linear Scale and Rotation Invariant Matching
 Дополненная реальность
 Заключение
52
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Заключение
 Рассмотренные алгоритмы с разных сторон
подходят к решению задачи поиска
и сопоставления шаблона и изображения
 У каждого есть свои плюсы и минусы,
область применения
53
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Проделанная работа
Протестирована работоспособность
библиотеки ZBar по поиску маркеров
 Входные данные: изображения (19 мегапикселей),
приближенные к «боевым»
 Время работы: 2–3 секунды
 Результат: все метки найдены
54
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Проделанная работа
Результаты
55
Изображение, приближенное к реальному
тестированию устройств
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Дальнейшие планы
 Создание программы-визарда для
автоматического тестирования 3D-устройств
 Тестирование новых и уже имеющихся
3D-устройств
 Разработка системы тестирования
стереоскопического зрения
56
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Литература
1. M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale Invariant
Matching of Local Image Interest Points,” IEEE Transactions on Image
Processing, vol. 20, 2011, pp. 3580–3591.
2. H.Y. Kim, “Rotation-discriminating Template Matching Based on Fourier
Coefficients of Radial Projections with Robustness to Scaling and Partial
Occlusion,” Elsevier Pattern Recognition, vol. 43, 2010, pp. 859–872.
3. H. Jiang, S.X. Yu, and D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Transactions on Pattern Analysis and Machine
Intelligence, vol. 33, no. 7, 2011, pp. 1339–1355.
4. Martin Hirzer, “Marker Detection for Augmented Reality Applications,”
Project Image Analysis Graz, 2008, pp. 1–25.
5. А. Конушин, «Сопоставление изображений и локальные
особенности», лекции по курсу «Введение в компьютерное зрение»,
2012, стр. 45–79.
57
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Вопросы?
Предложения?
Наряды?
58
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Лаборатория компьютерной
графики и мультимедиа
Видеогруппа — это:
 Выпускники в аспирантурах
Англии, Франции, Швейцарии
(в России в МГУ и ИПМ им. Келдыша)
 Выпускниками защищены 5 диссертаций
 Наиболее популярные в мире сравнения
видеокодеков
 Более 3 миллионов скачанных фильтров
обработки видео
59

More Related Content

What's hot

Получение глубины из движения камеры
Получение глубины из движения камерыПолучение глубины из движения камеры
Получение глубины из движения камерыMSU GML VideoGroup
 
Цветонезависимое сопоставление стерео
Цветонезависимое сопоставление стереоЦветонезависимое сопоставление стерео
Цветонезависимое сопоставление стереоMSU GML VideoGroup
 
Обзор методов сегментации видео
Обзор методов сегментации видеоОбзор методов сегментации видео
Обзор методов сегментации видеоMSU GML VideoGroup
 
Обзор стандарта H.265/HEVC
Обзор стандарта H.265/HEVCОбзор стандарта H.265/HEVC
Обзор стандарта H.265/HEVCMSU GML VideoGroup
 
Методы цветокоррекции стереовидео
Методы цветокоррекции стереовидеоМетоды цветокоррекции стереовидео
Методы цветокоррекции стереовидеоMSU GML VideoGroup
 
Обзор алгоритмов генерации ракурсов для многоракурсных видео
Обзор алгоритмов генерации ракурсов для многоракурсных видеоОбзор алгоритмов генерации ракурсов для многоракурсных видео
Обзор алгоритмов генерации ракурсов для многоракурсных видеоMSU GML VideoGroup
 
Точное выделение границ объектов
Точное выделение границ объектовТочное выделение границ объектов
Точное выделение границ объектовMSU GML VideoGroup
 
Методы повышения визуального качества восстановленного фона (часть 2)
Методы повышения визуального качества восстановленного фона (часть 2)Методы повышения визуального качества восстановленного фона (часть 2)
Методы повышения визуального качества восстановленного фона (часть 2)MSU GML VideoGroup
 
Некоторые методы проектирования и оптимизации кода
Некоторые методы проектирования и оптимизации кодаНекоторые методы проектирования и оптимизации кода
Некоторые методы проектирования и оптимизации кодаMSU GML VideoGroup
 
Исправление различий резкости в 3D видео
Исправление различий резкости в 3D видеоИсправление различий резкости в 3D видео
Исправление различий резкости в 3D видеоMSU GML VideoGroup
 
Обзор докладов конференции IC3D 2012
Обзор докладов конференции IC3D 2012Обзор докладов конференции IC3D 2012
Обзор докладов конференции IC3D 2012MSU GML VideoGroup
 
Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...
Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...
Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...MSU GML VideoGroup
 
Некоторые методы сегментации видео
Некоторые методы сегментации видеоНекоторые методы сегментации видео
Некоторые методы сегментации видеоMSU GML VideoGroup
 
Некоторые методы восстановления фона
Некоторые методы восстановления фонаНекоторые методы восстановления фона
Некоторые методы восстановления фонаMSU GML VideoGroup
 
Метрики оценки качества конвертированного стерео
Метрики оценки качества конвертированного стереоМетрики оценки качества конвертированного стерео
Метрики оценки качества конвертированного стереоMSU GML VideoGroup
 
Некоторые алгоритмы многомерной обработки изображений
Некоторые алгоритмы многомерной обработки изображенийНекоторые алгоритмы многомерной обработки изображений
Некоторые алгоритмы многомерной обработки изображенийMSU GML VideoGroup
 
Некоторые методы повышения качества построения стерео
Некоторые методы повышения качества построения стереоНекоторые методы повышения качества построения стерео
Некоторые методы повышения качества построения стереоMSU GML VideoGroup
 
Исправление стерео видео
Исправление стерео видеоИсправление стерео видео
Исправление стерео видеоMSU GML VideoGroup
 
Некоторые методы матирования видео
Некоторые методы матирования видеоНекоторые методы матирования видео
Некоторые методы матирования видеоMSU GML VideoGroup
 

What's hot (20)

Получение глубины из движения камеры
Получение глубины из движения камерыПолучение глубины из движения камеры
Получение глубины из движения камеры
 
Цветонезависимое сопоставление стерео
Цветонезависимое сопоставление стереоЦветонезависимое сопоставление стерео
Цветонезависимое сопоставление стерео
 
Обзор методов сегментации видео
Обзор методов сегментации видеоОбзор методов сегментации видео
Обзор методов сегментации видео
 
Обзор стандарта H.265/HEVC
Обзор стандарта H.265/HEVCОбзор стандарта H.265/HEVC
Обзор стандарта H.265/HEVC
 
Методы цветокоррекции стереовидео
Методы цветокоррекции стереовидеоМетоды цветокоррекции стереовидео
Методы цветокоррекции стереовидео
 
Обзор алгоритмов генерации ракурсов для многоракурсных видео
Обзор алгоритмов генерации ракурсов для многоракурсных видеоОбзор алгоритмов генерации ракурсов для многоракурсных видео
Обзор алгоритмов генерации ракурсов для многоракурсных видео
 
Deringing Cartoons
Deringing CartoonsDeringing Cartoons
Deringing Cartoons
 
Точное выделение границ объектов
Точное выделение границ объектовТочное выделение границ объектов
Точное выделение границ объектов
 
Методы повышения визуального качества восстановленного фона (часть 2)
Методы повышения визуального качества восстановленного фона (часть 2)Методы повышения визуального качества восстановленного фона (часть 2)
Методы повышения визуального качества восстановленного фона (часть 2)
 
Некоторые методы проектирования и оптимизации кода
Некоторые методы проектирования и оптимизации кодаНекоторые методы проектирования и оптимизации кода
Некоторые методы проектирования и оптимизации кода
 
Исправление различий резкости в 3D видео
Исправление различий резкости в 3D видеоИсправление различий резкости в 3D видео
Исправление различий резкости в 3D видео
 
Обзор докладов конференции IC3D 2012
Обзор докладов конференции IC3D 2012Обзор докладов конференции IC3D 2012
Обзор докладов конференции IC3D 2012
 
Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...
Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...
Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...
 
Некоторые методы сегментации видео
Некоторые методы сегментации видеоНекоторые методы сегментации видео
Некоторые методы сегментации видео
 
Некоторые методы восстановления фона
Некоторые методы восстановления фонаНекоторые методы восстановления фона
Некоторые методы восстановления фона
 
Метрики оценки качества конвертированного стерео
Метрики оценки качества конвертированного стереоМетрики оценки качества конвертированного стерео
Метрики оценки качества конвертированного стерео
 
Некоторые алгоритмы многомерной обработки изображений
Некоторые алгоритмы многомерной обработки изображенийНекоторые алгоритмы многомерной обработки изображений
Некоторые алгоритмы многомерной обработки изображений
 
Некоторые методы повышения качества построения стерео
Некоторые методы повышения качества построения стереоНекоторые методы повышения качества построения стерео
Некоторые методы повышения качества построения стерео
 
Исправление стерео видео
Исправление стерео видеоИсправление стерео видео
Исправление стерео видео
 
Некоторые методы матирования видео
Некоторые методы матирования видеоНекоторые методы матирования видео
Некоторые методы матирования видео
 

Similar to Обзор методов сопоставления шаблона и изображения

Обзор подходов к измерению качества 3D видео
Обзор подходов к измерению качества 3D видеоОбзор подходов к измерению качества 3D видео
Обзор подходов к измерению качества 3D видеоMSU GML VideoGroup
 
Алгоритмы для задачи матирования
Алгоритмы для задачи матированияАлгоритмы для задачи матирования
Алгоритмы для задачи матированияMSU GML VideoGroup
 
Обработка областей открытия при распространении карт глубины
Обработка областей открытия при распространении карт глубиныОбработка областей открытия при распространении карт глубины
Обработка областей открытия при распространении карт глубиныMSU GML VideoGroup
 
Некоторые методы сопоставления стерео
Некоторые методы сопоставления стереоНекоторые методы сопоставления стерео
Некоторые методы сопоставления стереоMSU GML VideoGroup
 
Некоторые методы генерации многоракурсных изображений на основе карты глубины
Некоторые методы генерации многоракурсных изображений на основе карты глубиныНекоторые методы генерации многоракурсных изображений на основе карты глубины
Некоторые методы генерации многоракурсных изображений на основе карты глубиныMSU GML VideoGroup
 
Denis Perevalov -- Computer Vision with OpenCV 2
Denis Perevalov -- Computer Vision with OpenCV 2Denis Perevalov -- Computer Vision with OpenCV 2
Denis Perevalov -- Computer Vision with OpenCV 2Uralcsclub
 
Вычисление глубины по одному изображению
Вычисление глубины по одному изображениюВычисление глубины по одному изображению
Вычисление глубины по одному изображениюMSU GML VideoGroup
 
Современные методы Optical Flow c GPU реализацией
Современные методы Optical Flow c GPU реализациейСовременные методы Optical Flow c GPU реализацией
Современные методы Optical Flow c GPU реализациейMSU GML VideoGroup
 
Восстановление старых фильмов
Восстановление старых фильмовВосстановление старых фильмов
Восстановление старых фильмовMSU GML VideoGroup
 
Построение гендерного классификатора
Построение гендерного классификатораПостроение гендерного классификатора
Построение гендерного классификатораVladimir Pavlov
 
Генерация текстур
Генерация текстурГенерация текстур
Генерация текстурMSU GML VideoGroup
 
Новые методы деинтерлейсинга
Новые методы деинтерлейсингаНовые методы деинтерлейсинга
Новые методы деинтерлейсингаMSU GML VideoGroup
 
Измерение качества видео
Измерение качества видеоИзмерение качества видео
Измерение качества видеоMSU GML VideoGroup
 
Расширения h264 и предобзор h265
Расширения h264 и предобзор h265Расширения h264 и предобзор h265
Расширения h264 и предобзор h265MSU GML VideoGroup
 
Анализ парапетров кодеков
Анализ парапетров кодековАнализ парапетров кодеков
Анализ парапетров кодековMSU GML VideoGroup
 
Обзор методов вычисления базовой геометрии сцены
Обзор методов вычисления базовой геометрии сценыОбзор методов вычисления базовой геометрии сцены
Обзор методов вычисления базовой геометрии сценыMSU GML VideoGroup
 
Распознавание и удаление субтитров
Распознавание и удаление субтитровРаспознавание и удаление субтитров
Распознавание и удаление субтитровMSU GML VideoGroup
 

Similar to Обзор методов сопоставления шаблона и изображения (17)

Обзор подходов к измерению качества 3D видео
Обзор подходов к измерению качества 3D видеоОбзор подходов к измерению качества 3D видео
Обзор подходов к измерению качества 3D видео
 
Алгоритмы для задачи матирования
Алгоритмы для задачи матированияАлгоритмы для задачи матирования
Алгоритмы для задачи матирования
 
Обработка областей открытия при распространении карт глубины
Обработка областей открытия при распространении карт глубиныОбработка областей открытия при распространении карт глубины
Обработка областей открытия при распространении карт глубины
 
Некоторые методы сопоставления стерео
Некоторые методы сопоставления стереоНекоторые методы сопоставления стерео
Некоторые методы сопоставления стерео
 
Некоторые методы генерации многоракурсных изображений на основе карты глубины
Некоторые методы генерации многоракурсных изображений на основе карты глубиныНекоторые методы генерации многоракурсных изображений на основе карты глубины
Некоторые методы генерации многоракурсных изображений на основе карты глубины
 
Denis Perevalov -- Computer Vision with OpenCV 2
Denis Perevalov -- Computer Vision with OpenCV 2Denis Perevalov -- Computer Vision with OpenCV 2
Denis Perevalov -- Computer Vision with OpenCV 2
 
Вычисление глубины по одному изображению
Вычисление глубины по одному изображениюВычисление глубины по одному изображению
Вычисление глубины по одному изображению
 
Современные методы Optical Flow c GPU реализацией
Современные методы Optical Flow c GPU реализациейСовременные методы Optical Flow c GPU реализацией
Современные методы Optical Flow c GPU реализацией
 
Восстановление старых фильмов
Восстановление старых фильмовВосстановление старых фильмов
Восстановление старых фильмов
 
Построение гендерного классификатора
Построение гендерного классификатораПостроение гендерного классификатора
Построение гендерного классификатора
 
Генерация текстур
Генерация текстурГенерация текстур
Генерация текстур
 
Новые методы деинтерлейсинга
Новые методы деинтерлейсингаНовые методы деинтерлейсинга
Новые методы деинтерлейсинга
 
Измерение качества видео
Измерение качества видеоИзмерение качества видео
Измерение качества видео
 
Расширения h264 и предобзор h265
Расширения h264 и предобзор h265Расширения h264 и предобзор h265
Расширения h264 и предобзор h265
 
Анализ парапетров кодеков
Анализ парапетров кодековАнализ парапетров кодеков
Анализ парапетров кодеков
 
Обзор методов вычисления базовой геометрии сцены
Обзор методов вычисления базовой геометрии сценыОбзор методов вычисления базовой геометрии сцены
Обзор методов вычисления базовой геометрии сцены
 
Распознавание и удаление субтитров
Распознавание и удаление субтитровРаспознавание и удаление субтитров
Распознавание и удаление субтитров
 

Обзор методов сопоставления шаблона и изображения

  • 1. Обзор методов сопоставления шаблона и изображения Алексей Федоров Video Group CS MSU Graphics & Media Lab
  • 2. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Local Image Interest Point  Template Matching Based on Fourier Coefficients  Linear Scale and Rotation Invariant Matching  Дополненная реальность  Заключение 2
  • 3. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Введение Постановка задачи 3 Устойчивый относительно геометрических искажений поиск шаблона на изображении
  • 4. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Введение Геометрические преобразования  Параллельный перенос  Подобие (перенос, масштабирование, поворот)  Аффинное  Проективное 4
  • 5. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Введение Простейший подход – «грубой силы» 1. Выбирается модель преобразования 2. Определяется набор параметров, описывающих модель 3. Выбирается функция сопоставления изображений Sum of Absolute Differences (SAD), Sum of Squared Differences (SSD), Normalized Cross Correlation (NCC), etc. 4. Перебираются всевозможные значения параметров в разумных пределах 5
  • 6. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Local Image Interest Point  Template Matching Based on Fourier Coefficients  Linear Scale and Rotation Invariant Matching  Дополненная реальность  Заключение 6
  • 7. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Local Image Interest Point Схема работы 7 M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale Invariant Matching of Local Image Interest Points,” IEEE Transactions on Image Processing, 2011 1. Выбираем ключевые точки 2. Применяем классическое вейвлет-преобразование к окрестностям ключевых точек и высокочастотные компоненты считаем особенностями 3. Сопоставляем ключевые точки Название предложенного метода: Rotation and Scale Invariant Matching (RASIM)
  • 8. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Блобы А. Конушин, «Сопоставление изображений и локальные особенности», лекции по курсу «Введение в компьютерное зрение», 2012 8 Сигнал Край Сигнал Блоб Пример блобов Поиск блобов осуществляется с помощью разницы Гауссиан (DoG)
  • 9. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Выбор ключевых точек 9 M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale Invariant Matching of Local Image Interest Points,” IEEE Transactions on Image Processing, 2011  Для поиска применяется псевдо-лог-полярная сетка дискретизации  Ключевые точки находятся при поиске максимумов и минимумов в масштабированном изображении  Масштабируется при помощи разницы Гауссиан (DoG) Псевдо-лог-полярная сетка дискретизации
  • 10. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Вейвлет-преобразование 10 M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale Invariant Matching of Local Image Interest Points,” IEEE Transactions on Image Processing, 2011 – высокочастотный и низкочастотный фильтры Быстрое вейвлет- преобразование – входной сигнал – высокочастотная и низкочастотная компоненты – старая высокочастотная компонента – фильтр прогнозирования – операция свертки , ,
  • 11. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  – размерность фильтра прогнозирования – количество выбранных больших высокочастотных компонент с индексами Вейвлет-преобразование Фильтр прогнозирования 11 M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale Invariant Matching of Local Image Interest Points,” IEEE Transactions on Image Processing, 2011 Фильтр прогнозирования получается решением системы для компонент, полученных от шаблонного изображения
  • 12. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Взвешенная адаптация 12 M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale Invariant Matching of Local Image Interest Points,” IEEE Transactions on Image Processing, 2011 – система с предыдущего слайда – максимальная и минимальная компонента, – некоторая константа – операция поэлементного умножения
  • 13. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Измерение подобия (1) 13 M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale Invariant Matching of Local Image Interest Points,” IEEE Transactions on Image Processing, 2011 Метод разделен на две части: «оффлайн» и «онлайн» «Оффлайн»: 1. Выбираем вейвлет преобразование и значения параметров и 2. Вычисляем фильтр прогнозирования
  • 14. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Измерение подобия (2) 14 M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale Invariant Matching of Local Image Interest Points,” IEEE Transactions on Image Processing, 2011 «Онлайн»: 1. Применяем вейвлет преобразование 2. Заполняем вектор 3. Суммируем вектор в окне такой же длины (2L), как и сигнал шаблона Максимальное значение суммы достигается при наилучшем соответствии
  • 15. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Постобработка Преобразование Хафа 15 http://en.wikipedia.org/wiki/Hough_transform Метод предназначен для поиска объектов, принадлежащих определённому классу фигур с использованием процедуры голосования Угол Расстояние Входное изображение Преобразованное изображение
  • 16. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результат Статистика качества детектирования 16 M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale Invariant Matching of Local Image Interest Points,” IEEE Transactions on Image Processing, 2011 Правильно обнаружены(%) Масштабшаблона (множитель) Угол поворота (градусы)
  • 17. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результат Сравнение с конкурентом 17 M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale Invariant Matching of Local Image Interest Points,” IEEE Transactions on Image Processing, 2011
  • 18. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Статистика производительности 18 M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale Invariant Matching of Local Image Interest Points,” IEEE Transactions on Image Processing, 2011 Время работы на одном изображении
  • 19. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Выводы Достоинство:  Устойчивость к поворотам и масштабированию Недостатки:  Низкая скорость работы  Неустойчивость к изменениям перспективы 19 M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale Invariant Matching of Local Image Interest Points,” IEEE Transactions on Image Processing, 2011
  • 20. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Local Image Interest Point  Template Matching Based on Fourier Coefficients  Linear Scale and Rotation Invariant Matching  Дополненная реальность  Заключение 20
  • 21. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Template Matching Based on Fourier Coefficients Обозначения: Forapro – название предложенного алгоритма A – исходное изображение Q – шаблон Стабильной называется точка, которая имеет некоторую окрестность, в которой направление градиента сохраняется 21 H.Y. Kim, “Rotation-Discriminating Template Matching Based on Fourier Coefficients of Radial Projections with Robustness to Scaling and Partial Occlusion,” Pattern Recognition, 2010 Белые – стабильные точки, красные – нет
  • 22. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus   Значения цвета на радиальной и круговой проекциях в точке представляют собой значения дискретных функций  Приблизим их непрерывными функциями и разложим последние в ряды Фурье  Вычислим первые L(K) комплексных коэффициентов ci(ri) разложения круговой (радиальной) функции в ряд Фурье Forapro Идеи метода (1) 22 H.Y. Kim, “Rotation-Discriminating Template Matching Based on Fourier Coefficients of Radial Projections with Robustness to Scaling and Partial Occlusion,” Pattern Recognition, 2010 Радиальная проекция в точке C(A(x,y)) Круговая проекция в точке R(A(x,y))
  • 23. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Вычислим вектор особенностей vf, инвариантных к поворотам и масштабированию , – полярный угол и длина комплексного числа Forapro Идеи метода (2) 23 H.Y. Kim, “Rotation-Discriminating Template Matching Based on Fourier Coefficients of Radial Projections with Robustness to Scaling and Partial Occlusion,” Pattern Recognition, 2010 – функция расстояния между двумя векторами особенностей
  • 24. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  1. Вычисляются значения коэффициентов ci, ri и vf для всех точек A и Q 2. Выбираются N стабильных точек из Q, которые образуют множество {T} 3. Для i от 1 до N Для каждого пикселя (x,y) из A вычисляются Находится пиксель с самым малым отклонением и добавляется в массив 4. С помощью преобразования Хафа уточняется результат Forapro Шаги алгоритма 24 H.Y. Kim, “Rotation-Discriminating Template Matching Based on Fourier Coefficients of Radial Projections with Robustness to Scaling and Partial Occlusion,” Pattern Recognition, 2010
  • 25. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты (1) 25 H.Y. Kim, “Rotation-Discriminating Template Matching Based on Fourier Coefficients of Radial Projections with Robustness to Scaling and Partial Occlusion,” Pattern Recognition, 2010 Исходное изображение Результат
  • 26. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты (2) 26 H.Y. Kim, “Rotation-Discriminating Template Matching Based on Fourier Coefficients of Radial Projections with Robustness to Scaling and Partial Occlusion,” Pattern Recognition, 2010 Исходное изображение Результат
  • 27. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Выводы Достоинства:  Устойчивость:  к изменениям по яркости и контрасту  к поворотам и масштабированию Недостатки:  Невысокая скорость работы  Неустойчивость к изменениям перспективы 27 H.Y. Kim, “Rotation-Discriminating Template Matching Based on Fourier Coefficients of Radial Projections with Robustness to Scaling and Partial Occlusion,” Pattern Recognition, 2010
  • 28. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Local Image Interest Point  Template Matching Based on Fourier Coefficients  Linear Scale and Rotation Invariant Matching  Дополненная реальность  Заключение 28
  • 29. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Linear Scale and Rotation Invariant Matching 29H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant Matching,” IEEE Trans. on PAMI, 2011 Обозначения: – множество точек шаблона – множество пар точек из – некоторые точки из множества – точки, соответствующие – стоимость сопоставления (зависит от векторов особенностей)
  • 30. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Основная идея метода 30H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant Matching,” IEEE Trans. on PAMI, 2011 Сопоставляем точки шаблона и изображения, решая задачу линейного программирования (ЛП) Стандартная постановка задачи ЛП: Максимизировать функцию при условиях для i = 1, 2, …, m, где cj, aij, bi – некоторые константы   n j jj xcxF 1 )( i n j jij bxa 1
  • 31. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Идеи метода Критерий сопоставления (1) 31H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant Matching,” IEEE Trans. on PAMI, 2011 – локальная стоимость сопоставления – пространственная стоимость сопоставления – весовой коэффициент
  • 32. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  – стоимость сопоставления, инвариантная относительно масштабирования и поворота – коэффициент масштабирования – матрица поворота (2×2) Идеи метода Критерий сопоставления (2) 32H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant Matching,” IEEE Trans. on PAMI, 2011
  • 33. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Идеи метода Критерий сопоставления (3) 33H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant Matching,” IEEE Trans. on PAMI, 2011 – бинарная матрица сопоставления точек шаблона и изображения – транспонированная матрица стоимостей сопоставления – матрица инцидентности ребер – координаты точки шаблона – координаты точки изображения
  • 34. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus   Добавляются масштабированные шаблоны поиска  Изменяется матрица поворота Идеи метода Линеаризация 34H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant Matching,” IEEE Trans. on PAMI, 2011 Линеаризованные параметры: Исходные параметры: – бинарная матрица сопоставления точек масштабированного шаблона и изображения
  • 35. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Шаги алгоритма 35H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant Matching,” IEEE Trans. on PAMI, 2011 1. Вычисление матрицы С стоимостей сопоставления точек шаблона и изображения 2. Выбор региона доверия для каждой точки шаблона 3. Вычисление минимальной выпуклой оболочки вершин из региона доверия для каждой точки шаблона 4. Решение задачи линейного программирования 5. Уменьшение регионов доверия. Если точки сопоставились хорошо, то выводятся результаты, иначе – перейти на шаг 3
  • 36. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Пример работы алгоритма 36H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant Matching,” IEEE Trans. on PAMI, 2011 (а) – шаблон, (b) – начальное приближение, (c)–(i) – итерации алгоритма, (j) – результат Цветные прямоугольники – регионы доверия
  • 37. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результат Сравнение с конкурентами 37H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant Matching,” IEEE Trans. on PAMI, 2011 O. Duchenne, et al. “Tensor-Based Algorithm for High-Order Graph Matching,” 2009 Предложенный алгоритм Шаблон Кадры видеопоследовательности S. Belongie, et al. “Shape Matching Using Shape Contexts,” 2002
  • 38. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результат Объекты с сильной деформацией (1) 38H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant Matching,” IEEE Trans. on PAMI, 2011 Шаблон Кадры видеопоследовательности Кадры видеопоследовательности
  • 39. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результат Объекты с сильной деформацией (2) 39H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant Matching,” IEEE Trans. on PAMI, 2011 Шаблон Кадры видеопоследовательности Кадры видеопоследовательности
  • 40. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Статистика производительности 40H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant Matching,” IEEE Trans. on PAMI, 2011 #frames – количество кадров в видеопоследовательности #model – количество точек в шаблоне #target – количество точек на изображении time – время работы на 1 кадре (сек) на 2.8 GHz PC accuracy – средняя точность по всей видеопоследовательности
  • 41. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Выводы Достоинства:  Стабильность  Высокая скорость работы Недостаток:  Не оговаривается, как выбирать точки для сопоставления 41H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant Matching,” IEEE Trans. on PAMI, 2011
  • 42. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Local Image Interest Point  Template Matching Based on Fourier Coefficients  Linear Scale and Rotation Invariant Matching  Дополненная реальность  Заключение 42
  • 43. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Пример применения Дополненная реальность – добавление к поступающим из реального мира ощущениям мнимых объектов 43 http://vitodibari.com/ru/hit-lab.html Пример дополненной реальности
  • 44. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Дополненная реальность Как это работает? 44 http://www.artag.net/index.html Находятся и распознаются специальные маркеры, затем дорисовывается нужная информация
  • 45. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Дополненная реальность Системы маркеров 45Martin Hirzer, “Marker Detection for Augmented Reality Applications,” Project Image Analysis Graz, 2008 Некоторые системы маркеров
  • 46. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Дополненная реальность Библиотеки На данный момент существует несколько неплохих открытых реализаций поиска и трекинга маркеров:  ARToolKit (и дочерние)  ZBar … В OpenCV по умолчанию трекинга маркеров нет 46
  • 47. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Дополненная реальность Поиск маркеров 47Martin Hirzer, “Marker Detection for Augmented Reality Applications,” Project Image Analysis Graz, 2008 Один из методов поиска маркеров
  • 48. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результат Сравнение с конкурентами (1) 48Martin Hirzer, “Marker Detection for Augmented Reality Applications,” Project Image Analysis Graz, 2008 Предложенный алгоритм
  • 49. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результат Сравнение с конкурентами (2) 49Martin Hirzer, “Marker Detection for Augmented Reality Applications,” Project Image Analysis Graz, 2008 ARToolKit
  • 50. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результат Сравнение с конкурентами (3) 50Martin Hirzer, “Marker Detection for Augmented Reality Applications,” Project Image Analysis Graz, 2008 Предложенный алгоритм ARToolKit
  • 51. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Выводы Достоинства:  Устойчивость к частичным перекрытиям  Высокая скорость работы Недостаток:  Неустойчивость к изменениям яркости (не работает на темных объектах) 51Martin Hirzer, “Marker Detection for Augmented Reality Applications,” Project Image Analysis Graz, 2008
  • 52. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Local Image Interest Point  Template Matching Based on Fourier Coefficients  Linear Scale and Rotation Invariant Matching  Дополненная реальность  Заключение 52
  • 53. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Заключение  Рассмотренные алгоритмы с разных сторон подходят к решению задачи поиска и сопоставления шаблона и изображения  У каждого есть свои плюсы и минусы, область применения 53
  • 54. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Проделанная работа Протестирована работоспособность библиотеки ZBar по поиску маркеров  Входные данные: изображения (19 мегапикселей), приближенные к «боевым»  Время работы: 2–3 секунды  Результат: все метки найдены 54
  • 55. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Проделанная работа Результаты 55 Изображение, приближенное к реальному тестированию устройств
  • 56. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Дальнейшие планы  Создание программы-визарда для автоматического тестирования 3D-устройств  Тестирование новых и уже имеющихся 3D-устройств  Разработка системы тестирования стереоскопического зрения 56
  • 57. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Литература 1. M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale Invariant Matching of Local Image Interest Points,” IEEE Transactions on Image Processing, vol. 20, 2011, pp. 3580–3591. 2. H.Y. Kim, “Rotation-discriminating Template Matching Based on Fourier Coefficients of Radial Projections with Robustness to Scaling and Partial Occlusion,” Elsevier Pattern Recognition, vol. 43, 2010, pp. 859–872. 3. H. Jiang, S.X. Yu, and D.R. Martin, “Linear Scale and Rotation Invariant Matching,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 33, no. 7, 2011, pp. 1339–1355. 4. Martin Hirzer, “Marker Detection for Augmented Reality Applications,” Project Image Analysis Graz, 2008, pp. 1–25. 5. А. Конушин, «Сопоставление изображений и локальные особенности», лекции по курсу «Введение в компьютерное зрение», 2012, стр. 45–79. 57
  • 58. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Вопросы? Предложения? Наряды? 58
  • 59. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Лаборатория компьютерной графики и мультимедиа Видеогруппа — это:  Выпускники в аспирантурах Англии, Франции, Швейцарии (в России в МГУ и ИПМ им. Келдыша)  Выпускниками защищены 5 диссертаций  Наиболее популярные в мире сравнения видеокодеков  Более 3 миллионов скачанных фильтров обработки видео 59