SlideShare a Scribd company logo
Некоторые методы сопоставления
и трекинга границ во времени
Александр Новиков
Video Group
CS MSU Graphics & Media Lab
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Joint Pixel Features Based Tracking
 Generalized Hough Transform Based Tracking
 Tracking via Edgel Templates
 Заключение
2
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Постановка задач
Задача сопоставления границ
Для пары кадров произвести сопоставление
их карт границ
3
Последовательность Capitol
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Постановка задач
Задача трекинга границ
Проследить движение границ, выделенных
на первом кадре видеопоследовательности
4
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Применение (1)
1. Трекинг объектов
2. Надежный поиск и обработка областей
открытия
5
M.-C. Roh, T.-Y. Kim, J. Park, S.-W. Lee, “Accurate object contour
tracking based on boundary edge selection,” in Pattern
Recognition, Volume 40, Issue 3, 2007
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Применение (2)
3. Избавление от «затеканий», т.е. попадания
значений каких-либо карт за границы
соответствующих объектов
6
Исходное видео Карта салиентности
Последовательность
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Тривиальный подход
Для решения задачи можно использовать
алгоритмы Motion Estimation
Проблемы:
 Блочные методы с простыми метриками
неточны на границах
 Неверная работа на областях открытия
7
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Joint Pixel Features Based Tracking
 Generalized Hough Transform Based Tracking
 Tracking via Edgel Templates
 Заключение
8
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Идея метода
9
Поиск для каждого пикселя границы
на первом кадре его положения на втором
сравнением блоков по некоторой метрике
M. Khansari, H. R. Rabiee, et al., “An Adaptive Semi-Automatic
Video Object Extraction Algorithm Based on Joint Transform and
Spatial Domains Features,” in CBMI, 2005
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Варианты реализации
Поблочное сравнение – самый
распространенный подход
Часто используемые метрики – разница:
 значений цветовых каналов
 модулей/направлений градиентов яркости
10
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Joint Feature Vector
В данной статье используется евклидово
расстояние между Joint Feature Vector’ами
пикселей, состоящими из:
1. выбранных коэффициентов Undecimated
Wavelet Packet Transform (UWPT)
2. значения яркости пикселя
11
M. Khansari, H. R. Rabiee, et al., “An Adaptive Semi-Automatic
Video Object Extraction Algorithm Based on Joint Transform and
Spatial Domains Features,” in CBMI, 2005
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Undecimated Wavelet
Packet Transform (1)
UWPT – один из видов вейвлет-преобразований
Используется авторами в связи с:
 достаточно подробным описанием
окрестности пикселя
 его инвариантностью к сдвигам
 устойчивостью к различным видам шума
12
M. Khansari, H. R. Rabiee, et al., “An Adaptive Semi-Automatic
Video Object Extraction Algorithm Based on Joint Transform and
Spatial Domains Features,” in CBMI, 2005
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Undecimated Wavelet
Packet Transform (2)
1. Строится дерево UWPT и выполняется его прореживание
2. Задается Feature Vector для каждого пикселя кадров
13
M. Khansari, H. R. Rabiee, et al., “An Adaptive Semi-Automatic
Video Object Extraction Algorithm Based on Joint Transform and
Spatial Domains Features,” in CBMI, 2005
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты
14
Референсный кадр Результаты трекинга границы на некоторых кадрах
M. Khansari, H. R. Rabiee, et al., “An Adaptive Semi-Automatic
Video Object Extraction Algorithm Based on Joint Transform and
Spatial Domains Features,” in CBMI, 2005
Кадр №0 Кадр №20 Кадр №47 Кадр №76
Кадр №169 Кадр №176 Кадр №194 Кадр №195
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Выводы
Достоинство:
 Использование привычного поблочного
поиска – возможность использовать ME
Недостаток:
 Относительная сложность реализации
метрики
15
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Joint Pixel Features Based Tracking
 Generalized Hough Transform Based
Tracking
 Tracking via Edgel Templates
 Заключение
16
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Идея метода
По построенным картам границ двух кадров,
для каждого сегмента границы с первого кадра
ищется ближайший по форме со второго
17
M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching
for Moving Object Tracking,” in Proc. of 14th International
Conference on Computer and Information Technology, 2011
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Generalized Hough Transform
Generalized Hough Transform (GHT) – это метод
представления границы объекта в виде набора
параметров, характеризующих её форму (R-таблицы)
 Позволяет быстро проверять объекты
на схожесть с референсным
 Устойчиво к шуму и искажениям границ
18
M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching
for Moving Object Tracking,” in Proc. of 14th International
Conference on Computer and Information Technology, 2011
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Generalized Hough Transform
Построение R-таблицы (1)
Для каждой точки исходного сегмента
определяется три параметра: r, β, Ω
19
XRef, YRef – центр ограничивающего
прямоугольника
Xep, Yep – текущая точка
r – длина отрезка между точками
(XRef, YRef) и (Xep, Yep)
β – полярный угол точки (XRef, YRef)
относительно (Xep, Yep)
Ω – угол наклона касательной к сегменту
в точке (Xep, Yep)
M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching
for Moving Object Tracking,” in Proc. of 14th International
Conference on Computer and Information Technology, 2011
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Generalized Hough Transform
Построение R-таблицы (2)
Параметры каждой точки заносятся в R-таблицу
исходного сегмента
20
Параметры точки сегмента Общий вид R-таблицы
M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching
for Moving Object Tracking,” in Proc. of 14th International
Conference on Computer and Information Technology, 2011
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм сопоставления
Для каждого сегмента границ с первого кадра:
1. Строится R-таблица
2. Находятся сегменты-кандидаты в окрестности
поиска на втором кадре
3. С помощью R-таблицы выбирается сегмент-
кандидат, наиболее похожий на исходный
21
M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching
for Moving Object Tracking,” in Proc. of 14th International
Conference on Computer and Information Technology, 2011
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Выбор сегментов-кандидатов
Для исходного сегмента границы на втором кадре
выбираются сегменты-кандидаты, близкие по:
1. длине и ширине ограничивающего прямоугольника
2. углу между прямой, соединяющей начало и конец
сегмента и осью х
22
M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching
for Moving Object Tracking,” in Proc. of 14th International
Conference on Computer and Information Technology, 2011
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Сопоставление кандидатов
с исходным сегментом (1)
Для каждой точки сегмента-кандидата:
1. Вычисляется угол Ω между осью х и касательной
к сегменту в ней
2. Для Ω из R-таблицы извлекаются все пары (r, β),
и от точки откладываются соответствующие векторы
23
M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching
for Moving Object Tracking,” in Proc. of 14th International
Conference on Computer and Information Technology, 2011
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Сопоставление кандидатов
с исходным сегментом (2)
Точка Peak, в которой заканчивается наибольшее
число векторов, считается новым положением
центральной точки (XRef, YRef) исходного сегмента
24
M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching
for Moving Object Tracking,” in Proc. of 14th International
Conference on Computer and Information Technology, 2011
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
dx = XMaxPeak – XRef
dy = YMaxPeak – YRef
Определение движения
сегмента границы
 Поиск точки Peak выполняется для каждого
сегмента-кандидата
 Количество векторов, заканчивающихся
в ней, служит мерой надежности сегмента
 Выбирается сегмент с наивысшим
значением надежности, определяется сдвиг
25
M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching
for Moving Object Tracking,” in Proc. of 14th International
Conference on Computer and Information Technology, 2011
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Тестирование метода
Авторы использовали свой метод
сопоставления границ для трекинга объектов
26
Маленький прямоугольник – граница объекта, большой – окно поиска
Видео 640×520 пикселей, скорость работы реализации авторов – 7 fps
M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching
for Moving Object Tracking,” in Proc. of 14th International
Conference on Computer and Information Technology, 2011
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты
27
Результаты трекинга объектов при помощи сопоставления границ
M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching
for Moving Object Tracking,” in Proc. of 14th International
Conference on Computer and Information Technology, 2011
1 2
3 4
5 6
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Выводы
Достоинство:
 Устойчивость к шуму и искажениям
формы границ
Недостаток:
 Низкая устойчивость к поворотам границ
28
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Joint Pixel Features Based Tracking
 Generalized Hough Transform Based Tracking
 Tracking via Edgel Templates
 Заключение
29
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Идея метода
Оценка совпадения направлений градиентов
яркости пикселей в окрестностях
сопоставляемых границ
30T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking
via Edgel Templates,” in IEEE WACV, 2012
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Что такое Edgel?
Edgel – пиксель границы, характеризующийся
координатами и направлением градиента
яркости
31T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking
via Edgel Templates,” in IEEE WACV, 2012
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Edgel Template (1)
Для сопоставляемых Edgel’ов вычисляются Edgel Template’ы
(ET ) – матрицы, характеризующая их окрестности
Шаг 1: разбиение окрестности на M×M блоков
и вычисление градиентов яркости в них
32T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking
via Edgel Templates,” in IEEE WACV, 2012
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Edgel Template (2)
Шаг 2: дискретизация направлений
градиентов,
заполнение матрицы
33T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking
via Edgel Templates,” in IEEE WACV, 2012
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Edgel Templates Matching
Метрика степени совпадения двух Edgel
Template’ов имеет вид:
34T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking
via Edgel Templates,” in IEEE WACV, 2012
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Edgel Templates Matching
Быстрая реализация
Хранение Template’ов в виде матриц из 0 и 1
позволяет реализовать их сравнение
быстрыми битовыми операциями
35T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking
via Edgel Templates,” in IEEE WACV, 2012
B – параметр дискретизации
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Оценка скорости работы
Реализация авторов работает в реальном
времени на видео с разрешением 640×480
36
Время выполнения основных этапов для пары кадров
T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking
via Edgel Templates,” in IEEE WACV, 2012
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты (1)
37
Результаты трекинга
Векторы сдвига границ между соседними кадрами
T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking
via Edgel Templates,” in IEEE WACV, 2012
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты (2)
38
Результаты трекинга
Векторы сдвига границ между соседними кадрами
T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking
via Edgel Templates,” in IEEE WACV, 2012
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Выводы
Достоинства:
 Высокая скорость работы
 Инвариантность к изменению яркости
 Устойчивость к поворотам
Недостаток:
 Вероятность низкого качества работы
в случаях более сложного движения
(авторы привели простые примеры)
39
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Joint Pixel Features Based Tracking
 Generalized Hough Transform Based Tracking
 Tracking via Edgel Templates
 Заключение
40
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Depth from Motion
Текущие результаты (1)
41
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Depth from Motion
Текущие результаты (2)
42
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Depth from Motion
Текущие результаты (3)
43
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Depth from Motion
Текущие результаты (3)
44
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Depth from Motion
Возможные улучшения
 Уточнение границ при помощи трекинга
 Выделение областей открытия дает
возможность:
 полной автоматизации построения карт глубины
 корректной обработки движущихся объектов
45
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Литература
1. T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking via Edgel
Templates,” in IEEE Workshop on the Applications of Computer Vision,
Breckenridge, Colorado, 2012, pp. 473–480.
2. M. Khansari, H. R. Rabiee, and M. Asadi, M. Ghanbari, M.Nosrati, and M.
Amiri, “An Adaptive Semi-Automatic Video Object Extraction Algorithm
Based on Joint Transform and Spatial Domains Features,” in International
Workshop on Content-Based Multimedia Indexing, Riga, Latvia, June 21–
23, 2005.
3. M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching for Moving
Object Tracking,” in Proceedings of 14th International Conference
on Computer and Information Technology, Dhaka, Bangladesh, December
22–24, 2011, pp. 355–359.
4. M.-C. Roh, T.-Y. Kim, J. Park, and S.-W. Lee, “Accurate object contour
tracking based on boundary edge selection,” in Pattern Recognition,
Volume 40, Issue 3, 2007, pp. 931–943.
46
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Лаборатория компьютерной
графики и мультимедиа
Видеогруппа — это:
 Выпускники в аспирантурах
Англии, Франции, Швейцарии
(в России в МГУ и ИПМ им. Келдыша)
 Выпускниками защищены 5 диссертаций
 Наиболее популярные в мире сравнения
видеокодеков
 Более 3 миллионов скачанных фильтров
обработки видео
47

More Related Content

PDF
Использование областей перекрытия в задаче сегментации видео
PDF
Цветонезависимое сопоставление стерео
PDF
Способы построения и оценки карт салиентности
PDF
Обзор алгоритмов трекинга объектов
PDF
Обзор методов сопоставления шаблона и изображения
PDF
Способы построения saliency map
PDF
Исправление различий резкости в 3D видео
PDF
Методы повышения визуального качества восстановленного фона (часть 2)
Использование областей перекрытия в задаче сегментации видео
Цветонезависимое сопоставление стерео
Способы построения и оценки карт салиентности
Обзор алгоритмов трекинга объектов
Обзор методов сопоставления шаблона и изображения
Способы построения saliency map
Исправление различий резкости в 3D видео
Методы повышения визуального качества восстановленного фона (часть 2)

What's hot (20)

PDF
Точное выделение границ объектов
PDF
Обзор методов сегментации видео
PDF
Методы повышения визуального качества восстановленного фона
PDF
Обзор алгоритмов генерации ракурсов для многоракурсных видео
PDF
Некоторые методы матирования видео
PDF
Некоторые методы обнаружения артефактов 3D-видео
PDF
Некоторые методы восстановления фона
PDF
Обзор методов оценки True-motion
PDF
Обзор методов сравнения фильмов
PDF
Обзор докладов конференции IC3D 2012
PDF
Некоторые методы сегментации видео
PDF
Некоторые методы повышения качества построения стерео
PDF
Метрики оценки качества конвертированного стерео
PDF
Современные методы Optical Flow c GPU реализацией
PDF
Обзор стандарта H.265/HEVC
PDF
Детектирование объектов переднего плана в видео
PDF
Обработка границ объектов при генерации стерео
PDF
Обзор методов вычисления базовой геометрии сцены
PDF
Некоторые методы проектирования и оптимизации кода
PDF
Методы цветокоррекции стереовидео
Точное выделение границ объектов
Обзор методов сегментации видео
Методы повышения визуального качества восстановленного фона
Обзор алгоритмов генерации ракурсов для многоракурсных видео
Некоторые методы матирования видео
Некоторые методы обнаружения артефактов 3D-видео
Некоторые методы восстановления фона
Обзор методов оценки True-motion
Обзор методов сравнения фильмов
Обзор докладов конференции IC3D 2012
Некоторые методы сегментации видео
Некоторые методы повышения качества построения стерео
Метрики оценки качества конвертированного стерео
Современные методы Optical Flow c GPU реализацией
Обзор стандарта H.265/HEVC
Детектирование объектов переднего плана в видео
Обработка границ объектов при генерации стерео
Обзор методов вычисления базовой геометрии сцены
Некоторые методы проектирования и оптимизации кода
Методы цветокоррекции стереовидео
Ad

Similar to Некоторые методы сопоставления и трекинга границ во времени (15)

PDF
CV2011 Lecture 12. Action recognition
PDF
20120414 videorecognition konushin_lecture04
PDF
Обработка областей открытия при распространении карт глубины
PPTX
CV2011 Lecture 3. Basic image analysis
PDF
20120413 videorecognition konushin_lecture02
PDF
Вычисление глубины по одному изображению
PPTX
20111009 csseminar image feature detection and matching
PDF
Анализ изображений и видео. Построение признаков и сравнение изображений: ло...
PDF
CV2011 Lecture 11. Basic video
PPTX
Алгоритмы сопровождения целей в системах охраны протяженных объектов
PPTX
Лекция 07 Обработка видео
PPT
Matchmoving Introduction
PPT
Сегментация изображений в компьютерной графике.ppt
PPTX
L05 features
PDF
CV2011 Lecture 5. Features
CV2011 Lecture 12. Action recognition
20120414 videorecognition konushin_lecture04
Обработка областей открытия при распространении карт глубины
CV2011 Lecture 3. Basic image analysis
20120413 videorecognition konushin_lecture02
Вычисление глубины по одному изображению
20111009 csseminar image feature detection and matching
Анализ изображений и видео. Построение признаков и сравнение изображений: ло...
CV2011 Lecture 11. Basic video
Алгоритмы сопровождения целей в системах охраны протяженных объектов
Лекция 07 Обработка видео
Matchmoving Introduction
Сегментация изображений в компьютерной графике.ppt
L05 features
CV2011 Lecture 5. Features
Ad

More from MSU GML VideoGroup (6)

PDF
Некоторые методы сопоставления стерео
PDF
Некоторые алгоритмы многомерной обработки изображений
PDF
Research & Development методы, проблемы и ошибки
PDF
Некоторые методы генерации многоракурсных изображений на основе карты глубины
PDF
Алгоритмы для задачи матирования
PDF
Исправление стерео видео
Некоторые методы сопоставления стерео
Некоторые алгоритмы многомерной обработки изображений
Research & Development методы, проблемы и ошибки
Некоторые методы генерации многоракурсных изображений на основе карты глубины
Алгоритмы для задачи матирования
Исправление стерео видео

Некоторые методы сопоставления и трекинга границ во времени

  • 1. Некоторые методы сопоставления и трекинга границ во времени Александр Новиков Video Group CS MSU Graphics & Media Lab
  • 2. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Joint Pixel Features Based Tracking  Generalized Hough Transform Based Tracking  Tracking via Edgel Templates  Заключение 2
  • 3. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Постановка задач Задача сопоставления границ Для пары кадров произвести сопоставление их карт границ 3 Последовательность Capitol
  • 4. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Постановка задач Задача трекинга границ Проследить движение границ, выделенных на первом кадре видеопоследовательности 4
  • 5. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Применение (1) 1. Трекинг объектов 2. Надежный поиск и обработка областей открытия 5 M.-C. Roh, T.-Y. Kim, J. Park, S.-W. Lee, “Accurate object contour tracking based on boundary edge selection,” in Pattern Recognition, Volume 40, Issue 3, 2007
  • 6. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Применение (2) 3. Избавление от «затеканий», т.е. попадания значений каких-либо карт за границы соответствующих объектов 6 Исходное видео Карта салиентности Последовательность
  • 7. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Тривиальный подход Для решения задачи можно использовать алгоритмы Motion Estimation Проблемы:  Блочные методы с простыми метриками неточны на границах  Неверная работа на областях открытия 7
  • 8. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Joint Pixel Features Based Tracking  Generalized Hough Transform Based Tracking  Tracking via Edgel Templates  Заключение 8
  • 9. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Идея метода 9 Поиск для каждого пикселя границы на первом кадре его положения на втором сравнением блоков по некоторой метрике M. Khansari, H. R. Rabiee, et al., “An Adaptive Semi-Automatic Video Object Extraction Algorithm Based on Joint Transform and Spatial Domains Features,” in CBMI, 2005
  • 10. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Варианты реализации Поблочное сравнение – самый распространенный подход Часто используемые метрики – разница:  значений цветовых каналов  модулей/направлений градиентов яркости 10
  • 11. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Joint Feature Vector В данной статье используется евклидово расстояние между Joint Feature Vector’ами пикселей, состоящими из: 1. выбранных коэффициентов Undecimated Wavelet Packet Transform (UWPT) 2. значения яркости пикселя 11 M. Khansari, H. R. Rabiee, et al., “An Adaptive Semi-Automatic Video Object Extraction Algorithm Based on Joint Transform and Spatial Domains Features,” in CBMI, 2005
  • 12. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Undecimated Wavelet Packet Transform (1) UWPT – один из видов вейвлет-преобразований Используется авторами в связи с:  достаточно подробным описанием окрестности пикселя  его инвариантностью к сдвигам  устойчивостью к различным видам шума 12 M. Khansari, H. R. Rabiee, et al., “An Adaptive Semi-Automatic Video Object Extraction Algorithm Based on Joint Transform and Spatial Domains Features,” in CBMI, 2005
  • 13. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Undecimated Wavelet Packet Transform (2) 1. Строится дерево UWPT и выполняется его прореживание 2. Задается Feature Vector для каждого пикселя кадров 13 M. Khansari, H. R. Rabiee, et al., “An Adaptive Semi-Automatic Video Object Extraction Algorithm Based on Joint Transform and Spatial Domains Features,” in CBMI, 2005
  • 14. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты 14 Референсный кадр Результаты трекинга границы на некоторых кадрах M. Khansari, H. R. Rabiee, et al., “An Adaptive Semi-Automatic Video Object Extraction Algorithm Based on Joint Transform and Spatial Domains Features,” in CBMI, 2005 Кадр №0 Кадр №20 Кадр №47 Кадр №76 Кадр №169 Кадр №176 Кадр №194 Кадр №195
  • 15. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Выводы Достоинство:  Использование привычного поблочного поиска – возможность использовать ME Недостаток:  Относительная сложность реализации метрики 15
  • 16. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Joint Pixel Features Based Tracking  Generalized Hough Transform Based Tracking  Tracking via Edgel Templates  Заключение 16
  • 17. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Идея метода По построенным картам границ двух кадров, для каждого сегмента границы с первого кадра ищется ближайший по форме со второго 17 M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching for Moving Object Tracking,” in Proc. of 14th International Conference on Computer and Information Technology, 2011
  • 18. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Generalized Hough Transform Generalized Hough Transform (GHT) – это метод представления границы объекта в виде набора параметров, характеризующих её форму (R-таблицы)  Позволяет быстро проверять объекты на схожесть с референсным  Устойчиво к шуму и искажениям границ 18 M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching for Moving Object Tracking,” in Proc. of 14th International Conference on Computer and Information Technology, 2011
  • 19. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Generalized Hough Transform Построение R-таблицы (1) Для каждой точки исходного сегмента определяется три параметра: r, β, Ω 19 XRef, YRef – центр ограничивающего прямоугольника Xep, Yep – текущая точка r – длина отрезка между точками (XRef, YRef) и (Xep, Yep) β – полярный угол точки (XRef, YRef) относительно (Xep, Yep) Ω – угол наклона касательной к сегменту в точке (Xep, Yep) M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching for Moving Object Tracking,” in Proc. of 14th International Conference on Computer and Information Technology, 2011
  • 20. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Generalized Hough Transform Построение R-таблицы (2) Параметры каждой точки заносятся в R-таблицу исходного сегмента 20 Параметры точки сегмента Общий вид R-таблицы M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching for Moving Object Tracking,” in Proc. of 14th International Conference on Computer and Information Technology, 2011
  • 21. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм сопоставления Для каждого сегмента границ с первого кадра: 1. Строится R-таблица 2. Находятся сегменты-кандидаты в окрестности поиска на втором кадре 3. С помощью R-таблицы выбирается сегмент- кандидат, наиболее похожий на исходный 21 M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching for Moving Object Tracking,” in Proc. of 14th International Conference on Computer and Information Technology, 2011
  • 22. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Выбор сегментов-кандидатов Для исходного сегмента границы на втором кадре выбираются сегменты-кандидаты, близкие по: 1. длине и ширине ограничивающего прямоугольника 2. углу между прямой, соединяющей начало и конец сегмента и осью х 22 M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching for Moving Object Tracking,” in Proc. of 14th International Conference on Computer and Information Technology, 2011
  • 23. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Сопоставление кандидатов с исходным сегментом (1) Для каждой точки сегмента-кандидата: 1. Вычисляется угол Ω между осью х и касательной к сегменту в ней 2. Для Ω из R-таблицы извлекаются все пары (r, β), и от точки откладываются соответствующие векторы 23 M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching for Moving Object Tracking,” in Proc. of 14th International Conference on Computer and Information Technology, 2011
  • 24. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Сопоставление кандидатов с исходным сегментом (2) Точка Peak, в которой заканчивается наибольшее число векторов, считается новым положением центральной точки (XRef, YRef) исходного сегмента 24 M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching for Moving Object Tracking,” in Proc. of 14th International Conference on Computer and Information Technology, 2011
  • 25. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  dx = XMaxPeak – XRef dy = YMaxPeak – YRef Определение движения сегмента границы  Поиск точки Peak выполняется для каждого сегмента-кандидата  Количество векторов, заканчивающихся в ней, служит мерой надежности сегмента  Выбирается сегмент с наивысшим значением надежности, определяется сдвиг 25 M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching for Moving Object Tracking,” in Proc. of 14th International Conference on Computer and Information Technology, 2011
  • 26. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Тестирование метода Авторы использовали свой метод сопоставления границ для трекинга объектов 26 Маленький прямоугольник – граница объекта, большой – окно поиска Видео 640×520 пикселей, скорость работы реализации авторов – 7 fps M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching for Moving Object Tracking,” in Proc. of 14th International Conference on Computer and Information Technology, 2011
  • 27. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты 27 Результаты трекинга объектов при помощи сопоставления границ M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching for Moving Object Tracking,” in Proc. of 14th International Conference on Computer and Information Technology, 2011 1 2 3 4 5 6
  • 28. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Выводы Достоинство:  Устойчивость к шуму и искажениям формы границ Недостаток:  Низкая устойчивость к поворотам границ 28
  • 29. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Joint Pixel Features Based Tracking  Generalized Hough Transform Based Tracking  Tracking via Edgel Templates  Заключение 29
  • 30. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Идея метода Оценка совпадения направлений градиентов яркости пикселей в окрестностях сопоставляемых границ 30T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking via Edgel Templates,” in IEEE WACV, 2012
  • 31. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Что такое Edgel? Edgel – пиксель границы, характеризующийся координатами и направлением градиента яркости 31T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking via Edgel Templates,” in IEEE WACV, 2012
  • 32. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Edgel Template (1) Для сопоставляемых Edgel’ов вычисляются Edgel Template’ы (ET ) – матрицы, характеризующая их окрестности Шаг 1: разбиение окрестности на M×M блоков и вычисление градиентов яркости в них 32T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking via Edgel Templates,” in IEEE WACV, 2012
  • 33. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Edgel Template (2) Шаг 2: дискретизация направлений градиентов, заполнение матрицы 33T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking via Edgel Templates,” in IEEE WACV, 2012
  • 34. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Edgel Templates Matching Метрика степени совпадения двух Edgel Template’ов имеет вид: 34T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking via Edgel Templates,” in IEEE WACV, 2012
  • 35. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Edgel Templates Matching Быстрая реализация Хранение Template’ов в виде матриц из 0 и 1 позволяет реализовать их сравнение быстрыми битовыми операциями 35T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking via Edgel Templates,” in IEEE WACV, 2012 B – параметр дискретизации
  • 36. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Оценка скорости работы Реализация авторов работает в реальном времени на видео с разрешением 640×480 36 Время выполнения основных этапов для пары кадров T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking via Edgel Templates,” in IEEE WACV, 2012
  • 37. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты (1) 37 Результаты трекинга Векторы сдвига границ между соседними кадрами T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking via Edgel Templates,” in IEEE WACV, 2012
  • 38. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты (2) 38 Результаты трекинга Векторы сдвига границ между соседними кадрами T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking via Edgel Templates,” in IEEE WACV, 2012
  • 39. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Выводы Достоинства:  Высокая скорость работы  Инвариантность к изменению яркости  Устойчивость к поворотам Недостаток:  Вероятность низкого качества работы в случаях более сложного движения (авторы привели простые примеры) 39
  • 40. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Joint Pixel Features Based Tracking  Generalized Hough Transform Based Tracking  Tracking via Edgel Templates  Заключение 40
  • 41. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Depth from Motion Текущие результаты (1) 41
  • 42. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Depth from Motion Текущие результаты (2) 42
  • 43. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Depth from Motion Текущие результаты (3) 43
  • 44. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Depth from Motion Текущие результаты (3) 44
  • 45. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Depth from Motion Возможные улучшения  Уточнение границ при помощи трекинга  Выделение областей открытия дает возможность:  полной автоматизации построения карт глубины  корректной обработки движущихся объектов 45
  • 46. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Литература 1. T. Lee and S. Soatto, “Fast Planar Object Detection and Tracking via Edgel Templates,” in IEEE Workshop on the Applications of Computer Vision, Breckenridge, Colorado, 2012, pp. 473–480. 2. M. Khansari, H. R. Rabiee, and M. Asadi, M. Ghanbari, M.Nosrati, and M. Amiri, “An Adaptive Semi-Automatic Video Object Extraction Algorithm Based on Joint Transform and Spatial Domains Features,” in International Workshop on Content-Based Multimedia Indexing, Riga, Latvia, June 21– 23, 2005. 3. M. Murshed, M. Morshed, and O. Chae, “Moving Edge Matching for Moving Object Tracking,” in Proceedings of 14th International Conference on Computer and Information Technology, Dhaka, Bangladesh, December 22–24, 2011, pp. 355–359. 4. M.-C. Roh, T.-Y. Kim, J. Park, and S.-W. Lee, “Accurate object contour tracking based on boundary edge selection,” in Pattern Recognition, Volume 40, Issue 3, 2007, pp. 931–943. 46
  • 47. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Лаборатория компьютерной графики и мультимедиа Видеогруппа — это:  Выпускники в аспирантурах Англии, Франции, Швейцарии (в России в МГУ и ИПМ им. Келдыша)  Выпускниками защищены 5 диссертаций  Наиболее популярные в мире сравнения видеокодеков  Более 3 миллионов скачанных фильтров обработки видео 47