SlideShare a Scribd company logo
Компьютерное зрение
Общая информацияЭтот курс подготовлени читается при поддержке Microsoft ResearchСтраница курса http://courses.graphicon.ru/main/visionО лектореЛаб. компьютерной графики и мультимедиаНаучный сотрудник, к.ф-м.н., руководитель группы компьютерного зренияАнтон Конушин Курсы:
 С/к «Введение в компьютерное зрение» (весна)
 С/к «Доп. главы компьютерного зрения» (осень)
 «Компьютерная графика»
 С/к «Анализ изображений и видео» (год), ШАД Яндекс
 E-mail: ktosh@graphics.cs.msu.ruОб ассистентеАспирант 1-го года ВМК МГУЛаб. комп. графики и мультимедиаГруппа компьютерного зренияaachigorin@gmail.comАлександр Чигорин
УчебникиФорсайт, Понс «Компьютерное зрение: современный подход»
R.Szeliski«Computer vision: Algorithm and applications»
http://research.microsoft.com/en-us/um/people/szeliski/Book/План лекцииВведение в компьютерное зрениеЧто это такоеПочему это сложноИстория компьютерного зренияСовременные достиженияЗадачи, решаемые в лабораторииОбзор программы курсаКомпьютерное зрение и зрение человекаИзображениеКамера и глазЦвети баланс белого
Задача компьютерного зренияПонять, что запечатлено на изображенииМы видимКомпьютер видитSource: S. Narasimhan
Задача компьютерного зрения«To see means to know what is where by looking»David Marr, Vision, 1982Понять, что запечатлено на изображенииЧто это в действительности обозначает?Зрение - источник семантической информации о миреЗрение - источник метрической информации о трехмерном мире
Семантическая информацияSlide credit: Fei-Fei, Fergus & Torralba
Классификация сценывне помещения
город
 уличное движение
 Пекин, Китай
 Пл. ТяньаньмэньSlide 10slide credit: Fei-Fei, Fergus & Torralba
Поиск и локализация объектовЗданиеФлагЛицоТекстАвтобусАвтобусSlide 11Slide credit: Fei-Fei, Fergus & Torralba
Семантическая сегментацияНебоСтроенияАвтомобильАвтомобильSlide 1229.06.2011
Качественная информацияГолубоенаклоннаяВетер справа налевоНежесткий, движетсяМаоЖесткий, движетсяЖесткий, движетсягоризонтальныйSlide 13slide credit: Fei-Fei, Fergus & Torralba
Метрическая информацияМоделирование по пользовательским снимкамСтерео реконструкцияСтруктура из движенияNASA Mars RoverGoesele et al.Pollefeys et al.Slide: Svetlana Lazebnik
Смежные дисциплиныВикипедия
Зрение… принятые названияОбработка изображений (Image processing)На входе и выходе изображениеАнализ изображений (Image analysis)Фокусируется на работе с 2D изображениямиРаспознавание образов (Pattern recognition)Распознавание, обучение на абстрактных числовых величинах, полученных в том числе и из изображенийКомпьютерное зрение (Сomputer vision)Изначально воостановление 3д структуры по 2д изображениям, сейчас шире, как принятие решений о физических объектах, основываясь на их изображенияхФотограмметрия (Photogrammetry) Исторически измерение расстояний между объектами по 2D изображениямМашинное зрение (Мachine vision)Обычно понимается как решение промышленных, производственных задач (сложилось исторически)
Зачем?Полезно – много практических примененийИнтересно – наглядное применение массы математических методовСложно25+% мозга человека отвечает за зрение«ИИ-полная» задача – решение задачи зрения на уровне человека равносильно решению задачи искусственного интеллекта
Почему зрение – это сложно?
Точка наблюденияMichelangelo 1475-1564slide credit: Fei-Fei, Fergus & Torralba
Освещениеimage credit: J. Koenderink
 МасштабSlide credit: Fei-Fei, Fergus & Torralba
 ДеформацияXu, Beihong 1943Slide credit: Fei-Fei, Fergus & Torralba
 ПерекрытиеMagritte, 1957 slide credit: Fei-Fei, Fergus & Torralba
Маскировка
Движение
Внутриклассовая изменчивостьSlide credit: Fei-Fei, Fergus & Torralba
КонтекстПоленоСтул
   Локальная неоднозначностьSlide credit: Fei-Fei, Fergus & Torralba
Сложности или возможности?Изображение запутывает, но дает много подсказок Наша задача – интерпретировать подсказкиImage source: J. Koenderink
Цвет
Тени и освещениеSource: J. Koenderink
Отбрасываемые тениSource: J. Koenderink
ГруппировкаImage credit: Arthus-Bertrand (via F. Durand)
Глубина: линейная перспектива
Текстура
Упорядочивание по глубинеSource: J. Koenderink
Туман и фокусировка
РезюмеЗрение изначально нечеткая задачаРазные 3D сцены дают одно и то же 2D изображениеНеобходимы априорные знания о структуре и свойствах мираImage source: F. Durand
История: Камера-обскураПринцип был известен еще Аристотелю (384-322 до Н.Э.)“Magic Lantern”, 1492
1525
Первая фотографияСамая первая фотография1825 годТребовала 8 часов проявки
Фотограмметрия1837 – первые практически применимые фотографии1840 – «Фотограмметрия – будущее геодезии»
Видео1888 – первое кино на плёнке, Louis Le Prince1878 – первая скоростная съемка, Eadweard Muybridge
Электронно-лучевая трубка(CRT)1885 – изобретение СRT1897 –СRT c  флуоресцентным экраном
1896: СтереофотограмметрияСтереокамера итеодолит
Растровый дисплей – 1927 годPhilo Farnsworth – 60-строчный растровый дисплей
Whirlwind, MIT, 1951Первый компьютер, отображающий текст и графику в реальном времени на монитореТочками карту, значком самолёт.«Световое перо» для взаимодействия с экраном (запрос информации об объекте)
1957 - 1967Аналоговые сопоставители изображений
“The Boing man”, 1960Первое компьютерное изображение человека
Зарождение компьютерного зренияL. G. Roberts, Machine Perception of Three Dimensional Solids, Ph.D. thesis, MIT Department of Electrical Engineering, 19601963.
Spacewar, MIT, 1961Steve Russell, 200 человеко-месяцев
SketchPad, MIT, 1963Ivan Sutherland демонстрирует интерактивный графический редактор SketchPad
CAD, IBM + GM, 1964Первая СAD-система, геометрические преобразования (поворот, вращение)
IBM 2250, AdageПервая отдельная графическая станция, быстрый дисплей (вращение без мерцания)1024x1024 векторный дисплей, стыковался к IBM 360
Virtual Reality, Harvard, 1968Ivan Sutherland перешел в Гарвард, где разработал первый Head Mounted Display (HMD)Виртуальная комната (wireframe), в которую можно войти
Utah, 1968 и далееHidden surface (Romney, Warnock, Watkins)scan line coherence (Watkins)Rendering (Crow, Blinn, Newell, Catmull, Clark, etal)z-buffer (Catmull)Patch rendering (Catmull)Texture mapping (Catmull, Blinn, Newell)Shadows (Crow)Antialiasing (Crow)Shading (Phong, Gouraud)Lighting (Phong, Blinn)Atmospheric effects (Blinn)Environment mapping (Blinn, Newell)Blobby surfaces (Blinn)Facial animation (Parke)Procedural modeling (Newell)Splines (Riesenfeld, Lyche, Cohen)Beta-splines (Barsky)
Freddy II, 1973Университет ЭдинбургаОдин из первых роботов с системой машинного зрения5 степеней свободыУмеет собирать машинки из кубиков, разбросанных по столу384Кб RAM в управляющем компьютере
Давид Марр (1970е)«Primal sketch»Низкоуровневые («low-level») свойства изображения: направленные края, отрезки и т.д.«2.5D sketch»Упорядочивание по глубине (бинокулярное стерое), учёт текстуры и т.д.«3D model»Распознавание объектов и представление о 3х мерном мире
Решаемые задачиИзображения и видео повсюдуБурно растущая областьОбработка – улучшение качества, ретушь, изменение размера и формы, композицияИнтернет – поиск, аннотация, поиск дубликатов, распознавание объектовВидеонаблюдение – отслеживание, распознавание объектов, распознавание жестов и событийПромышленные системы – диагностика, контроль качестваСпецэффекты в кино – композиция, монтаж фонов, захват движения
Personal photo albumsMovies, news, sportsMedical and scientific imagesSurveillance and securityРаспространение изображений
Распознавание текстаDigit recognition, AT&T labshttp://www.research.att.com/~yann/License plate readershttp://en.wikipedia.org/wiki/Automatic_number_plate_recognitionSource: S. Seitz
Детектор лиц (2001)Алгоритм Viola-Jones – первый быстрый и надежный алгоритм поиска лиц. Демонстрация силы машинного обучения.Source: S. Seitz
Поиск улыбкиSony Cyber-shot® T70 Digital Still Camera Source: S. Seitz
Распознавание лицКто она?Source: S. Seitz
Биометрия“How the Afghan Girl was Identified by Her Iris Patterns”  Read the story Source: S. Seitz
БиометрияFace recognition systems now beginning to appear more widelyhttp://www.sensiblevision.com/Fingerprint scanners on many new laptops, other devicesSource: S. Seitz
iPhone Apps: (www.kooaba.com)
Распознавание объектовMicrosoft ResearchSource: S. Seitz
Умные машиныMobileyeТоп-модели от BMW, GM, VolvoК 2010:  70% производителей машинSource: S. Seitz
Умные машины
3D модели для киноThe Matrix movies, ESC Entertainment, XYZRGB, NRCSource: S. Seitz
Захват движенияPirates of the Carribean, Industrial Light and MagicSource: S. Seitz
Спортивные соревнованияSportvision first down lineNice explanation on www.howstuffworks.comSource: S. Seitz
Зрение в космосеNASA'S Mars Exploration Rover Spirit. Системы зрения использовались для:Склейка панорам
3D моделирование местности
Поиск препятствий, определение местоположения
Подробнее см. “Computer Vision on Mars” by Matthies et al.Source: S. Seitz
Интерфейсы:KinectРолик NATAL
Зрение роботовNASA’s Mars Spirit Roverhttp://en.wikipedia.org/wiki/Spirit_roverhttp://www.robocup.org/Source: S. Seitz
Трехмерные картыImage from Microsoft’s Virtual Earth(see also:  Google Earth)Source: S. Seitz
PhotoSynth
PhotoSynth
Примеры наших задач3D реконструкция зданийДорожные лабораторииВидеонаблюдениеРазные задачи
Реконструкция городов
Дорожные лаборатории
Видеонаблюдение
Разное (MSR)Поиск текста в изображенияхМягкая сегментация видео
Структура курса13 лекций4 домашних заданияОценки за задания (2...5)Оценка за курс по заданиямМ.б. письменные упражненияЗадания на МатлабУдобнее и проще, чем на С++/С#Будет занятие по Матлабу!Вопросы:В форум – http://forum.graphicon.ru
Домашние заданияСистема распознавания автомобильных номеров в 3х частях
Распознавание цифр
Поиск номеров в изображении
Распознавание всего номера
Данные предоставлены компанией  ISS: www.iss.ruПрограмма курсаВведение в компьютерное зрение (весна)Low-level visionОбработка изображений и локальные особенностиMid-level visionСопоставление изображений и методы группировки, сегментацияHigh-level visionРаспознавание изображений, поиск изображенийРазные задачиДоп. Главы компьютерного зрения (осень)Анализ видео и видеонаблюдениеАнализ изображений человека (лицо, поза)Трёхмерная реконструкция по изображениям
=*Linear filteringEdge detectionОбработка изображений
Представление изображенийЧастотная фильтрация изображения, JPEGПирамиды изображенийСловари, разреженное представление

More Related Content

PDF
CV2015. Лекция 1. Понятия и история компьютерного зрения. Свет и цвет.
PDF
CV2015. Лекция 8. Распознавание лиц людей.
PDF
CV2015. Лекция 5. Выделение объектов.
PDF
Denis Perevalov -- Computer Vision with OpenCV 2
PDF
CV2015. Лекция 6. Нейросетевые алгоритмы.
PDF
Lecture 1. Introduction to Computer Vision
PDF
CV2015. Лекция 2. Простые методы распознавания изображений.
PDF
CV2015. Лекция 7. Поиск изображений по содержанию.
CV2015. Лекция 1. Понятия и история компьютерного зрения. Свет и цвет.
CV2015. Лекция 8. Распознавание лиц людей.
CV2015. Лекция 5. Выделение объектов.
Denis Perevalov -- Computer Vision with OpenCV 2
CV2015. Лекция 6. Нейросетевые алгоритмы.
Lecture 1. Introduction to Computer Vision
CV2015. Лекция 2. Простые методы распознавания изображений.
CV2015. Лекция 7. Поиск изображений по содержанию.

What's hot (18)

PDF
CV2015. Лекция 4. Классификация изображений и введение в машинное обучение.
PDF
CV2011 Lecture 10. Image retrieval
PDF
CV2011-2. Lecture 11. Face analysis.
PPTX
Нейронные сетки: покруче интернета
PDF
Компьютерное зрение
PDF
CV2011 Lecture 13. Real-time vision
PPTX
А.Левенчук -- Интеллект-стек: как создаётся Deus ex Machina
PDF
CV2011 Lecture 8. Detection
PPTX
А.Левенчук -- смычка кортекса и экзокортекса
PDF
20120413 videorecognition konushin_lecture01
PPTX
А.Левенчук -- киберэкспертиза: мифы и реальность
PDF
CV2011 Lecture 12. Action recognition
PDF
20120414 videorecognition konushin_lecture03
PDF
Kirill Rozin - Computer Vision. Alchemy of Modeling
PPTX
А.Левенчук -- преподавание системного мышления
PPT
Random 121017223838-phpapp02
PPTX
Представление знаний в технических системах
PPTX
Системная инженерия как технология мышления
CV2015. Лекция 4. Классификация изображений и введение в машинное обучение.
CV2011 Lecture 10. Image retrieval
CV2011-2. Lecture 11. Face analysis.
Нейронные сетки: покруче интернета
Компьютерное зрение
CV2011 Lecture 13. Real-time vision
А.Левенчук -- Интеллект-стек: как создаётся Deus ex Machina
CV2011 Lecture 8. Detection
А.Левенчук -- смычка кортекса и экзокортекса
20120413 videorecognition konushin_lecture01
А.Левенчук -- киберэкспертиза: мифы и реальность
CV2011 Lecture 12. Action recognition
20120414 videorecognition konushin_lecture03
Kirill Rozin - Computer Vision. Alchemy of Modeling
А.Левенчук -- преподавание системного мышления
Random 121017223838-phpapp02
Представление знаний в технических системах
Системная инженерия как технология мышления
Ad

Viewers also liked (17)

PPTX
CV2011 Lecture 2. Image processing
PPTX
CV2011 Lecture 1. Part 2. Light & Color
PDF
Новин сургут
PPTX
суд над наркотиками мбук цбс г. сургут (презентация)
PDF
4 g захватяики
PPTX
Математическое образование определяет будущее России.
PPTX
Модельно-ориентированная инженерия в MATLAB и Simulink
PDF
CV2011 Lecture 4. Image representation
PPTX
CV2011 Lecture 3. Basic image analysis
PDF
CV2011 Lecture 9. Large data
PDF
CV2011 Lecture 11. Basic video
PDF
CV2011 Lecture 5. Features
PDF
CV2011 Lecture 7. Recognition
PPT
борисова светлана 8 класс
PPT
7 а класс
PDF
Power point-1299163236-phpapp02
PDF
Почему презентации так трудно делать?
CV2011 Lecture 2. Image processing
CV2011 Lecture 1. Part 2. Light & Color
Новин сургут
суд над наркотиками мбук цбс г. сургут (презентация)
4 g захватяики
Математическое образование определяет будущее России.
Модельно-ориентированная инженерия в MATLAB и Simulink
CV2011 Lecture 4. Image representation
CV2011 Lecture 3. Basic image analysis
CV2011 Lecture 9. Large data
CV2011 Lecture 11. Basic video
CV2011 Lecture 5. Features
CV2011 Lecture 7. Recognition
борисова светлана 8 класс
7 а класс
Power point-1299163236-phpapp02
Почему презентации так трудно делать?
Ad

Similar to CV2011 Lecture 1. Part 1. Introduction to computer vision (20)

PPTX
Презентация 1. Введение в компьютерное зрение
PPT
Лекция 1
PPT
Антон Конушин_Введение
PDF
Denis Perevalov -- Computer vision with OpenCV 1
PPTX
ммк для новых и старых медиа
PPT
EligoVision_Autodesk_Forum
PPTX
Introduction to Deep Learning
PPTX
PPTX
презентация Puzzle
PDF
Машинное обучение в гидрологии (Георгий Айзель, ИВП РАН)
PDF
Машинное обучение в гидрологии (Г.В. Айзель)
PDF
Обзор артефактов стерео видео. Временная синхронизация
PDF
Способы построения и оценки карт салиентности
PPTX
SECR2013: Как научить ваших детей программировать
PPTX
Altair - Advanced Particle Simulator
PPT
MoITvation - презентация-размышление о роли IT в современном мире с конкретны...
PPTX
Обзор курса
PDF
Вычисление глубины по одному изображению
PDF
Антон Конушин (НИУ ВШЭ)
Презентация 1. Введение в компьютерное зрение
Лекция 1
Антон Конушин_Введение
Denis Perevalov -- Computer vision with OpenCV 1
ммк для новых и старых медиа
EligoVision_Autodesk_Forum
Introduction to Deep Learning
презентация Puzzle
Машинное обучение в гидрологии (Георгий Айзель, ИВП РАН)
Машинное обучение в гидрологии (Г.В. Айзель)
Обзор артефактов стерео видео. Временная синхронизация
Способы построения и оценки карт салиентности
SECR2013: Как научить ваших детей программировать
Altair - Advanced Particle Simulator
MoITvation - презентация-размышление о роли IT в современном мире с конкретны...
Обзор курса
Вычисление глубины по одному изображению
Антон Конушин (НИУ ВШЭ)

More from Anton Konushin (19)

PDF
CV2015. Лекция 2. Основы обработки изображений.
PDF
Технологии разработки ПО
PDF
Статистическое сравнение классификаторов
PDF
Classifier evaluation and comparison
PDF
CV2011-2. Lecture 08. Multi-view stereo.
PDF
CV2011-2. Lecture 12. Face models.
PDF
CV2011-2. Lecture 10. Pose estimation.
PDF
CV2011-2. Lecture 07. Binocular stereo.
PDF
CV2011-2. Lecture 06. Structure from motion.
PDF
CV2011-2. Lecture 05. Video segmentation.
PDF
CV2011-2. Lecture 04. Semantic image segmentation
PDF
CV2011-2. Lecture 03. Photomontage, part 2.
PDF
CV2011-2. Lecture 02. Photomontage and graphical models.
PDF
CV2011-2. Lecture 09. Single view reconstructin.
PDF
CV2011-2. Lecture 01. Segmentation.
PDF
Anton Konushin - TEDxRU 2009
PDF
Computer vision infrastracture
PPTX
Writing a computer vision paper
PDF
Andrew Zisserman Talk - Part 1a
CV2015. Лекция 2. Основы обработки изображений.
Технологии разработки ПО
Статистическое сравнение классификаторов
Classifier evaluation and comparison
CV2011-2. Lecture 08. Multi-view stereo.
CV2011-2. Lecture 12. Face models.
CV2011-2. Lecture 10. Pose estimation.
CV2011-2. Lecture 07. Binocular stereo.
CV2011-2. Lecture 06. Structure from motion.
CV2011-2. Lecture 05. Video segmentation.
CV2011-2. Lecture 04. Semantic image segmentation
CV2011-2. Lecture 03. Photomontage, part 2.
CV2011-2. Lecture 02. Photomontage and graphical models.
CV2011-2. Lecture 09. Single view reconstructin.
CV2011-2. Lecture 01. Segmentation.
Anton Konushin - TEDxRU 2009
Computer vision infrastracture
Writing a computer vision paper
Andrew Zisserman Talk - Part 1a

CV2011 Lecture 1. Part 1. Introduction to computer vision

Editor's Notes

  • #44: Выступая перед французской академией наук
  • #45: Автор таинственно пропал с поезда. Брата застрелили после патентного суда с Эдиссоном
  • #47: 1909 - аэрофотосъемка
  • #60: Low-level image processing algorithms are applied to 2D images to obtain the ``primal sketch”(directed edge segments, etc.), from which a 2.5 D sketch of the scene is obtained using binocularstereo. Finally, high-level (structural analysis, a priori knowledge) techniques are used to get 3Dmodel representations of the objects in the scene. This is probably the single most influential workin computer vision ever. Many researchers cried: ``From the paradigm created for us by Marr, noone can drive us out.”
  • #80: Сюда можно вставить видео