CVML2011: розпізнавання людських дій (Іван Лаптєв)

зукун

Опубліковано 26 серпня 2011 р

іван

  • 6 коментарів
  • 5 вподобань
  • Статистика
  • Примітки

Увійдіть, щоб побачити коментарі

  1. 1. ENS/INRIA Візуальне розпізнавання та машинне навчання Літня школа 25-29 липня, Париж Франція Школа, 25 29 липня Париж, Розпізнавання людських дій Іван Лаптев [email protected] ilt @iif INRIA, WILLOW, ENS/INRIA/CNRS UMR 8548 Laboratoire d'Informatique, Ecole Normale Supérieure, Paris d Informatique, Включає слайди від: Alyosha Efros, Mark Everingham та Andrew Zisserman
  2. 2. Огляд лекції Мотивація Історичний огляд Застосування та випробування Оцінка пози людини Живописні структури Останні досягнення Методи, що базуються на зовнішньому вигляді pp Зображення історії руху Активні моделі фігури та пріоритети руху Методи, засновані на русі Загальні та параметричні оптичні потоки Шаблони руху Просторово-часові методи p Простір-час особливості Навчання зі слабким наглядом
  3. 3. Мотивація I: Художня репрезентація Ранні дослідження були мотивовані репрезентаціями людини в ArtsDa Vinci: «для художника є необхідним повністю ознайомитися з анатомією нервів, кісток, м'язів та сухожиль, щоб він розумів y, за їхні різні рухи та стреси, які сухожилля чи який м’яз спричиняє певний рух ”„ Я прошу ваги [тиску] цієї людини для кожного сегменту руху, який я піднімаюся по цих сходах, і ваги, яку він надає на b і на c. Зверніть увагу на вертикальну лінію нижче центру мас цієї людини ". Леонардо да Вінчі (1452–1519): Людина, що піднімається нагору, або сходами.
  4. 4. Мотивація II: Біомеханіка  Виникнення біомеханіки  Бореллі застосував до біології аналітичні та геометричні методи, розроблені Галілео Галілеєм  Він першим зрозумів, що кістки служать важелями, а м’язи функціонують відповідно до математичних принципів p  Його фізіологічний дослідження включали аналіз м’язів та математичне обговорення рухів, таких як біг або стрибки Джованні Альфонсо Бореллі (1608–1679)
  5. 5. Мотивація III: Сприйняття руху Етьєн-Жуль Етьєн Жуль Марей: (1830–1904) зробив хронофотографічні експерименти впливовими для нової галузі кінематографії. Він піонірував кінофільми та застосовував свою техніку для вивчення руху
  6. 6. Мотивація III: Сприйняття руху Гуннар Йоханссон [1973] започаткував дослідження використання зображень [] pg • послідовності для запрограмованого аналізу руху людини «Рухомі світлові дисплеї (LED) дозволяють ідентифікувати знайомих людей, що рухаються дисплеї»  і стать та надихнув багато робіт з комп'ютерного зору. Гуннар Йоханссон, Сприйняття та психофізика, 1973
  7. 7. Дії людини: Історичний огляд XV століття  дослідження анатомії t  XVII століття поява біомеханіки XIX століття  поява кінематографії  1973 дослідження сприйняття людського руху Сучасний комп'ютерний зір M d t i i
  8. 8. Сучасні додатки: Захоплення руху та анімація Avatar (2009)
  9. 9. Сучасні програми: Зйомка та анімація руху Леонардо да Вінчі (1452–1519) Аватар (2009)
  10. 10. Сучасні програми: Редагування відео у просторі-часі Завершення відео Ю. Векслер, Е. Шехтман та М. Ірані, CVPR 2004
  11. 11. Сучасні програми: Відеомонтаж Розпізнавання дії на відстані Олексій А. Ефрос, Олександр К. Берг, Грег Морі, Джітендра Малік, ICCV 2003
  12. 12. Сучасні додатки: Відеомонтаж Розпізнавання дії на відстані Олексій А. Ефрос, Олександр К. Берг, Грег Морі, Джітендра Малік, ICCV 2003
  13. 13. Чому розпізнавання дій?  Індексація та пошук відео корисні у виробництві телевізорів, розвагах, освіті, соціальних дослідженнях, безпеці… Домашні відео: напр. ТБ та Інтернет: “Моя, напр. дочка "Бій у скелелазінні" парламент "Дослідження соціології: Ручне спостереження: проаналізовано куріння 260 тис. переглядів дій за 7 днів на 900 фільмах на YouTube
  14. 14. Як розпізнавання дій пов’язане з комп’ютерним зором? Sky Sk Street знак Автомобіль Автомобіль Автомобіль Автомобіль Автомобіль Автомобіль Автомобіль Дорога
  15. 15. Ми можемо розпізнати машини та дороги, g, що далі? 12184113 зображення, 17624 синсети
  16. 16. Літак Рівнина розбилася, салон розбитий, хтось може постраждати або загинути.
  17. 17. кішка жінка сміття бі т ч
  18. 18.  Бачення орієнтоване на людину: Ми здебільшого дбаємо про речі, які є для нас важливими, люди  Дії людей розкривають функцію об’єктів p p j  Майбутні виклики: - Функція: Що я можу з цим зробити і як? - Передбачення: Що може статися, якщо хтось це зробить? - Визнання цілей: що ця людина намагається зробити?
  19. 19. Скільки людей-пікселів? людина - Фільми ТБ YouTube Y T b
  20. 20. Скільки людей-пікселів? людина - Фільми TV YouTube
  21. 21. Скільки людей-пікселів? людина - 35% 34% Кіно ТБ 40% YouTube
  22. 22. Скільки даних ми маємо?  Доступна величезна кількість відео, і все більше телеканалів записується з 60-х 60-ти> 34 тис. Годин завантаження відео щодня

30 млн камер спостереження в США =>

5 годин фільмів

  • 179. Тимчасове виявлення дій "Сісти" та "Відкрити двері" у фільмах: Випускник, Плачуча гра, Життя в забутті
  • 180. Висновки  Моделі слів слів на даний момент є домінуючими, тому структуру (пози людини тощо) слід інтегрувати.  Словник дій не є чітко визначеним - це залежить від мети та завдання g  Дії слід використовувати для функціональної інтерпретації візуального світу