SlideShare a Scribd company logo
人を観る技術の先端的研究
片岡 裕雄, Ph.D.
産業技術総合研究所
知能システム研究部門 コンピュータビジョン研究グループ
http://www.hirokatsukataoka.net/
人を観る技術
•  研究に対する哲学:
•  観測により知識を強化するだけでなく,知識により観測を強化
–  「観測」のみでなく「累積された知識」を相互的に活用する枠組み
検出 行動認識 行動予測
walk walk
sit
drink
入力 予測対象
Large scale videos
データ解析(知識)
知識
モデル
モデリング 1 :
walk–sit–drink
モデリング 2 :
walk – sit – pc
・・・
モデリング N :
・・・
知識モデルActivity DB
蓄積
知識として蓄積
観測に知識を与える
•  次世代のコンピュータビジョン(CV)研究へ
–  最先端CV&PR&ML研究(e.g. 深層学習)と共存し,拡張できる概念
片岡裕雄の研究歴 – 2008 ~ 2015
• 共起特徴量の提案
• Tracking-by-detectionのフレームワークにてリアルタイム(15fps)追跡
• 論文:IJVS‘12, IEICE Trans. ‘14
• 受賞:電気学会論文誌賞’12, IEEE IECON’12 Award
人物行動解析技術 共同研究
サッカー映像解析(2008 – 2011)
【国立研究所】
  産総研
  交通安全環境研究所
【企業】
  パナソニック
  デンソーITラボラトリ
  沖電気
  トヨタ自動車
  Siemens AG
【University】
  ミュンヘン工科大学
  カリフォルニア大学
  東京大学
  慶應義塾大学
  東京電機大学
国内外の大学・国立
研究所・企業• 混雑状況下における複数選手追跡
• リアルタイム(30fps)で追跡・俯瞰画像位置特定
• 論文:ACCVW’09, 電気学会論文誌’10, 画像電子学会論文誌’12
• 受賞:DIA’10若手奨励賞, SICE’10論文賞
歩行者検出・追跡(2009 – 2011)
SITKeioUniv.Univ.ofTokyo
ヒューマンセンシングを中心としたコンピュータビジョン技術の提案
UCRTUM
‘08‘09-’14
’11-’12’13-
’14–‘15
• 行動履歴データベースの解析
• ベイジアンフレームワークによる行動予測
• 論文:MIRU’12, SSII’13, and in submission
データ解析を統合した行動予測(2012 – 現在)
AIST’15–
• Dense Trajectories + 共起特徴
• Topic Model – LDAによる特徴量抽出
• Convolutional neural networks (CNN)による特徴抽出
• 論文: MIRU’12, SSII’13, ACCV’14, and in submission
人物行動認識のための改良型特徴(2011 – 現在)
• 環境認識による教師無しクラスタリング
• 約30万人の動線を解析
• 論文:ViEW’12, IAPR MVA’13
大規模動線解析(2012 – 2013)
修士課程まで (2008 – 2011)
•  人物を検出・追跡する
–  所属:慶應義塾大学青木義満研究室
–  興味:解析のための検出・追跡,人物認識の基礎技術の習得
–  テーマ1:スポーツ映像処理 => 戦術解析
•  卒業論文,修士論文
–  テーマ2:歩行者検出・追跡 => 自動車の予防安全
•  結果的には博士論文に
http://www.aoki-medialab.org/
サッカー映像解析 (2008 – 2011)
•  戦術解析のための複数選手追跡
–  Color-based Particle Filterによる個人選手追跡
–  混雑状況時には識別器により選手を検出して重心を再配置
–  選手の相対的な位置関係や前のフレームの速度を考慮
リアルタイム(20fps)で複数選手追跡とグローバル位置推定
DIA’10若手奨励賞, SICE’10論文賞	
  
歩行者検出・追跡 (2009 – 2011)
共起特徴による歩行者検出と歩行者追跡
–  共起特徴 + 識別器による歩行者検出
–  Tracking-by-detectionに車両運動モデルや識別器を適用
電気学会論文誌賞’12, IEEE IECON’12 Award, IJVS‘12	
  
複雑環境下でも検出・追跡できるフレームワーク
博士課程 (2011 – 2014)
http://campar.in.tum.de/Main/SlobodanIlic
•  人物の行動を認識する
–  所属:慶應義塾大学青木義満研究室
•  在外1:カリフォルニア大学リバーサイド校 (2011 – 2012)
–  Supervisor: Prof. Bir Bhanu
–  紹介:斎藤英雄先生
•  在外2:産業技術総合研究所 (2012 - 2013)
–  Supervisor: 佐藤雄隆博士,岩田健司博士,大西正輝博士
•  在外3:ミュンヘン工科大学(2013, 2014)
–  Supervisor: Prof. Nassir Navab, Dr. Slobodan Ilic
–  興味:より詳細な行動の把握,世界水準の研究へ(博士課程3年うち2.5年は学外)
–  テーマ:詳細行動認識 => 日常行動,手術映像の解析,歩行者動作
http://www.cris.ucr.edu/index.php
https://unit.aist.go.jp/is/ci/group/cvrg_j.html
http://www.aoki-medialab.org/
詳細行動認識
視覚的に類似してるが意味が異なる行動識別
–  重大事故の前の行動傾向を検知
飛出し行動	
  
歩道を移動	
  
【交通】「飛出し」前の特徴変化	
  
【生産】ルーティンワークの抜けが重要事故	
   【医療】手術中の小さなミスが命取り	
  
Dense Trajectories (DT) [Wang, IJCV2013]
•  時系列的にも空間的にも密なサンプリング
–  スケール変化への対応:ピラミッド構造でフロー取得
–  特徴取得:HOG, HOF, MBH, Traj.
–  特徴表現:Bag-of-words (BoW)
H. Wang+, “Dense Trajectories and Motion Boundary Descriptors for Action Recognition”, in IJCV2013.
H. Kataoka, “【チュートリアル】動的な人物・物体認識技術 –Dense Trajectories–”, in Slideshare.
http://www.slideshare.net/HirokatsuKataoka/dt-tutorial
共起特徴量を用いた改良
•  DTの特徴取得フレームワークに共起特徴を挿入
–  共起特徴量
•  CoHOG[Watanabe, PSIVT2009] (ペアのカウント), ECoHOG (エッジ強度の累積)
•  PCAによる次元圧縮
–  特徴改善の効果
•  密なフロー抽出 + さらに詳細な特徴抽出
•  PCAによる効率的な特徴空間生成
•  共起特徴統合 (62.4%) > DT (59.2%)
T. Watanabe+, “Co-occurrence histograms of oriented gradients for pedestrian detection”, in PSIVT2009.
CoHOG
ECoHOG
H. Kataoka+, “Extended Co-occurrence HOG with Dense Trajectories for Fine-grained Activity
Recognition”, in ACCV2014.
上位50の頻出特徴量
–  隣接する領域から特徴を抽出しているのがわかる
•  詳細行動には「密なサンプリング + 詳細な特徴記述」が効果的
学振特別研究員(PD) (2014 – 2015)
http://ics.t.u-tokyo.ac.jp/ja/
•  人物行動を事前に予測する
–  所属:東京大学下坂正倫研究室
•  ウェアラブルセンサや車載センサ等からデータ取得
•  機械学習によるデータ解析
–  興味:データ解析との統合,画像に映らない情報を推測
–  テーマ:特徴マイニング,人物行動予測
BoWの特徴ベクトル
•  実際に取得されたBoWの特徴ベクトル (DT + BoW)
–  ほとんどの値がゼロで構成されている
–  不必要な部分が多数存在
0.00	
 0.00	
 0.00	
 0.00	
 0.00	
 0.41	
 0.00	
 0.00	
 0.10	
 0.00	
0.00	
 0.00	
 0.00	
 0.00	
 0.00	
 0.41	
 0.00	
 0.00	
 0.20	
 0.00	
0.00	
 0.00	
 0.00	
 0.00	
 0.00	
 0.71	
 0.00	
 0.00	
 0.10	
 0.00	
0.00	
 0.00	
 0.00	
 0.00	
 0.00	
 0.25	
 0.00	
 0.00	
 0.30	
 0.00	
0.00	
 0.00	
 0.00	
 0.10	
 0.00	
 0.80	
 0.00	
 0.00	
 0.10	
 0.00	
.
.
.
.
.
.
.
.
.
vec1
vec2
vec3
vec4
vec5
非ゼロの値は同一のベクトル位置に格納される
 → 冗長部の排除が「精度の向上」や「容量の削減」に繋がる?
Bin No.
B1 B2 ... B10
H. Wang+, “Dense Trajectories and Motion Boundary Descriptors for Action Recognition”, in IJCV2013.
H. Kataoka, “【チュートリアル】動的な人物・物体認識技術 –Dense Trajectories–”, in Slideshare.
http://www.slideshare.net/HirokatsuKataoka/dt-tutorial
アソシエーション分析[Agrawal, SIGMOD1993]
•  頻出の部分集合を抽出
–  Support(支持度)とConfidence(信頼度)という指標を使用
•  BoWの際の設定
n: BoWのベクトル数 (n=5)
X, Y: BoWの非ゼロのベクトル位置(B1, B2 … B10)の集合
(X U Y): XとYをどちらも含む特徴ベクトル (e.g. “(B4 B6) U B9” )
R. Agrawal+, “Mining Association Rules between Sets of Items in Large Databases”, in SIGMOD1993.
n
countYX
support
).( ∪
=
countX
countYX
confidence
.
).( ∪
=
アソシエーション分析の流れ
(“B6”, “B9”)
が頻出要素として抽出
vec no.	
 Item	
vec1	
 B6, B9	
vec2	
 B6, B9	
vec3	
 B6, B9	
vec4	
 B6, B9	
vec5	
 B4, B6, B9	
Item	
 support	
{B4}	
 1 (20%)	
{B6}	
 5 (100%)	
{B9}	
 5 (100%)	
Item	
 support	
{B6}	
 5	
{B9}	
 5	
Bin4はカット
Item	
 support	
{B6, B9}	
 5 (100%)	
組合せを増やしてsupportを計算
B9
B6
B4
Dense Trajectoriesの部分集合
•  密な空間の頻度による分解
–  頻度の低いフロー(e.g. 背景,稀な特徴)は除去される
–  共起性も見ているので意味のある空間(e.g. 手振り)に落としこみやすい
Dense Trajectories	
BoW 1	
 BoW 2	
BoW 3	
 BoW 4	
× ×
×
××
×
×
× ××
×
×
×
×
××
××
××
×
×
××
×
×
×
#ofdimension
16000
9792
次元を削減しつつも精度を向上(特徴マイニングの重要性)
密な空間から最小動作単位に分離
(適応的な組み合わせが効果的)
背景領域は除去されている
現在までのアプローチ
Time-series
事後解析
Event detection
(Action tag : Ai)
It’s too late!!
しかし,今までのアプローチはほとんどが事後解析
これからのアプローチ
Time-series
Event prediction
(Prediction tag : Pi)
Activity prediction and it’s prevented
事前予測
一方,事前に情報を察知しないと阻止できない場面がある
行動予測の課題
- Action sequence
“Walk” => “Sit” の段階で “Using a PC”を予測
- Time zone (補助的な要素)
Day time
???	
Daytime
(Time Zone)	
Walking
(Previous Activity)	
Sitting
(Current Activity)	
???
(Next Activity)	
xtimezone	
xprevious	
 xcurrent	
θ = “Using a PC”	
Given	
 Not given	
Time series
•  時系列行動タグ + 要素として時間帯を入力へ
–  時間帯 (Time Zone)
•  “morning”, “day time”, “night”
–  前行動,現行動
•  “walk”, “bend”, “stand”, “sit”…
–  次行動
•  “use a PC”, “read”, “meal”…
•  解析手法
–  Naïve Bayes
行動予測のアプローチ
行動履歴DB
結果
Time Attributes
Estimated Intention
Action
PC (0.82)
Read (0.11)
Predicted activity
Read (1.00)
PC (0.00)
背景に潜む知識の使用により81.0%の精度,最大約20秒先を予測
Freq.
Second
平均約5秒,最大で約20秒の予測
産総研 特別研究員 (2015 – 20xx)
•  より高度な人物の行動認識・解析・予測へ
–  所属:産業技術総合研究所 コンピュータビジョン研究グループ
–  興味:人物行動解析技術の高いレベルでの拡張
–  テーマ1:行動認識とデータ解析による高度な人物行動解析
•  データベースや解析技術による知識側の強化
•  予測だけに留まらないコンピュータビジョンの拡張
–  テーマ2:3D VisionやDeep CNNによる情報量の追加や高精度化
•  物体情報(3D Vision)の統合による行動領域の拡張
•  Deep Learningによる詳細解析や特徴バリエーションの増加
観測と知識
•  “観測” が “知識”を強くする
•  “知識” が “観測”を強くする
Large scale videos
データ解析(知識)
知識
モデル モデリング 1 :
直立 –…– 調理
モデリング 2 :
歩行 – 座る – 食事
・・・
モデリング N :
 ・・・
知識モデル
Activity DB
観測
歩行 –「物を落とす」 – 「片付け」 – 座る – 食事
行動認識(観測)
行動
認識
観測から知識強化
蓄積
予測,意図
相違,共起…
比較
drink
sit
walk
モデルと何か違う?
観測と知識,その未来
重大事故の前の行動傾向を検知、見守り、マーケティング、スポーツ、適切なサービ
ス、コミュニケーション、ロボット、健康、産業、セキュリティ、福祉、工場、交通、
ライフログ、防犯、ティーチング、行動推薦、行動統計、行動傾向、地図の意味づけ、
人間と機械の協調作業、心理分析、病気発見、認知症の早期発見、発達障害の分析、
行動シミュレーション、購買行動の分析、サービス行動の分析、旅館の女将の分析、
事故の因果関係、運転行動の解析、職人の解析、暗黙知的動作の解析、暗黙知的動作
の定量化、農作業行動の解析、林業、漁業、日常行動、料理、人間関係の理解、異常
検出、人間とオブジェクトの関係理解、群衆認識、人物間のインタラクション、医療
行動の解析、熟練度の評価、元気さの評価、うつ病の早期発見、性格分析、相性診断、
仕事の相性診断、性格テスト、省エネ、友達ロボット、人を鍛えるロボット、ユーザ
インタフェース、リアルの広告推薦技術、情報推薦、仕事の点数づけ、スキル定量化、
スマートホーム、自動運転、作業最適化、作業手順生成、類似作業検索、類似行動検
索、行動を見て服装選択、行動分類、良かった時の行動を思い出す、活動度の測定、
休養のレコメンド、運動のレコメンド、行動比較、徘徊の検知、人物特定、スマート
家電、加齢判定、メディアアート、災害救助、緊張度の推定、心理状態の分析、共感
は作れる、感動できる行動、痩せる行動、行動の平均、評価を上げる行動、行動のつ
ながりを発見、誤りをゼロにする行動、マナーを教える行動、PDCAサイクルにより再
帰的に行動を良くする、生活の質向上、歩行だけでなく行動により個人認証、発達を
加速させる行動、特定行動の検出、癖の発見、無意識行動の顕在化、危険場所での特
定行動禁止、怪我を防止する行動、リハビリに使える行動認識、基本行動の分類、行
動回数の蓄積による環境理解、行動促進のための行動認識、異常の種類認識、伝え方
と行動、プレゼンの行動認識、行動の文章化、行動の暗号化と解読、行動の自己改善、
行動変化の検出、行動の翻訳、自殺の低減
今後
•  コラボレーションによる研究の深化と応用へ
–  多くの共同研究により知見や技術を拡張させるに至っている
–  企業だけに限らず,大学間の連携も行っている
「観測と知識の相補的な深化」を今後も追求

More Related Content

PDF
【チュートリアル】コンピュータビジョンによる動画認識
PDF
【チュートリアル】コンピュータビジョンによる動画認識 v2
PDF
大規模画像認識とその周辺
PDF
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
PDF
MIRU2018 tutorial
PDF
cvpaper.challenge -CVの動向とこれからの問題を作るために- (東京大学講演)
PDF
画像認識における幾何学的不変性の扱い
PDF
【2017.06】 cvpaper.challenge 2017
【チュートリアル】コンピュータビジョンによる動画認識
【チュートリアル】コンピュータビジョンによる動画認識 v2
大規模画像認識とその周辺
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
MIRU2018 tutorial
cvpaper.challenge -CVの動向とこれからの問題を作るために- (東京大学講演)
画像認識における幾何学的不変性の扱い
【2017.06】 cvpaper.challenge 2017

What's hot (20)

PDF
20150414seminar
PDF
【チュートリアル】動的な人物・物体認識技術 -Dense Trajectories-
PDF
DeepLearningDay2016Spring
PPTX
MIRU2014 tutorial deeplearning
PDF
20150803.山口大学講演
PPTX
画像処理AIを用いた異常検知
PDF
動画認識サーベイv1(メタサーベイ )
PDF
Deep Learningと画像認識   ~歴史・理論・実践~
PDF
IEEE ITSS Nagoya Chapter
PDF
優れた問いを見つける(中京大学講演)
PPTX
多層NNの教師なし学習 コンピュータビジョン勉強会@関東 2014/5/26
PDF
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
PDF
画像処理分野における研究事例紹介
PDF
DeepLearningDay2016Summer
PPT
Deep Learningの技術と未来
PDF
20190804_icml_kyoto
PDF
【慶應大学講演】なぜ、博士課程に進学したか?
PDF
20150930
PDF
Tutorial-DeepLearning-PCSJ-IMPS2016
PPTX
全脳関西編(松尾)
20150414seminar
【チュートリアル】動的な人物・物体認識技術 -Dense Trajectories-
DeepLearningDay2016Spring
MIRU2014 tutorial deeplearning
20150803.山口大学講演
画像処理AIを用いた異常検知
動画認識サーベイv1(メタサーベイ )
Deep Learningと画像認識   ~歴史・理論・実践~
IEEE ITSS Nagoya Chapter
優れた問いを見つける(中京大学講演)
多層NNの教師なし学習 コンピュータビジョン勉強会@関東 2014/5/26
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
画像処理分野における研究事例紹介
DeepLearningDay2016Summer
Deep Learningの技術と未来
20190804_icml_kyoto
【慶應大学講演】なぜ、博士課程に進学したか?
20150930
Tutorial-DeepLearning-PCSJ-IMPS2016
全脳関西編(松尾)
Ad

Viewers also liked (20)

PDF
ECCV 2016 速報
PDF
CVPR 2016 速報
PPTX
画像キャプションの自動生成
PDF
カメラ間人物照合サーベイ
PDF
Extended Co-occurrence HOG with Dense Trajectories for Fine-grained Activity ...
PPTX
2016/4/16 名古屋CVPRML 発表資料
PDF
KinectやRealSenseの概要とさまざまな使い方
PDF
Kinect、real senseの概要とさまざまな使い方
PPTX
Pix2pixによるcs立体図の地すべり検出
PDF
Hiroshima Motion Control Network 12, September, 2015
PDF
内蔵化、モバイル化に向かうDepthセンサー
PDF
Fisher Vectorによる画像認識
PDF
ILSVRC2015 手法のメモ
PDF
CV分野におけるサーベイ方法
PDF
【2015.07】(1/2)cvpaper.challenge@CVPR2015
PDF
【2015.08】(3/5)cvpaper.challenge@CVPR2015
PDF
【2015.08】(4/5)cvpaper.challenge@CVPR2015
PDF
【2015.06】cvpaper.challenge@CVPR2015
PDF
【2015.08】(5/5)cvpaper.challenge@CVPR2015
PPTX
CVPR2016を自分なりにまとめてみた
ECCV 2016 速報
CVPR 2016 速報
画像キャプションの自動生成
カメラ間人物照合サーベイ
Extended Co-occurrence HOG with Dense Trajectories for Fine-grained Activity ...
2016/4/16 名古屋CVPRML 発表資料
KinectやRealSenseの概要とさまざまな使い方
Kinect、real senseの概要とさまざまな使い方
Pix2pixによるcs立体図の地すべり検出
Hiroshima Motion Control Network 12, September, 2015
内蔵化、モバイル化に向かうDepthセンサー
Fisher Vectorによる画像認識
ILSVRC2015 手法のメモ
CV分野におけるサーベイ方法
【2015.07】(1/2)cvpaper.challenge@CVPR2015
【2015.08】(3/5)cvpaper.challenge@CVPR2015
【2015.08】(4/5)cvpaper.challenge@CVPR2015
【2015.06】cvpaper.challenge@CVPR2015
【2015.08】(5/5)cvpaper.challenge@CVPR2015
CVPR2016を自分なりにまとめてみた
Ad

Similar to 【SSII2015】人を観る技術の先端的研究 (20)

PPTX
深層学習を用いたコンピュータビジョン技術とスマートショップの実現
PPTX
Crowd Counting & Detection論文紹介
PDF
【2016.02】cvpaper.challenge2016
PPTX
サーベイ論文:画像からの歩行者属性認識
PDF
【2016.01】(3/3)cvpaper.challenge2016
PDF
動画像理解のための深層学習アプローチ
PDF
統計的学習手法による人検出
PPTX
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
PPTX
Hasc challenge2012-kawaguchi
PDF
研究室輪読 Feature Learning for Activity Recognition in Ubiquitous Computing
PDF
CVPR 2019 report (30 papers)
PDF
20201010 personreid
PDF
動作認識の最前線:手法,タスク,データセット
PDF
車載カメラの映像から歩行者に関わる危険を予測する技術
KEY
research(9:24)
PDF
【2015.05】cvpaper.challenge@CVPR2015
PDF
tut_pfi_2012
PPTX
Online moving camera_background_subtraction
PDF
Study on Visual Analytics Framework for Formulating Evaluation Metrics of Mul...
PDF
深層学習を用いたコンピュータビジョン技術とスマートショップの実現
Crowd Counting & Detection論文紹介
【2016.02】cvpaper.challenge2016
サーベイ論文:画像からの歩行者属性認識
【2016.01】(3/3)cvpaper.challenge2016
動画像理解のための深層学習アプローチ
統計的学習手法による人検出
[サーベイ論文] Deep Learningを用いた歩行者検出の研究動向
Hasc challenge2012-kawaguchi
研究室輪読 Feature Learning for Activity Recognition in Ubiquitous Computing
CVPR 2019 report (30 papers)
20201010 personreid
動作認識の最前線:手法,タスク,データセット
車載カメラの映像から歩行者に関わる危険を予測する技術
research(9:24)
【2015.05】cvpaper.challenge@CVPR2015
tut_pfi_2012
Online moving camera_background_subtraction
Study on Visual Analytics Framework for Formulating Evaluation Metrics of Mul...

More from Hirokatsu Kataoka (9)

PDF
【ECCV 2016 BNMW】Human Action Recognition without Human
PDF
【BMVC2016】Recognition of Transitional Action for Short-Term Action Prediction...
PDF
【論文紹介】Fashion Style in 128 Floats: Joint Ranking and Classification using Wea...
PDF
【CVPR2016_LAP】Dominant Codewords Selection with Topic Model for Action Recogn...
PDF
Deep Residual Learning (ILSVRC2015 winner)
PDF
【ISVC2015】Evaluation of Vision-based Human Activity Recognition in Dense Traj...
PDF
TensorFlowによるCNNアーキテクチャ構築
PDF
【ITSC2015】Fine-grained Walking Activity Recognition via Driving Recorder Dataset
PDF
PythonによるCVアルゴリズム実装
【ECCV 2016 BNMW】Human Action Recognition without Human
【BMVC2016】Recognition of Transitional Action for Short-Term Action Prediction...
【論文紹介】Fashion Style in 128 Floats: Joint Ranking and Classification using Wea...
【CVPR2016_LAP】Dominant Codewords Selection with Topic Model for Action Recogn...
Deep Residual Learning (ILSVRC2015 winner)
【ISVC2015】Evaluation of Vision-based Human Activity Recognition in Dense Traj...
TensorFlowによるCNNアーキテクチャ構築
【ITSC2015】Fine-grained Walking Activity Recognition via Driving Recorder Dataset
PythonによるCVアルゴリズム実装

【SSII2015】人を観る技術の先端的研究