【SSII2015】人を観る技術の先端的研究

人を観る技術の先端的研究
片岡裕雄, Ph.D.
産業技術総合研究所
知能システム研究部門コンピュータビジョン研究グループ
http://www.hirokatsukataoka.net/

人を観る技術
•  研究に対する哲学：
•  観測により知識を強化するだけでなく，知識により観測を強化
–  「観測」のみでなく「累積された知識」を相互的に活用する枠組み
検出行動認識行動予測
walk walk
sit
drink
入力予測対象
Large scale videos
データ解析(知識)
知識
モデル
モデリング 1 :
walk–sit–drink
モデリング 2 :
walk – sit – pc
・・・
モデリング N :
・・・
知識モデルActivity DB
蓄積
知識として蓄積
観測に知識を与える
•  次世代のコンピュータビジョン(CV)研究へ
–  最先端CV&PR&ML研究(e.g. 深層学習)と共存し，拡張できる概念

片岡裕雄の研究歴 – 2008 ~ 2015
• 共起特徴量の提案
• Tracking-by-detectionのフレームワークにてリアルタイム(15fps)追跡
• 論文：IJVS‘12, IEICE Trans. ‘14
• 受賞：電気学会論文誌賞’12, IEEE IECON’12 Award
人物行動解析技術共同研究
サッカー映像解析(2008 – 2011)
【国立研究所】
  産総研
  交通安全環境研究所
【企業】
  パナソニック
  デンソーITラボラトリ
  沖電気
  トヨタ自動車
  Siemens AG
【University】
  ミュンヘン工科大学
  カリフォルニア大学
  東京大学
  慶應義塾大学
  東京電機大学
国内外の大学・国立
研究所・企業• 混雑状況下における複数選手追跡
• リアルタイム(30fps)で追跡・俯瞰画像位置特定
• 論文：ACCVW’09, 電気学会論文誌’10, 画像電子学会論文誌’12
• 受賞：DIA’10若手奨励賞, SICE’10論文賞
歩行者検出・追跡(2009 – 2011)
SITKeioUniv.Univ.ofTokyo
ヒューマンセンシングを中心としたコンピュータビジョン技術の提案
UCRTUM
‘08‘09-’14
’11-’12’13-
’14–‘15
• 行動履歴データベースの解析
• ベイジアンフレームワークによる行動予測
• 論文：MIRU’12, SSII’13, and in submission
データ解析を統合した行動予測(2012 – 現在)
AIST’15–
• Dense Trajectories + 共起特徴
• Topic Model – LDAによる特徴量抽出
• Convolutional neural networks (CNN)による特徴抽出
• 論文: MIRU’12, SSII’13, ACCV’14, and in submission
人物行動認識のための改良型特徴(2011 – 現在)
• 環境認識による教師無しクラスタリング
• 約30万人の動線を解析
• 論文：ViEW’12, IAPR MVA’13
大規模動線解析(2012 – 2013)

修士課程まで (2008 – 2011)
•  人物を検出・追跡する
–  所属：慶應義塾大学青木義満研究室
–  興味：解析のための検出・追跡，人物認識の基礎技術の習得
–  テーマ１：スポーツ映像処理 => 戦術解析
•  卒業論文，修士論文
–  テーマ２：歩行者検出・追跡 => 自動車の予防安全
•  結果的には博士論文に
http://www.aoki-medialab.org/

サッカー映像解析 (2008 – 2011)
•  戦術解析のための複数選手追跡
–  Color-based Particle Filterによる個人選手追跡
–  混雑状況時には識別器により選手を検出して重心を再配置
–  選手の相対的な位置関係や前のフレームの速度を考慮
リアルタイム(20fps)で複数選手追跡とグローバル位置推定
DIA’10若手奨励賞, SICE’10論文賞

歩行者検出・追跡 (2009 – 2011)
共起特徴による歩行者検出と歩行者追跡
–  共起特徴 + 識別器による歩行者検出
–  Tracking-by-detectionに車両運動モデルや識別器を適用
電気学会論文誌賞’12, IEEE IECON’12 Award, IJVS‘12

複雑環境下でも検出・追跡できるフレームワーク

博士課程 (2011 – 2014)
http://campar.in.tum.de/Main/SlobodanIlic
•  人物の行動を認識する
–  所属：慶應義塾大学青木義満研究室
•  在外１：カリフォルニア大学リバーサイド校 (2011 – 2012)
–  Supervisor: Prof. Bir Bhanu
–  紹介：斎藤英雄先生
•  在外２：産業技術総合研究所 (2012 - 2013)
–  Supervisor: 佐藤雄隆博士，岩田健司博士，大西正輝博士
•  在外３：ミュンヘン工科大学(2013, 2014)
–  Supervisor: Prof. Nassir Navab, Dr. Slobodan Ilic
–  興味：より詳細な行動の把握，世界水準の研究へ(博士課程3年うち2.5年は学外)
–  テーマ：詳細行動認識 => 日常行動，手術映像の解析，歩行者動作
http://www.cris.ucr.edu/index.php
https://unit.aist.go.jp/is/ci/group/cvrg_j.html
http://www.aoki-medialab.org/

詳細行動認識
視覚的に類似してるが意味が異なる行動識別
–  重大事故の前の行動傾向を検知
飛出し行動

歩道を移動

【交通】「飛出し」前の特徴変化

【生産】ルーティンワークの抜けが重要事故
【医療】手術中の小さなミスが命取り

Dense Trajectories (DT) [Wang, IJCV2013]
•  時系列的にも空間的にも密なサンプリング
–  スケール変化への対応：ピラミッド構造でフロー取得
–  特徴取得：HOG, HOF, MBH, Traj.
–  特徴表現：Bag-of-words (BoW)
H. Wang+, “Dense Trajectories and Motion Boundary Descriptors for Action Recognition”, in IJCV2013.
H. Kataoka, “【チュートリアル】動的な人物・物体認識技術 –Dense Trajectories–”, in Slideshare.
http://www.slideshare.net/HirokatsuKataoka/dt-tutorial

共起特徴量を用いた改良
•  DTの特徴取得フレームワークに共起特徴を挿入
–  共起特徴量
•  CoHOG[Watanabe, PSIVT2009] (ペアのカウント), ECoHOG (エッジ強度の累積)
•  PCAによる次元圧縮
–  特徴改善の効果
•  密なフロー抽出 + さらに詳細な特徴抽出
•  PCAによる効率的な特徴空間生成
•  共起特徴統合 (62.4%) > DT (59.2%)
T. Watanabe+, “Co-occurrence histograms of oriented gradients for pedestrian detection”, in PSIVT2009.
CoHOG
ECoHOG
H. Kataoka+, “Extended Co-occurrence HOG with Dense Trajectories for Fine-grained Activity
Recognition”, in ACCV2014.

上位50の頻出特徴量
–  隣接する領域から特徴を抽出しているのがわかる
•  詳細行動には「密なサンプリング + 詳細な特徴記述」が効果的

学振特別研究員(PD) (2014 – 2015)
http://ics.t.u-tokyo.ac.jp/ja/
•  人物行動を事前に予測する
–  所属：東京大学下坂正倫研究室
•  ウェアラブルセンサや車載センサ等からデータ取得
•  機械学習によるデータ解析
–  興味：データ解析との統合，画像に映らない情報を推測
–  テーマ：特徴マイニング，人物行動予測

BoWの特徴ベクトル
•  実際に取得されたBoWの特徴ベクトル (DT + BoW)
–  ほとんどの値がゼロで構成されている
–  不必要な部分が多数存在
0.00
0.00
0.00
0.00
0.00
0.41
0.00
0.00
0.10
0.00
0.00
0.00
0.00
0.00
0.00
0.41
0.00
0.00
0.20
0.00
0.00
0.00
0.00
0.00
0.00
0.71
0.00
0.00
0.10
0.00
0.00
0.00
0.00
0.00
0.00
0.25
0.00
0.00
0.30
0.00
0.00
0.00
0.00
0.10
0.00
0.80
0.00
0.00
0.10
0.00
.
.
.
.
.
.
.
.
.
vec1
vec2
vec3
vec4
vec5
非ゼロの値は同一のベクトル位置に格納される
→ 冗長部の排除が「精度の向上」や「容量の削減」に繋がる？
Bin No.
B1 B2 ... B10
H. Wang+, “Dense Trajectories and Motion Boundary Descriptors for Action Recognition”, in IJCV2013.
H. Kataoka, “【チュートリアル】動的な人物・物体認識技術 –Dense Trajectories–”, in Slideshare.
http://www.slideshare.net/HirokatsuKataoka/dt-tutorial

アソシエーション分析[Agrawal, SIGMOD1993]
•  頻出の部分集合を抽出
–  Support(支持度)とConfidence(信頼度)という指標を使用
•  BoWの際の設定
n: BoWのベクトル数 (n=5)
X, Y: BoWの非ゼロのベクトル位置(B1, B2 … B10)の集合
(X U Y): XとYをどちらも含む特徴ベクトル (e.g. “(B4 B6) U B9” )
R. Agrawal+, “Mining Association Rules between Sets of Items in Large Databases”, in SIGMOD1993.
n
countYX
support
).( ∪
=
countX
countYX
confidence
.
).( ∪
=

アソシエーション分析の流れ
(“B6”, “B9”)
が頻出要素として抽出
vec no.
Item
vec1
B6, B9
vec2
B6, B9
vec3
B6, B9
vec4
B6, B9
vec5
B4, B6, B9
Item
support
{B4}
1 (20%)
{B6}
5 (100%)
{B9}
5 (100%)
Item
support
{B6}
5
{B9}
5
Bin4はカット
Item
support
{B6, B9}
5 (100%)
組合せを増やしてsupportを計算
B9
B6
B4

Dense Trajectoriesの部分集合
•  密な空間の頻度による分解
–  頻度の低いフロー(e.g. 背景，稀な特徴)は除去される
–  共起性も見ているので意味のある空間(e.g. 手振り)に落としこみやすい
Dense Trajectories
BoW 1
BoW 2
BoW 3
BoW 4
× ×
×
××
×
×
× ××
×
×
×
×
××
××
××
×
×
××
×
×
×
#ofdimension
16000
9792
次元を削減しつつも精度を向上(特徴マイニングの重要性)
密な空間から最小動作単位に分離
(適応的な組み合わせが効果的)
背景領域は除去されている

現在までのアプローチ
Time-series
事後解析
Event detection
(Action tag : Ai)
It’s too late!!
しかし，今までのアプローチはほとんどが事後解析

これからのアプローチ
Time-series
Event prediction
(Prediction tag : Pi)
Activity prediction and it’s prevented
事前予測
一方，事前に情報を察知しないと阻止できない場面がある

行動予測の課題
- Action sequence
“Walk” => “Sit” の段階で “Using a PC”を予測
- Time zone (補助的な要素)
Day time
？？？
Daytime
(Time Zone)
Walking
(Previous Activity)
Sitting
(Current Activity)
???
(Next Activity)
xtimezone
xprevious
xcurrent
θ = “Using a PC”
Given
Not given
Time series

•  時系列行動タグ + 要素として時間帯を入力へ
–  時間帯 (Time Zone)
•  “morning”, “day time”, “night”
–  前行動，現行動
•  “walk”, “bend”, “stand”, “sit”…
–  次行動
•  “use a PC”, “read”, “meal”…
•  解析手法
–  Naïve Bayes
行動予測のアプローチ
行動履歴DB

結果
Time Attributes
Estimated Intention
Action
PC (0.82)
Read (0.11)
Predicted activity
Read (1.00)
PC (0.00)
背景に潜む知識の使用により81.0%の精度，最大約20秒先を予測
Freq.
Second
平均約5秒，最大で約20秒の予測

産総研特別研究員 (2015 – 20xx)
•  より高度な人物の行動認識・解析・予測へ
–  所属：産業技術総合研究所コンピュータビジョン研究グループ
–  興味：人物行動解析技術の高いレベルでの拡張
–  テーマ１：行動認識とデータ解析による高度な人物行動解析
•  データベースや解析技術による知識側の強化
•  予測だけに留まらないコンピュータビジョンの拡張
–  テーマ２：3D VisionやDeep CNNによる情報量の追加や高精度化
•  物体情報(3D Vision)の統合による行動領域の拡張
•  Deep Learningによる詳細解析や特徴バリエーションの増加

観測と知識
•  “観測” が “知識”を強くする
•  “知識” が “観測”を強くする
Large scale videos
データ解析(知識)
知識
モデルモデリング 1 :
直立 –…– 調理
モデリング 2 :
歩行 – 座る – 食事
・・・
モデリング N :
・・・
知識モデル
Activity DB
観測
歩行 –「物を落とす」 – 「片付け」 – 座る – 食事
行動認識(観測)
行動
認識
観測から知識強化
蓄積
予測，意図
相違，共起…
比較
drink
sit
walk
モデルと何か違う？

観測と知識，その未来
重大事故の前の行動傾向を検知、見守り、マーケティング、スポーツ、適切なサービ
ス、コミュニケーション、ロボット、健康、産業、セキュリティ、福祉、工場、交通、
ライフログ、防犯、ティーチング、行動推薦、行動統計、行動傾向、地図の意味づけ、
人間と機械の協調作業、心理分析、病気発見、認知症の早期発見、発達障害の分析、
行動シミュレーション、購買行動の分析、サービス行動の分析、旅館の女将の分析、
事故の因果関係、運転行動の解析、職人の解析、暗黙知的動作の解析、暗黙知的動作
の定量化、農作業行動の解析、林業、漁業、日常行動、料理、人間関係の理解、異常
検出、人間とオブジェクトの関係理解、群衆認識、人物間のインタラクション、医療
行動の解析、熟練度の評価、元気さの評価、うつ病の早期発見、性格分析、相性診断、
仕事の相性診断、性格テスト、省エネ、友達ロボット、人を鍛えるロボット、ユーザ
インタフェース、リアルの広告推薦技術、情報推薦、仕事の点数づけ、スキル定量化、
スマートホーム、自動運転、作業最適化、作業手順生成、類似作業検索、類似行動検
索、行動を見て服装選択、行動分類、良かった時の行動を思い出す、活動度の測定、
休養のレコメンド、運動のレコメンド、行動比較、徘徊の検知、人物特定、スマート
家電、加齢判定、メディアアート、災害救助、緊張度の推定、心理状態の分析、共感
は作れる、感動できる行動、痩せる行動、行動の平均、評価を上げる行動、行動のつ
ながりを発見、誤りをゼロにする行動、マナーを教える行動、PDCAサイクルにより再
帰的に行動を良くする、生活の質向上、歩行だけでなく行動により個人認証、発達を
加速させる行動、特定行動の検出、癖の発見、無意識行動の顕在化、危険場所での特
定行動禁止、怪我を防止する行動、リハビリに使える行動認識、基本行動の分類、行
動回数の蓄積による環境理解、行動促進のための行動認識、異常の種類認識、伝え方
と行動、プレゼンの行動認識、行動の文章化、行動の暗号化と解読、行動の自己改善、
行動変化の検出、行動の翻訳、自殺の低減

今後
•  コラボレーションによる研究の深化と応用へ
–  多くの共同研究により知見や技術を拡張させるに至っている
–  企業だけに限らず，大学間の連携も行っている
「観測と知識の相補的な深化」を今後も追求

【SSII2015】人を観る技術の先端的研究

More Related Content

What's hot (20)

Viewers also liked (20)

Similar to 【SSII2015】人を観る技術の先端的研究 (20)

More from Hirokatsu Kataoka (9)

【SSII2015】人を観る技術の先端的研究