SlideShare a Scribd company logo
めざせスカウター!
HoloLensによる特定個人の
顔認識アプリ制作とその課題
ABC2017 Spring
MR/VRトラック(4201 T5)
16:30 ~ 16:55
東京工業大学 情報理工学院 数理計算科学系
岩崎謙汰 高橋良希
目次
• 自己紹介
• 今回作りたかったモノ
• ARとMRの違い、MR開発の難しさ
• Basic idea
• アプリの全体像
• まとめ
自己紹介
• 東京工業大学 M2 岩崎謙汰
• 研究:SNSのグラフサンプリング
• 趣味:電車で30分プログラミング
先週作ったゲーム3本
• Unityエンジニア/クライアント側担当
• AR/MR開発で楽しく暮らしたい
自己紹介
• 東京工業大学 M1 高橋良希
• 研究:分散機械学習
• 趣味:Caffeによる画像認識アプリ開発
Raspberry Piアプリ開発
• サーバー側担当
今回作りたかったモノ
出典 wayohoo.net
スカウター
出典: http://sekkachi.blog.jp/archives/1039744030.html
相手の戦闘力などの情報を
レンズ(?)のUI上に表示する
スカウター作りたい!
と思い立つ。しかし…
出典: http://eiga.com/movie/83224/
オーグマーすげー!
超かっこいい!作りたい!
めざせスカウター!
HoloLensによる特定個人の
顔認識アプリ制作とその課題
東京工業大学 情報理工学院 数理計算科学系
岩崎謙汰 高橋良希
オーグマー!
ABC2017 Spring
MR/VRトラック(4201 T5)
16:30 ~ 16:55
人の頭上に名前を表示する
アプリを制作する
目標
出典: http://www.matolabel.net/archives/68231429.html
出典 http://anicul.jp/saogekijyouos/
人の頭上に
名前を表示
リアルと関連づいた3D空間上に配置する
人の頭上に名前を表示する
アプリを制作する
今回のポイント
3D空間上に配置する2DのUI上ではなく
ARとMR
今回こっち!
3D空間に仮想オブジェクトを配置する方法
• ARマーカーを使用する (Vuforiaなど)
→ 人間の顔をマーカーにするのは難しい
• 仮想空間上に現実と同じ部屋&物のモデルを配置する
→ めちゃくちゃ大変 & 汎用性が低い
• HoloLensのジェスチャーで配置する
→ 実際コレが多い気がする、しかし今回は自動でやりたい
• GPSから場所を推定する
→ 全ての人間/物体がGPSを持っているわけでは…
3D空間に仮想オブジェクトを配置する方法
• ARマーカーを使用する (Vuforiaなど)
→ 人間の顔をマーカーにするのは難しい
• 仮想空間上に現実と同じ部屋&物のモデルを配置する
→ めちゃくちゃ大変 & 汎用性が低い
• HoloLensのジェスチャーで配置する
→ 実際コレが多い気がする、しかし自動でやりたい
• GPSから場所を推定する
→ 全ての人間/物体がGPSを持っているわけでは…
意外と難しい!
なぜ難しい? HoloLensが見ている世界
2D (画像) 3D
解析のしやすさ 解析しやすい 当たり判定のみ
奥行きの判定 わかりにくい わかる
どちらも見ている
人間どれ?
どれくらい
遠くにいる?
噛み合せ
たい!
解決策: 顔の中心の座標に向けてRayを飛ばす
出典: http://tsubakit1.hateblo.jp/entry/2017/02/22/230100
画像解析でクラス名と
顔の中心の座標を取得
Ex)クラス名: yoshiki
顔の中心の標: (600,300)
顔の中心の座標へ
Rayを飛ばす
この衝突点は
yoshikiだとわかる
yoshiki
デモ
考察
• 概ね、頭の上に移動しようとしている…?
• 認識できるのは研究室メンバーのみだが、
顔認識の精度は改善の余地あり。
• 被写体が動くと頭の上から外れやすい。
• もっとなめらかに動かしたいが、
これ以上早くしようとするとアプリが落ちる。
(現在 HTTP通信とSpatialMappingの更新頻度を
1秒に1回にしている)
アプリの全体像
HoloLens 被写体
① Webカメラから
画像を取得
サーバー
③ OpenCVで顔の中心の座標の取得
④ Deep Learningによる識別
⑥ 顔の中心の座標に
Rayを飛ばし、
頭上の座標を推定
⑦ 3D空間上にラベルを表示
出典: http://tsubakit1.hateblo.jp/entry/2017/02/22/230100
yoshiki
HoloLensから画像をサーバーに送る
• HoloLens側は画像撮って送って返ってきた情報を載せ
るだけにしたい!
• WebCameraから画像を取得する
• HTTP通信で画像をサーバーに送る
↑普段のUnityの書き方と同じ
↓HoloLens特有設定
• Capabilitiesチェックを忘れない
学習用研究室メンバの画像収集
学生室
枚
数
研究室メンバ
205枚タグ付け
Raspberry Pi
による自動収集
ん?少ない人がいるぞ?
バックエンド処理
人間がタグ付け
学習済みモデル
HTTP通信
画像出典:https://www.raspberrypi.org/, https://www.microsoft.com/ja-jp/hololens
学習
アプリケーション
名前
確率
Deep Learning
による識別
OpenCVによる顔検出
(顔の中心座標計算)
座標
Caffe
学習
205枚x
6クラス
820枚x
6クラス
Neural Network (Alex net)
Pre-trained
Network
回転・ぼかしに
よる増強
精度変化
まとめ
• 人の頭の上に研究室メンバーの名前を表示するアプリを
制作した。
• MR開発で大事なこと
→リアル世界の認知と3D空間上の配置をどう組み立てるか
• ハードウェアの進歩が先か、エンジニアのアイデアが先か
• MR開発これからも楽しんでいきたいです!
補足説明
• 今回使用した技術など
• HoloLens開発: Windows10, Unity5.6.0
• サーバーサイド: Python
• DeepLearnig: Caffe

More Related Content

PDF
【Unity道場 建築スペシャル2】点群ビジュアライゼーション
PDF
HoloLens で OpenCV をどう使うか レーザーポインター 認識で試してみた
PDF
ORB-SLAMを動かしてみた
PDF
2020年8月_HoloLens 2 アプリ開発入門
PDF
オープンソース SLAM の分類
PDF
「ユニティちゃんを踊らせよう!」モーションキャプチャーデータのアニメーション演出
PPTX
ARマーカーを利用したHoloLens同士の位置合わせ
PDF
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
【Unity道場 建築スペシャル2】点群ビジュアライゼーション
HoloLens で OpenCV をどう使うか レーザーポインター 認識で試してみた
ORB-SLAMを動かしてみた
2020年8月_HoloLens 2 アプリ開発入門
オープンソース SLAM の分類
「ユニティちゃんを踊らせよう!」モーションキャプチャーデータのアニメーション演出
ARマーカーを利用したHoloLens同士の位置合わせ
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~

What's hot (20)

PDF
はじめようARCore:自己位置推定・平面検出・FaceTracking
PPTX
First step of UX Monitoring 〜UXモニタリングこと始め〜
PDF
見やすいプレゼン資料の作り方 - リニューアル増量版
PDF
Hubsカスタマイズ 行動ログ取得やバックエンドの話
PDF
ROS を用いた自律移動ロボットのシステム構築
PPTX
久しぶりにMicrosoft Meshを使ってみた - 色々変わってたよ編 -
PDF
UnityとVuforiaで始めるAR開発
PPTX
タクシーxAIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについて [SRE NEXT 2020]
PDF
AbemaTVにおける推薦システム
PPTX
ORB-SLAMの手法解説
PDF
SSII2019TS: プロジェクタ・カメラシステムが変わる! ~時間同期の制御で広がる応用~
PPTX
HoloLensで音声認識をする方法を色々試してみた
PDF
20180527 ORB SLAM Code Reading
PDF
ChatGPTは思ったほど賢くない
PDF
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
PDF
Visual slam
PDF
ノンプログラミングで始める AR 開発入門
PDF
Cv勉強会cvpr2018読み会: Im2Flow: Motion Hallucination from Static Images for Action...
PDF
LiDAR点群と画像とのマッピング
PDF
LiDARとSensor Fusion
はじめようARCore:自己位置推定・平面検出・FaceTracking
First step of UX Monitoring 〜UXモニタリングこと始め〜
見やすいプレゼン資料の作り方 - リニューアル増量版
Hubsカスタマイズ 行動ログ取得やバックエンドの話
ROS を用いた自律移動ロボットのシステム構築
久しぶりにMicrosoft Meshを使ってみた - 色々変わってたよ編 -
UnityとVuforiaで始めるAR開発
タクシーxAIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについて [SRE NEXT 2020]
AbemaTVにおける推薦システム
ORB-SLAMの手法解説
SSII2019TS: プロジェクタ・カメラシステムが変わる! ~時間同期の制御で広がる応用~
HoloLensで音声認識をする方法を色々試してみた
20180527 ORB SLAM Code Reading
ChatGPTは思ったほど賢くない
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
Visual slam
ノンプログラミングで始める AR 開発入門
Cv勉強会cvpr2018読み会: Im2Flow: Motion Hallucination from Static Images for Action...
LiDAR点群と画像とのマッピング
LiDARとSensor Fusion
Ad

Similar to めざせスカウター! HoloLensによる特定個人の 顔認識アプリ制作とその課題 (11)

PDF
20120623 cv勉強会 shirasy
PDF
Open Campus 20170820
PDF
【試⾏錯誤】スマホデザインプロセス のHoloLensへの適⽤
PPTX
AI x WebAR MediaPipeの顔認識を使ってみよう! in 織りなすラボ
PPTX
AI x WebAR! MediaPipeの顔認識を使ってみよう!
PDF
手乗りちょまぎょアプリ開発で学ぶ MRTK 入門 (MRTK 2.5 対応)
PDF
AR/VR seminar
PPTX
初めてのHoloLensアプリ開発~de:code 2018までの挫折と成功
PDF
HoloLab_20191016_ceatec
PPTX
HoloLens Meetup vol.4 俺達が作るべきMR
PPTX
Ismar2014 report
20120623 cv勉強会 shirasy
Open Campus 20170820
【試⾏錯誤】スマホデザインプロセス のHoloLensへの適⽤
AI x WebAR MediaPipeの顔認識を使ってみよう! in 織りなすラボ
AI x WebAR! MediaPipeの顔認識を使ってみよう!
手乗りちょまぎょアプリ開発で学ぶ MRTK 入門 (MRTK 2.5 対応)
AR/VR seminar
初めてのHoloLensアプリ開発~de:code 2018までの挫折と成功
HoloLab_20191016_ceatec
HoloLens Meetup vol.4 俺達が作るべきMR
Ismar2014 report
Ad

めざせスカウター! HoloLensによる特定個人の 顔認識アプリ制作とその課題

Editor's Notes

  • #5: 同じく....高橋と申します. 大学の研究内容は...ですが,今回スカウター作成では深層学習で顔認識をするバックエンド側の開発を行いました.これまでにもCaffeを使った画像認識webクローラを作ったり,ラズパイとウェブカメラを組み合わせた画像収集や画像処理をおこなったりしています.
  • #26: 深層学習ではまず学習する画像データ集めます.ラズパイとウェブカメラを組み合わせて