SlideShare a Scribd company logo
3次元タスクにおけるディープラーニングの
最新動向② MDL for RGB-D 	
2016/7/30
株式会社ウェブファーマー
大政 孝充
今回取り上げるのはこれ	
[1]A. Eitel, et al.”Multimodal Deep Learning for Robust
RGB-D Object Recognition”, arXiv:1057.06821v2, 2015
CNNを使った教師あり手法でRGB-Dデータから物体認識
を行った!
ポイントは3つ	
①  モデルの構造は、RGB streamとDepth streamに分け、
上位層でこれらを合体させる
②  深さ情報はカラー化して入力する
③  深さ情報に独自のdata augmentationを行う
ポイント① モデルの構造	
色情報を畳み込むRGB streamと深さ情報を畳み込むdepth streamが
あり、上位層で合体する
RGB stream
[1]のFigure 1よりdepth stream
学習の流れ(1)	
CaffeNet学習済みモデルのパラメータをコピペする
CaffeNet
学習の流れ(2)	
入力画像XとラベルYで教師あり学習させる
X
Y
min
W I
,θI
L soft max W I
gI
di
;θI
( )( ), yi
( )i=1
N
∑
学習の流れ(3)	
depth stream側も同様にCaffeNetのコピペと学習を行う
D Y
min
W D
,θD
L soft max W D
gD
di
;θD
( )( ), yi
( )i=1
N
∑
学習の流れ(4)	
それぞれのstreamから出力層を取り除く
D
X
学習の流れ(5)	
上位層に両者を合体させる層を設ける
D
X
学習の流れ(6)	
目標値Yで上位層の部分だけ教師あり学習させる
D
X
Y
min
W f
,θD
,θI
,θF
L soft max W f
f gI
,gD⎡⎣ ⎤⎦;θF
( )( ), yi
( )i=1
N
∑
学習させるのは
ここだけ
ポイント② 深さ情報はカラー化する	
近い場所から遠くなるに連れて、赤〜緑〜青とする
この画像の深さは こうなる
遠い近い
ポイント③ 独自のaugmentation	
1)  使える深さ情報のdata数が少ない
2)  実際に機器(kinectなど)から得られる深さ情報は
ノイズが多い
独自のaugmentationで解決
深さ情報dataに関して2つの問題点がある
独自のaugmentation(1)	
ノイズパターンをどっかからK個引っ張ってくる
Ρ= Ρ1,!, ΡK{ }
Ρ1 ΡK
!
独自のaugmentation(2)	
50%の確率でノイズを含める
di
=
di
Ρk !di
⎧
⎨
⎪
⎩⎪
if
else
p =1
with
p ~ Β 0.5{ }
k ~U 1,K{ }
○:アダマール積
B:ベルヌーイ分布
U:離散一様分布
ノイズを含
めない場合
結果	
state-of-the-artsな結果となった

More Related Content

PPTX
[DL輪読会]PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metr...
PDF
三次元点群を取り扱うニューラルネットワークのサーベイ
PDF
【CVPR 2020 メタサーベイ】3D From Multiview and Sensors
PDF
Point net
PDF
"Spectral graph reduction for efficient image and streaming video segmentatio...
PDF
IR Reading fall Atsuki Maruta
PDF
【CVPR 2019】Do Better ImageNet Models Transfer Better?
PPTX
【輪読会】Braxlines: Fast and Interactive Toolkit for RL-driven Behavior Engineeri...
[DL輪読会]PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metr...
三次元点群を取り扱うニューラルネットワークのサーベイ
【CVPR 2020 メタサーベイ】3D From Multiview and Sensors
Point net
"Spectral graph reduction for efficient image and streaming video segmentatio...
IR Reading fall Atsuki Maruta
【CVPR 2019】Do Better ImageNet Models Transfer Better?
【輪読会】Braxlines: Fast and Interactive Toolkit for RL-driven Behavior Engineeri...

What's hot (14)

PPTX
【DL輪読会】Data-Efficient Reinforcement Learning with Self-Predictive Representat...
PDF
[DL輪読会]Learning Task Informed Abstractions
PPTX
20190509 gnn public
PPTX
Knowledge_graph_alignment_with_entity-pair_embedding
PDF
ElectraとpQRNNについて
PDF
Deep residual learning for image recognition
PPTX
[DL輪読会]EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
PDF
ABC 2016Spring 講演資料
PDF
【ECCV 2018】Zero-Shot Deep Domain Adaptation
PPTX
Combinatorial optimization with graph convolutional networks and guided
PPTX
Combinatorial optimization with graph convolutional networks and guided ver20...
PPTX
[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination
PDF
【DL輪読会】Where do Models go Wrong? Parameter-Space Saliency Maps for Explainabi...
PDF
Dataset cartography mapping and diagnosing datasets with training dynamics
【DL輪読会】Data-Efficient Reinforcement Learning with Self-Predictive Representat...
[DL輪読会]Learning Task Informed Abstractions
20190509 gnn public
Knowledge_graph_alignment_with_entity-pair_embedding
ElectraとpQRNNについて
Deep residual learning for image recognition
[DL輪読会]EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
ABC 2016Spring 講演資料
【ECCV 2018】Zero-Shot Deep Domain Adaptation
Combinatorial optimization with graph convolutional networks and guided
Combinatorial optimization with graph convolutional networks and guided ver20...
[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination
【DL輪読会】Where do Models go Wrong? Parameter-Space Saliency Maps for Explainabi...
Dataset cartography mapping and diagnosing datasets with training dynamics
Ad

Viewers also liked (17)

PDF
Introduction to YOLO detection model
PDF
ディープラーニング・ハンズオン勉強会161229
PDF
Connect_GANs_Actor-Critic
PDF
数学的帰納法は帰納ではない?
PDF
The introduction to FRMQN model
PDF
Introduction to Neural Turning Machine
PDF
動作認識におけるディープラーニングの最新動向2Sequential DL for HAR
PPTX
岡谷貴之「深層学習」の解説
PDF
Introduction to Deep Compression
PDF
3次元タスクにおけるディープラーニングの最新動向1DeepStereo
PDF
BLUE*アルゴリズム
PDF
Introduction to Prioritized Experience Replay
PDF
IoTとDeep Learningで自宅警備員を育ててみる
PDF
動作認識におけるディープラーニングの最新動向1 3D-CNN
PDF
introduction to Dueling network
PDF
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
PDF
最近のDeep Learning (NLP) 界隈におけるAttention事情
Introduction to YOLO detection model
ディープラーニング・ハンズオン勉強会161229
Connect_GANs_Actor-Critic
数学的帰納法は帰納ではない?
The introduction to FRMQN model
Introduction to Neural Turning Machine
動作認識におけるディープラーニングの最新動向2Sequential DL for HAR
岡谷貴之「深層学習」の解説
Introduction to Deep Compression
3次元タスクにおけるディープラーニングの最新動向1DeepStereo
BLUE*アルゴリズム
Introduction to Prioritized Experience Replay
IoTとDeep Learningで自宅警備員を育ててみる
動作認識におけるディープラーニングの最新動向1 3D-CNN
introduction to Dueling network
Deep learning を用いた画像から説明文の自動生成に関する研究の紹介
最近のDeep Learning (NLP) 界隈におけるAttention事情
Ad

Similar to introduce to Multimodal Deep Learning for Robust RGB-D Object Recognition (20)

PDF
GTC 2016 ディープラーニング最新情報
PDF
FastDepth: Fast Monocular Depth Estimation on Embedded Systems
PDF
[DL輪読会]Stereo Magnification: Learning view synthesis using multiplane images, +α
PPTX
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
PDF
先端技術とメディア表現 第4回レポートまとめ
PDF
【2015.07】(1/2)cvpaper.challenge@CVPR2015
PDF
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
PPTX
Soft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
PDF
第126回 ロボット工学セミナー 三次元点群と深層学習
PDF
三次元表現まとめ(深層学習を中心に)
PPTX
20190831 3 d_inaba_final
PDF
論文紹介:DF-Net: Unsupervised Joint Learning of Depth and Flow using Cross-Networ...
PDF
[DL輪読会]Unsupervised Learning of 3D Structure from Images
PDF
R-CNNの原理とここ数年の流れ
PPTX
[DL輪読会]Deep Face Recognition: A Survey
PPTX
3 d object recognition
PPTX
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
PDF
(2021年8月版)深層学習によるImage Classificaitonの発展
PDF
深層学習の新しい応用と、 それを支える計算機の進化 - Preferred Networks CEO 西川徹 (SEMICON Japan 2022 Ke...
PDF
GTC 2018 で発表されたディープラーニング最新情報
GTC 2016 ディープラーニング最新情報
FastDepth: Fast Monocular Depth Estimation on Embedded Systems
[DL輪読会]Stereo Magnification: Learning view synthesis using multiplane images, +α
[DL輪読会]Depth Prediction Without the Sensors: Leveraging Structure for Unsuper...
先端技術とメディア表現 第4回レポートまとめ
【2015.07】(1/2)cvpaper.challenge@CVPR2015
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
Soft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
第126回 ロボット工学セミナー 三次元点群と深層学習
三次元表現まとめ(深層学習を中心に)
20190831 3 d_inaba_final
論文紹介:DF-Net: Unsupervised Joint Learning of Depth and Flow using Cross-Networ...
[DL輪読会]Unsupervised Learning of 3D Structure from Images
R-CNNの原理とここ数年の流れ
[DL輪読会]Deep Face Recognition: A Survey
3 d object recognition
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
(2021年8月版)深層学習によるImage Classificaitonの発展
深層学習の新しい応用と、 それを支える計算機の進化 - Preferred Networks CEO 西川徹 (SEMICON Japan 2022 Ke...
GTC 2018 で発表されたディープラーニング最新情報

More from WEBFARMER. ltd. (19)

PDF
2024/8/3 LINEヤフーにて開催 cv勉強会@関東_大政孝充資料.pdf
PPTX
論文読み会 発表資料 SPMモデル
PPTX
The 53th Computer Vision Study@ kantou by Takamitsu Omasa
PPTX
SPIGAN理論と実装について at 論文LT会 in LPIXEL
PDF
Nips2018 study only_pu_net_pdf
PDF
第46回コンピュータ・ビジョン勉強会@関東(前編)
PDF
Chainer Meetup 発表資料
PDF
SLAM_study_document
PDF
Study Group of NIPS2017 presented by webfarmer.ltd
PDF
Nips20180127
PDF
Machine Learning 15minutes 発表資料(株)ウェブファーマー
PDF
DRL_stydy_1_doc_ohmasa
PPTX
Ml15min発表資料(提出用)
PDF
Introduction to GAN model
PDF
Introduction to A3C model
PDF
人工知能ハッカソン用プレゼン資料(161217)
PDF
Hackathon 161010 pressen
PDF
introduction to double deep Q-learning
PDF
introduction to Deep Q Learning
2024/8/3 LINEヤフーにて開催 cv勉強会@関東_大政孝充資料.pdf
論文読み会 発表資料 SPMモデル
The 53th Computer Vision Study@ kantou by Takamitsu Omasa
SPIGAN理論と実装について at 論文LT会 in LPIXEL
Nips2018 study only_pu_net_pdf
第46回コンピュータ・ビジョン勉強会@関東(前編)
Chainer Meetup 発表資料
SLAM_study_document
Study Group of NIPS2017 presented by webfarmer.ltd
Nips20180127
Machine Learning 15minutes 発表資料(株)ウェブファーマー
DRL_stydy_1_doc_ohmasa
Ml15min発表資料(提出用)
Introduction to GAN model
Introduction to A3C model
人工知能ハッカソン用プレゼン資料(161217)
Hackathon 161010 pressen
introduction to double deep Q-learning
introduction to Deep Q Learning

Recently uploaded (10)

PDF
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
PDF
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
PDF
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
PDF
細胞培養用バイオリアクターおよび発酵槽市場規模の成長見通し:2031年には2823百万米ドルに到達へ
PDF
Qlik TECH TALK セミナー:What's New In Qlik ~ 2025年7月リリース最新機能のご紹介
PDF
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
PDF
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
PDF
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
PDF
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
PDF
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
細胞培養用バイオリアクターおよび発酵槽市場規模の成長見通し:2031年には2823百万米ドルに到達へ
Qlik TECH TALK セミナー:What's New In Qlik ~ 2025年7月リリース最新機能のご紹介
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略

introduce to Multimodal Deep Learning for Robust RGB-D Object Recognition