SlideShare a Scribd company logo
Copyright © 2019 Morpho, Inc. All Rights Reserved.
Non-Local Spatial Propagation
Network for
Depth Completion
<文献紹介>
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
概要
RGB画像とsparse depth mapからdense depth mapを直接推論
同時に出力した3枚の特徴マップでrefinement
の2段階構成をend-to-endに学習する
• 各ピクセルの「近傍系」を選択的に学習
• Refinement時の重みの無駄な正規化を抑制
• Confidenceのrefinementへの組み込み
により11月現在おそらく最高性能を達成(2020/7/20に投稿)
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
結果
エッジ保存性が従来手法に比べて比較的良い
細い線などの細かいテクスチャも取れている
Non-Local Spatial Propagation
([1] Fig.6.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
結果
Non-Local Spatial Propagation
([1] Table 1.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
全体像は
初期depth推定 ⇒ Refinement
の2段構成
Non-Local Spatial Propagation
([1] Fig.2.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下3つのポイントを順に解説する
1. 各ピクセルの「近傍系」を選択的に学習
2. Refinement時の重みの無駄な正規化を抑制
3. Confidenceのrefinementへの組み込み
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下3つのポイントを順に解説する
1. 各ピクセルの「近傍系」を選択的に学習
2. Refinement時の重みの無駄な正規化を抑制
3. Confidenceのrefinementへの組み込み
が、その前にrefinementについて先に概説する
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
Refinementは下式を繰り返し適用することで行われる:
Non-Local Spatial Propagation
• 𝑥 𝑚,𝑛:depth mapの(m, n)座標におけるdepth値
• 𝑤 𝑚,𝑛
𝑖,𝑗
:ピクセル𝑥𝑖,𝑗 が𝑥 𝑚,𝑛にもたらす重み
• 𝑁 𝑚,𝑛:座標(m, n)の近傍
で、𝑤 𝑚,𝑛 + σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛
𝑤 𝑚,𝑛
𝑖,𝑗
= 1 とする。𝑡はイテレータ
Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑥 𝑚,𝑛
𝑡
= 𝑤 𝑚,𝑛
𝑐
𝑥 𝑚,𝑛
𝑡−1
෍
𝑖,𝑗 ∈𝑁 𝑚,𝑛
𝑤 𝑚,𝑛
𝑖,𝑗
𝑥𝑖,𝑗
𝑡−1
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
Refinementは下式を繰り返し適用することで行われる:
Non-Local Spatial Propagation
• 𝑥 𝑚,𝑛:depth mapの(m, n)座標におけるdepth値
• 𝑤 𝑚,𝑛
𝑖,𝑗
:ピクセル𝑥𝑖,𝑗 が𝑥 𝑚,𝑛にもたらす重み
• 𝑁 𝑚,𝑛:座標(m, n)の近傍
で、𝑤 𝑚,𝑛 + σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛
𝑤 𝑚,𝑛
𝑖,𝑗
= 1 とする。𝑡はイテレータ。
この2つをrefinement前に
学習で求める
Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑥 𝑚,𝑛
𝑡
= 𝑤 𝑚,𝑛
𝑐
𝑥 𝑚,𝑛
𝑡−1
෍
𝑖,𝑗 ∈𝑁 𝑚,𝑛
𝑤 𝑚,𝑛
𝑖,𝑗
𝑥𝑖,𝑗
𝑡−1
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下3つのポイントを順に解説する
1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 )
2. Refinement時の重みの無駄な正規化を抑制( 𝑤 𝑚,𝑛
𝑖,𝑗
)
3. Confidenceのrefinementへの組み込み
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
従来のrefinement手法では近傍画素の配置を固定にすると
境界付近で不要なピクセル情報を拾ってしまう
Non-Local Spatial Propagation
([1] Fig.3.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
従来のrefinement手法では近傍画素の配置を固定にすると
境界付近で不要なピクセル情報を拾ってしまう
そこで、近傍系の形を適応的に変形することを考える
Non-Local Spatial Propagation
([1] Fig.3.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
座標(m, n)の近傍は以下で定める:
Non-Local Spatial Propagation
φをパラメータとする「(m, n)
のK個の近傍」を返す関数
これを学習により求める
注目すべき点として、p, qは実数値
→サブピクセル精度で近傍探索が行われる!
Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑁 𝑚,𝑛
𝑁𝐿
= {𝑥 𝑚+𝑝,𝑛+𝑞| 𝑝, 𝑞 ∈ 𝑓φ 𝑰, 𝑫, 𝑚, 𝑛 , 𝑝, 𝑞 ∈ 𝑹}
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下近傍を8個にした場合
カラー画像のエッジをうまく
とらえている
Non-Local Spatial Propagation
([1] Fig.8.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
実はCNNの場合には元ネタが存在([2], [3])
• Deformable Convolutional Networks
• Deformable ConvNets v2: More Deformable, Better Results
(上の論文のインターン生による改良版)
これら2つの論文では、convolutionのカーネルの形を動的に変
形(長方形でなく)することで物体形状の変化にロバストに対
応させることを提案している
これをカーネルではなくrefinementに援用したのがミソ
Non-Local Spatial Propagation
([2] Fig.1.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
実際に𝑓𝜑がどう定義されるかの記述は存在しなかったが、
前述の論文を見る限りおそらく次の通り
Non-Local Spatial Propagation
Inputの注目画素
(m,n)を中心に
普通のconv.を
2N枚かける
2枚かけるごとに(m,n)の
近傍としてoffset vector
(p,q)が1つ定まる
得られたN個の近
傍でrefinementを
実行
([2] Fig.2.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下3つのポイントを順に解説する
1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 )
2. Refinement時の重みの無駄な正規化を抑制( 𝒘 𝒎,𝒏
𝒊,𝒋
)
3. Confidenceのrefinementへの組み込み
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
Refinement時の重みについて以下の事実が知られている
([4] Theorem 3)
⚫ Refinementが収束する十分条件は
σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛
|𝑤 𝑚,𝑛
𝑖,𝑗
| ≤ 1
ここでrefinementの式を思い出しておく
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑥 𝑚,𝑛
𝑡
= 𝑤 𝑚,𝑛
𝑐
𝑥 𝑚,𝑛
𝑡−1
෍
𝑖,𝑗 ∈𝑁 𝑚,𝑛
𝑤 𝑚,𝑛
𝑖,𝑗
𝑥𝑖,𝑗
𝑡−1
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
なので|𝑤 𝑚,𝑛
𝑖,𝑗
|の合計が1を上回る場合には正規化処理が必要
しかし単純に以下のように合計値で割るのは問題がある
𝑤 𝑚,𝑛
𝑖,𝑗
=
ෝ𝑤 𝑚,𝑛
𝑖,𝑗
σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛
|ෝ𝑤 𝑚,𝑛
𝑖,𝑗
|
𝑁 𝑚,𝑛 = 2としてその理由を示す
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑥 𝑚,𝑛
𝑡
= 𝑤 𝑚,𝑛
𝑐
𝑥 𝑚,𝑛
𝑡−1
෍
𝑖,𝑗 ∈𝑁 𝑚,𝑛
𝑤 𝑚,𝑛
𝑖,𝑗
𝑥𝑖,𝑗
𝑡−1
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
𝑤1, 𝑤2 の𝐿1
ノルムによる正規化した結果を図示すると、
このように枠線上に 𝑤1, 𝑤2 が集中してしまい
𝑤1, 𝑤2の自由度(=モデルの表現力)が減ってしまう
Non-Local Spatial Propagation
( [1] Fig.4.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
では𝐿1
ノルムが1を超えた時だけ正規化したらどうなのか?
→これも実は失敗する
正規化が発生する頻度がどの程度かを考えればよいが、
𝑤1, 𝑤2が独立に標準正規分布に従うとして同じく図示すると、
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
大半が正規化されて端に寄っている
もし4変数にすると、98%が端に位置する
Non-Local Spatial Propagation
( [1] Fig.4.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
正規化しても自由度が減らないようスケール変換したい
→本論文では以下で解決
ここでKは変数の個数
これならσ 𝑖,𝑗 ∈𝑁 𝑚,𝑛
|𝑤 𝑚,𝑛
𝑖,𝑗
| ≤ 1
は常に成立するが果たして自由度は?
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑤 𝑚,𝑛
𝑖,𝑗
= tanh(ෝ𝑤 𝑚,𝑛
𝑖,𝑗
)/𝐶 , 𝐶 ≥ 𝐾
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
正規化後も端に寄りにくくなっている
すなわち、この方がモデルの表現力が高い
Non-Local Spatial Propagation
( [1] Fig.4.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
そこで σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛
|𝑤 𝑚,𝑛
𝑖,𝑗
| が1を超えたときのみtanhによる正規
化を行うことで表現力をできる限り高める
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
そこで σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛
|𝑤 𝑚,𝑛
𝑖,𝑗
| が1を超えたときのみtanhによる正規
化を行うことで表現力をできる限り高める
結果:
Non-Local Spatial Propagation
( [1] Fig.4.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
一覧すると以下の通り
右端のグラフは 𝑤1,, 𝑤2 を複数生成したときに
正規化されるものの割合を示したもの
(青が単純な割り算、黄がtanhを使う方法)
Non-Local Spatial Propagation
( [1] Fig.4.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
ところでtanhを使う場合には
よりCを決める必要があった
→Cも学習で自動的に決定されるようにする
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑤 𝑚,𝑛
𝑖,𝑗
= tanh(ෝ𝑤 𝑚,𝑛
𝑖,𝑗
)/𝐶
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下3つのポイントを順に解説する。
1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 )
2. Refinement時の重みの無駄な正規化を抑制( 𝑤 𝑚,𝑛
𝑖,𝑗
)
3. Confidenceのrefinementへの組み込み
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
考察1,2では入力depthの誤測定が加味できていない
そこでinitial depth mapと同時にconfidence mapも推論させる
Non-Local Spatial Propagation
( [1] Fig.5.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
取得したconfidence、𝑐 𝑖,𝑗
∈ [0, 1]はrefinement時の重み𝑤 𝑚,𝑛
𝑖,𝑗
を
弱めるのに用いる
Non-Local Spatial Propagation
( [1] Fig.5.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
𝑤 𝑚,𝑛
𝑖,𝑗
= 𝑐 𝑖,𝑗
⋅ tanh(ෝ𝑤 𝑚,𝑛
𝑖,𝑗
)/𝛾
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下confidenceありなしで結果を比較
Depthの誤測定が修正されているのが分かる
Non-Local Spatial Propagation
( [1] Fig.5.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
以下3つのポイントを順に解説する
1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 )
2. Refinement時の重みの無駄な正規化を抑制( 𝑤 𝑚,𝑛
𝑖,𝑗
)
3. Confidenceのrefinementへの組み込み
Non-Local Spatial Propagation
最後に実際のネットワーク構造を確認する
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
Non-Local Spatial Propagation
( [1] Fig.A.)
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
手法
ロスは単純に入力時点でdepthが観測されたピクセルの集合
Vに対して
ここでρ = 1,2のどちらでもよいが、ρ = 1の方が一般に
エッジのキレが良いらしい
その他の中間出力に対してロスは定めない(データ取得が困難)
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
考察
⚫ Initial estimation → refinementは効果が出る
⚫ Deformable convolutionがエッジ保存の肝か
⚫ Weight normalizationの効果は如何ほどか疑問
⚫ Confidence mapが実測できている場合には、ロスに組み込
めばさらに精度向上する?(スケール合わせが問題?)
正規化の定数Cは学習データの傾向によって変動する模様
使う環境が不定の場合は中々最適に決まらなそう
入力がearly fusionなのは改善の余地ありか?
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
著者実装:https://github.com/zzangjinsun/NLSPN_ECCV20
Non-Local Spatial Propagation
( [1] Fig.D.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
Copyright © 2019 Morpho, Inc. All Rights Reserved.
参考文献
[1] J. Park, K. Joo, Z. Hu, C.-K. Liu, and I. S. Kweon.: Nonlocal spatial propagation network for depth
completion. In: Proc. Of European Conference on Computer Vision (ECCV), 2020
[2] J. Dai, H. Qi, Y. Xiong, Y. Li, G. Zhang, H. Hu, and Y. Wei. Deformable convolutional networks. In
ICCV, 2017.
[3] Zhu, X., Hu, H., Lin, S., & Dai, J. (2019). Deformable convnets V2: More deformable, better results.
Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition,
2019-June, 9300–9308. https://doi.org/10.1109/CVPR.2019.00953
[4] Liu, S., De Mello, S., Gu, J., Zhong, G., Yang, M.H., Kautz, J.: Learning affinity via spatial
propagation networks. In: Proc. of Advances in Neural Information Processing Systems (2017)
Non-Local Spatial Propagation
Copyright © 2020 Morpho, Inc. All Rights Reserved.

More Related Content

PDF
Action Recognitionの歴史と最新動向
PPTX
SfM Learner系単眼深度推定手法について
PPTX
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
PPTX
近年のHierarchical Vision Transformer
PDF
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
PDF
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
PPTX
【DL輪読会】Contrastive Learning as Goal-Conditioned Reinforcement Learning
PDF
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
Action Recognitionの歴史と最新動向
SfM Learner系単眼深度推定手法について
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
近年のHierarchical Vision Transformer
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
【DL輪読会】Contrastive Learning as Goal-Conditioned Reinforcement Learning
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~

What's hot (20)

PPTX
[DL輪読会]Pay Attention to MLPs (gMLP)
PPTX
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
PDF
最近のDeep Learning (NLP) 界隈におけるAttention事情
PPTX
[DL輪読会]GQNと関連研究,世界モデルとの関係について
PDF
Anomaly detection 系の論文を一言でまとめた
PPTX
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
PPTX
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
PDF
SSII2022 [OS3-02] Federated Learningの基礎と応用
PDF
【DL輪読会】Motion Policy Networks
PPTX
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
PDF
3D CNNによる人物行動認識の動向
PDF
Cvpr 2021 manydepth
PDF
【メタサーベイ】Neural Fields
PDF
[DL輪読会]ICLR2020の分布外検知速報
PDF
動画認識サーベイv1(メタサーベイ )
PDF
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
PDF
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
PDF
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
PPTX
これからの Vision & Language ~ Acadexit した4つの理由
PPTX
報酬設計と逆強化学習
[DL輪読会]Pay Attention to MLPs (gMLP)
Depth from Videos in the Wild: Unsupervised Monocular Depth Learning from Unk...
最近のDeep Learning (NLP) 界隈におけるAttention事情
[DL輪読会]GQNと関連研究,世界モデルとの関係について
Anomaly detection 系の論文を一言でまとめた
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
SSII2022 [OS3-02] Federated Learningの基礎と応用
【DL輪読会】Motion Policy Networks
[DL輪読会]Vision Transformer with Deformable Attention (Deformable Attention Tra...
3D CNNによる人物行動認識の動向
Cvpr 2021 manydepth
【メタサーベイ】Neural Fields
[DL輪読会]ICLR2020の分布外検知速報
動画認識サーベイv1(メタサーベイ )
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
[DL輪読会]NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis
これからの Vision & Language ~ Acadexit した4つの理由
報酬設計と逆強化学習
Ad

Similar to (文献紹介)Depth Completionの最新動向 (20)

PDF
【2015.07】(2/2)cvpaper.challenge@CVPR2015
PDF
点群深層学習 Meta-study
PDF
CVPR2019読み会 "A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruc...
PDF
点群SegmentationのためのTransformerサーベイ
PDF
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
PDF
MIRU2016 チュートリアル
PDF
ConditionalPointDiffusion.pdf
PDF
Opencv object detection_takmin
PPTX
Direct Sparse Odometryの解説
PDF
慣性センサーログの効果的な可視化と分類
PPTX
Image net classification with Deep Convolutional Neural Networks
PDF
[DL輪読会]Geometric Unsupervised Domain Adaptation for Semantic Segmentation
PPTX
AGA_CVPR2017
PPTX
Soft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
PDF
20200704 bsp net
PDF
信号処理・画像処理における凸最適化
PDF
Learning Spatial Common Sense with Geometry-Aware Recurrent Networks
PPTX
Bachelor Presentation
PDF
【2015.08】(5/5)cvpaper.challenge@CVPR2015
PDF
【2015.07】(1/2)cvpaper.challenge@CVPR2015
【2015.07】(2/2)cvpaper.challenge@CVPR2015
点群深層学習 Meta-study
CVPR2019読み会 "A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruc...
点群SegmentationのためのTransformerサーベイ
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
MIRU2016 チュートリアル
ConditionalPointDiffusion.pdf
Opencv object detection_takmin
Direct Sparse Odometryの解説
慣性センサーログの効果的な可視化と分類
Image net classification with Deep Convolutional Neural Networks
[DL輪読会]Geometric Unsupervised Domain Adaptation for Semantic Segmentation
AGA_CVPR2017
Soft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
20200704 bsp net
信号処理・画像処理における凸最適化
Learning Spatial Common Sense with Geometry-Aware Recurrent Networks
Bachelor Presentation
【2015.08】(5/5)cvpaper.challenge@CVPR2015
【2015.07】(1/2)cvpaper.challenge@CVPR2015
Ad

More from Morpho, Inc. (10)

PDF
(文献紹介)デブラー手法の紹介
PDF
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
PDF
Vieurekaを用いた混雑状況の配信
PDF
Limits on Super-Resolution and How to Break them
PDF
(文献紹介) 画像復元:Plug-and-Play ADMM
PDF
前景と背景の画像合成技術
PDF
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
PDF
(文献紹介)HDR+, Night Sight
PDF
Demosaicing(デモザイキング)
PDF
Company Profile (Japanese)
(文献紹介)デブラー手法の紹介
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
Vieurekaを用いた混雑状況の配信
Limits on Super-Resolution and How to Break them
(文献紹介) 画像復元:Plug-and-Play ADMM
前景と背景の画像合成技術
(文献紹介)エッジ保存フィルタ:Side Window Filter, Curvature Filter
(文献紹介)HDR+, Night Sight
Demosaicing(デモザイキング)
Company Profile (Japanese)

(文献紹介)Depth Completionの最新動向

  • 1. Copyright © 2019 Morpho, Inc. All Rights Reserved. Non-Local Spatial Propagation Network for Depth Completion <文献紹介> Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 2. Copyright © 2019 Morpho, Inc. All Rights Reserved. 概要 RGB画像とsparse depth mapからdense depth mapを直接推論 同時に出力した3枚の特徴マップでrefinement の2段階構成をend-to-endに学習する • 各ピクセルの「近傍系」を選択的に学習 • Refinement時の重みの無駄な正規化を抑制 • Confidenceのrefinementへの組み込み により11月現在おそらく最高性能を達成(2020/7/20に投稿) Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 3. Copyright © 2019 Morpho, Inc. All Rights Reserved. 結果 エッジ保存性が従来手法に比べて比較的良い 細い線などの細かいテクスチャも取れている Non-Local Spatial Propagation ([1] Fig.6.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 4. Copyright © 2019 Morpho, Inc. All Rights Reserved. 結果 Non-Local Spatial Propagation ([1] Table 1.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 5. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 全体像は 初期depth推定 ⇒ Refinement の2段構成 Non-Local Spatial Propagation ([1] Fig.2.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 6. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下3つのポイントを順に解説する 1. 各ピクセルの「近傍系」を選択的に学習 2. Refinement時の重みの無駄な正規化を抑制 3. Confidenceのrefinementへの組み込み Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 7. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下3つのポイントを順に解説する 1. 各ピクセルの「近傍系」を選択的に学習 2. Refinement時の重みの無駄な正規化を抑制 3. Confidenceのrefinementへの組み込み が、その前にrefinementについて先に概説する Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 8. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 Refinementは下式を繰り返し適用することで行われる: Non-Local Spatial Propagation • 𝑥 𝑚,𝑛:depth mapの(m, n)座標におけるdepth値 • 𝑤 𝑚,𝑛 𝑖,𝑗 :ピクセル𝑥𝑖,𝑗 が𝑥 𝑚,𝑛にもたらす重み • 𝑁 𝑚,𝑛:座標(m, n)の近傍 で、𝑤 𝑚,𝑛 + σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 𝑤 𝑚,𝑛 𝑖,𝑗 = 1 とする。𝑡はイテレータ Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑥 𝑚,𝑛 𝑡 = 𝑤 𝑚,𝑛 𝑐 𝑥 𝑚,𝑛 𝑡−1 ෍ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 𝑤 𝑚,𝑛 𝑖,𝑗 𝑥𝑖,𝑗 𝑡−1
  • 9. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 Refinementは下式を繰り返し適用することで行われる: Non-Local Spatial Propagation • 𝑥 𝑚,𝑛:depth mapの(m, n)座標におけるdepth値 • 𝑤 𝑚,𝑛 𝑖,𝑗 :ピクセル𝑥𝑖,𝑗 が𝑥 𝑚,𝑛にもたらす重み • 𝑁 𝑚,𝑛:座標(m, n)の近傍 で、𝑤 𝑚,𝑛 + σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 𝑤 𝑚,𝑛 𝑖,𝑗 = 1 とする。𝑡はイテレータ。 この2つをrefinement前に 学習で求める Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑥 𝑚,𝑛 𝑡 = 𝑤 𝑚,𝑛 𝑐 𝑥 𝑚,𝑛 𝑡−1 ෍ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 𝑤 𝑚,𝑛 𝑖,𝑗 𝑥𝑖,𝑗 𝑡−1
  • 10. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下3つのポイントを順に解説する 1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 ) 2. Refinement時の重みの無駄な正規化を抑制( 𝑤 𝑚,𝑛 𝑖,𝑗 ) 3. Confidenceのrefinementへの組み込み Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 11. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 従来のrefinement手法では近傍画素の配置を固定にすると 境界付近で不要なピクセル情報を拾ってしまう Non-Local Spatial Propagation ([1] Fig.3.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 12. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 従来のrefinement手法では近傍画素の配置を固定にすると 境界付近で不要なピクセル情報を拾ってしまう そこで、近傍系の形を適応的に変形することを考える Non-Local Spatial Propagation ([1] Fig.3.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 13. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 座標(m, n)の近傍は以下で定める: Non-Local Spatial Propagation φをパラメータとする「(m, n) のK個の近傍」を返す関数 これを学習により求める 注目すべき点として、p, qは実数値 →サブピクセル精度で近傍探索が行われる! Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑁 𝑚,𝑛 𝑁𝐿 = {𝑥 𝑚+𝑝,𝑛+𝑞| 𝑝, 𝑞 ∈ 𝑓φ 𝑰, 𝑫, 𝑚, 𝑛 , 𝑝, 𝑞 ∈ 𝑹}
  • 14. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下近傍を8個にした場合 カラー画像のエッジをうまく とらえている Non-Local Spatial Propagation ([1] Fig.8.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 15. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 実はCNNの場合には元ネタが存在([2], [3]) • Deformable Convolutional Networks • Deformable ConvNets v2: More Deformable, Better Results (上の論文のインターン生による改良版) これら2つの論文では、convolutionのカーネルの形を動的に変 形(長方形でなく)することで物体形状の変化にロバストに対 応させることを提案している これをカーネルではなくrefinementに援用したのがミソ Non-Local Spatial Propagation ([2] Fig.1.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 16. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 実際に𝑓𝜑がどう定義されるかの記述は存在しなかったが、 前述の論文を見る限りおそらく次の通り Non-Local Spatial Propagation Inputの注目画素 (m,n)を中心に 普通のconv.を 2N枚かける 2枚かけるごとに(m,n)の 近傍としてoffset vector (p,q)が1つ定まる 得られたN個の近 傍でrefinementを 実行 ([2] Fig.2.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 17. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下3つのポイントを順に解説する 1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 ) 2. Refinement時の重みの無駄な正規化を抑制( 𝒘 𝒎,𝒏 𝒊,𝒋 ) 3. Confidenceのrefinementへの組み込み Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 18. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 Refinement時の重みについて以下の事実が知られている ([4] Theorem 3) ⚫ Refinementが収束する十分条件は σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 |𝑤 𝑚,𝑛 𝑖,𝑗 | ≤ 1 ここでrefinementの式を思い出しておく Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑥 𝑚,𝑛 𝑡 = 𝑤 𝑚,𝑛 𝑐 𝑥 𝑚,𝑛 𝑡−1 ෍ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 𝑤 𝑚,𝑛 𝑖,𝑗 𝑥𝑖,𝑗 𝑡−1
  • 19. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 なので|𝑤 𝑚,𝑛 𝑖,𝑗 |の合計が1を上回る場合には正規化処理が必要 しかし単純に以下のように合計値で割るのは問題がある 𝑤 𝑚,𝑛 𝑖,𝑗 = ෝ𝑤 𝑚,𝑛 𝑖,𝑗 σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 |ෝ𝑤 𝑚,𝑛 𝑖,𝑗 | 𝑁 𝑚,𝑛 = 2としてその理由を示す Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑥 𝑚,𝑛 𝑡 = 𝑤 𝑚,𝑛 𝑐 𝑥 𝑚,𝑛 𝑡−1 ෍ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 𝑤 𝑚,𝑛 𝑖,𝑗 𝑥𝑖,𝑗 𝑡−1
  • 20. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 𝑤1, 𝑤2 の𝐿1 ノルムによる正規化した結果を図示すると、 このように枠線上に 𝑤1, 𝑤2 が集中してしまい 𝑤1, 𝑤2の自由度(=モデルの表現力)が減ってしまう Non-Local Spatial Propagation ( [1] Fig.4.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 21. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 では𝐿1 ノルムが1を超えた時だけ正規化したらどうなのか? →これも実は失敗する 正規化が発生する頻度がどの程度かを考えればよいが、 𝑤1, 𝑤2が独立に標準正規分布に従うとして同じく図示すると、 Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 22. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 大半が正規化されて端に寄っている もし4変数にすると、98%が端に位置する Non-Local Spatial Propagation ( [1] Fig.4.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 23. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 正規化しても自由度が減らないようスケール変換したい →本論文では以下で解決 ここでKは変数の個数 これならσ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 |𝑤 𝑚,𝑛 𝑖,𝑗 | ≤ 1 は常に成立するが果たして自由度は? Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑤 𝑚,𝑛 𝑖,𝑗 = tanh(ෝ𝑤 𝑚,𝑛 𝑖,𝑗 )/𝐶 , 𝐶 ≥ 𝐾
  • 24. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 正規化後も端に寄りにくくなっている すなわち、この方がモデルの表現力が高い Non-Local Spatial Propagation ( [1] Fig.4.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 25. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 そこで σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 |𝑤 𝑚,𝑛 𝑖,𝑗 | が1を超えたときのみtanhによる正規 化を行うことで表現力をできる限り高める Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 26. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 そこで σ 𝑖,𝑗 ∈𝑁 𝑚,𝑛 |𝑤 𝑚,𝑛 𝑖,𝑗 | が1を超えたときのみtanhによる正規 化を行うことで表現力をできる限り高める 結果: Non-Local Spatial Propagation ( [1] Fig.4.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 27. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 一覧すると以下の通り 右端のグラフは 𝑤1,, 𝑤2 を複数生成したときに 正規化されるものの割合を示したもの (青が単純な割り算、黄がtanhを使う方法) Non-Local Spatial Propagation ( [1] Fig.4.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 28. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 ところでtanhを使う場合には よりCを決める必要があった →Cも学習で自動的に決定されるようにする Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑤 𝑚,𝑛 𝑖,𝑗 = tanh(ෝ𝑤 𝑚,𝑛 𝑖,𝑗 )/𝐶
  • 29. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下3つのポイントを順に解説する。 1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 ) 2. Refinement時の重みの無駄な正規化を抑制( 𝑤 𝑚,𝑛 𝑖,𝑗 ) 3. Confidenceのrefinementへの組み込み Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 30. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 考察1,2では入力depthの誤測定が加味できていない そこでinitial depth mapと同時にconfidence mapも推論させる Non-Local Spatial Propagation ( [1] Fig.5.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 31. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 取得したconfidence、𝑐 𝑖,𝑗 ∈ [0, 1]はrefinement時の重み𝑤 𝑚,𝑛 𝑖,𝑗 を 弱めるのに用いる Non-Local Spatial Propagation ( [1] Fig.5.)Copyright © 2020 Morpho, Inc. All Rights Reserved. 𝑤 𝑚,𝑛 𝑖,𝑗 = 𝑐 𝑖,𝑗 ⋅ tanh(ෝ𝑤 𝑚,𝑛 𝑖,𝑗 )/𝛾
  • 32. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下confidenceありなしで結果を比較 Depthの誤測定が修正されているのが分かる Non-Local Spatial Propagation ( [1] Fig.5.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 33. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 以下3つのポイントを順に解説する 1. 各ピクセルの「近傍系」を選択的に学習( 𝑁 𝑚,𝑛 ) 2. Refinement時の重みの無駄な正規化を抑制( 𝑤 𝑚,𝑛 𝑖,𝑗 ) 3. Confidenceのrefinementへの組み込み Non-Local Spatial Propagation 最後に実際のネットワーク構造を確認する Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 34. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 Non-Local Spatial Propagation ( [1] Fig.A.) Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 35. Copyright © 2019 Morpho, Inc. All Rights Reserved. 手法 ロスは単純に入力時点でdepthが観測されたピクセルの集合 Vに対して ここでρ = 1,2のどちらでもよいが、ρ = 1の方が一般に エッジのキレが良いらしい その他の中間出力に対してロスは定めない(データ取得が困難) Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 36. Copyright © 2019 Morpho, Inc. All Rights Reserved. 考察 ⚫ Initial estimation → refinementは効果が出る ⚫ Deformable convolutionがエッジ保存の肝か ⚫ Weight normalizationの効果は如何ほどか疑問 ⚫ Confidence mapが実測できている場合には、ロスに組み込 めばさらに精度向上する?(スケール合わせが問題?) 正規化の定数Cは学習データの傾向によって変動する模様 使う環境が不定の場合は中々最適に決まらなそう 入力がearly fusionなのは改善の余地ありか? Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 37. Copyright © 2019 Morpho, Inc. All Rights Reserved. 著者実装:https://github.com/zzangjinsun/NLSPN_ECCV20 Non-Local Spatial Propagation ( [1] Fig.D.)Copyright © 2020 Morpho, Inc. All Rights Reserved.
  • 38. Copyright © 2019 Morpho, Inc. All Rights Reserved. 参考文献 [1] J. Park, K. Joo, Z. Hu, C.-K. Liu, and I. S. Kweon.: Nonlocal spatial propagation network for depth completion. In: Proc. Of European Conference on Computer Vision (ECCV), 2020 [2] J. Dai, H. Qi, Y. Xiong, Y. Li, G. Zhang, H. Hu, and Y. Wei. Deformable convolutional networks. In ICCV, 2017. [3] Zhu, X., Hu, H., Lin, S., & Dai, J. (2019). Deformable convnets V2: More deformable, better results. Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2019-June, 9300–9308. https://doi.org/10.1109/CVPR.2019.00953 [4] Liu, S., De Mello, S., Gu, J., Zhong, G., Yang, M.H., Kautz, J.: Learning affinity via spatial propagation networks. In: Proc. of Advances in Neural Information Processing Systems (2017) Non-Local Spatial Propagation Copyright © 2020 Morpho, Inc. All Rights Reserved.