Submit Search
[DL輪読会]RobustNet: Improving Domain Generalization in Urban- Scene Segmentation via Instance Selective Whitening
0 likes
660 views
Deep Learning JP
2021/06/25 Deep Learning JP: http://deeplearning.jp/seminar-2/
Technology
Related topics:
Deep Learning
Read more
1 of 21
Download now
Download to read offline
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
More Related Content
PDF
【チュートリアル】コンピュータビジョンによる動画認識
Hirokatsu Kataoka
PPTX
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
Deep Learning JP
PPTX
Semi supervised, weakly-supervised, unsupervised, and active learning
Yusuke Uchida
PDF
「世界モデル」と関連研究について
Masahiro Suzuki
PDF
BlackBox モデルの説明性・解釈性技術の実装
Deep Learning Lab(ディープラーニング・ラボ)
PDF
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII
PDF
semantic segmentation サーベイ
yohei okawa
PDF
グラフニューラルネットワーク入門
ryosuke-kojima
【チュートリアル】コンピュータビジョンによる動画認識
Hirokatsu Kataoka
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
Deep Learning JP
Semi supervised, weakly-supervised, unsupervised, and active learning
Yusuke Uchida
「世界モデル」と関連研究について
Masahiro Suzuki
BlackBox モデルの説明性・解釈性技術の実装
Deep Learning Lab(ディープラーニング・ラボ)
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII
semantic segmentation サーベイ
yohei okawa
グラフニューラルネットワーク入門
ryosuke-kojima
What's hot
(20)
PPTX
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Deep Learning JP
PPTX
[DL輪読会]相互情報量最大化による表現学習
Deep Learning JP
PPTX
【DL輪読会】マルチモーダル 基盤モデル
Deep Learning JP
PDF
Cosine Based Softmax による Metric Learning が上手くいく理由
tancoro
PDF
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII
PPTX
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
Deep Learning JP
PPTX
【DL輪読会】ViT + Self Supervised Learningまとめ
Deep Learning JP
PPTX
How Much Position Information Do Convolutional Neural Networks Encode?
Kazuyuki Miyazawa
PDF
CVIM#11 3. 最小化のための数値計算
sleepy_yoshi
PDF
最近のDeep Learning (NLP) 界隈におけるAttention事情
Yuta Kikuchi
PPTX
[DL輪読会]When Does Label Smoothing Help?
Deep Learning JP
PDF
文献紹介:TSM: Temporal Shift Module for Efficient Video Understanding
Toru Tamaki
PDF
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
PDF
[DL輪読会]"CyCADA: Cycle-Consistent Adversarial Domain Adaptation"&"Learning Se...
Deep Learning JP
PDF
動画認識における代表的なモデル・データセット(メタサーベイ)
cvpaper. challenge
PPTX
[DL輪読会]Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images
Deep Learning JP
PDF
深層生成モデルと世界モデル
Masahiro Suzuki
PDF
【論文読み会】Self-Attention Generative Adversarial Networks
ARISE analytics
PDF
【メタサーベイ】数式ドリブン教師あり学習
cvpaper. challenge
PDF
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
SSII
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Deep Learning JP
[DL輪読会]相互情報量最大化による表現学習
Deep Learning JP
【DL輪読会】マルチモーダル 基盤モデル
Deep Learning JP
Cosine Based Softmax による Metric Learning が上手くいく理由
tancoro
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
Deep Learning JP
【DL輪読会】ViT + Self Supervised Learningまとめ
Deep Learning JP
How Much Position Information Do Convolutional Neural Networks Encode?
Kazuyuki Miyazawa
CVIM#11 3. 最小化のための数値計算
sleepy_yoshi
最近のDeep Learning (NLP) 界隈におけるAttention事情
Yuta Kikuchi
[DL輪読会]When Does Label Smoothing Help?
Deep Learning JP
文献紹介:TSM: Temporal Shift Module for Efficient Video Understanding
Toru Tamaki
自己教師学習(Self-Supervised Learning)
cvpaper. challenge
[DL輪読会]"CyCADA: Cycle-Consistent Adversarial Domain Adaptation"&"Learning Se...
Deep Learning JP
動画認識における代表的なモデル・データセット(メタサーベイ)
cvpaper. challenge
[DL輪読会]Pixel2Mesh: Generating 3D Mesh Models from Single RGB Images
Deep Learning JP
深層生成モデルと世界モデル
Masahiro Suzuki
【論文読み会】Self-Attention Generative Adversarial Networks
ARISE analytics
【メタサーベイ】数式ドリブン教師あり学習
cvpaper. challenge
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜
SSII
Ad
Similar to [DL輪読会]RobustNet: Improving Domain Generalization in Urban- Scene Segmentation via Instance Selective Whitening
(20)
PDF
ICCV 2019 論文紹介 (26 papers)
Hideki Okada
PDF
[DL輪読会]CNN - based Density Estimation and CrowdCounting A Survey
Deep Learning JP
PPTX
クラウドデザイン パターンに見るクラウドファーストなアプリケーション設計 Data Management編
Takekazu Omi
PDF
【DL輪読会】One-Shot Domain Adaptive and Generalizable Semantic Segmentation with ...
Deep Learning JP
PPTX
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
Deep Learning JP
PDF
ドメイン・サブシステム 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第36回】
Tomoharu ASAMI
PDF
Ia20120118 sayama
Keisuke Ishibashi
PDF
【DeepLearning研修】Transformerの基礎と応用 --第3回 Transformerの画像での応用
Sony - Neural Network Libraries
PDF
【DL輪読会】Domain Generalization by Learning and Removing Domainspecific Features
Deep Learning JP
PPTX
畳み込みニューラルネットワークの研究動向
Yusuke Uchida
PDF
設計/ドメイン設計(4) 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第26回】
Tomoharu ASAMI
PPTX
[DL輪読会]QUASI-RECURRENT NEURAL NETWORKS
Deep Learning JP
PDF
RUTILEA社内勉強会第1回 「転移学習」
TRUE_RUTILEA
PDF
IEEE/ACM SC2013報告
Ryousei Takano
PDF
[DL輪読会]An Image is Worth 16x16 Words: Transformers for Image Recognition at S...
Deep Learning JP
PDF
K-means hashing (CVPR'13) とハッシング周り
Yusuke Uchida
PDF
大規模サービスを支えるネットワークインフラの全貌
LINE Corporation
PDF
study on safety and security ccoding standards
Kiyoshi Ogawa
PPTX
[DL輪読会]EfficientDet: Scalable and Efficient Object Detection
Deep Learning JP
PPTX
Introduction to Local Image Features....
YiTingTseng6
ICCV 2019 論文紹介 (26 papers)
Hideki Okada
[DL輪読会]CNN - based Density Estimation and CrowdCounting A Survey
Deep Learning JP
クラウドデザイン パターンに見るクラウドファーストなアプリケーション設計 Data Management編
Takekazu Omi
【DL輪読会】One-Shot Domain Adaptive and Generalizable Semantic Segmentation with ...
Deep Learning JP
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
Deep Learning JP
ドメイン・サブシステム 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第36回】
Tomoharu ASAMI
Ia20120118 sayama
Keisuke Ishibashi
【DeepLearning研修】Transformerの基礎と応用 --第3回 Transformerの画像での応用
Sony - Neural Network Libraries
【DL輪読会】Domain Generalization by Learning and Removing Domainspecific Features
Deep Learning JP
畳み込みニューラルネットワークの研究動向
Yusuke Uchida
設計/ドメイン設計(4) 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第26回】
Tomoharu ASAMI
[DL輪読会]QUASI-RECURRENT NEURAL NETWORKS
Deep Learning JP
RUTILEA社内勉強会第1回 「転移学習」
TRUE_RUTILEA
IEEE/ACM SC2013報告
Ryousei Takano
[DL輪読会]An Image is Worth 16x16 Words: Transformers for Image Recognition at S...
Deep Learning JP
K-means hashing (CVPR'13) とハッシング周り
Yusuke Uchida
大規模サービスを支えるネットワークインフラの全貌
LINE Corporation
study on safety and security ccoding standards
Kiyoshi Ogawa
[DL輪読会]EfficientDet: Scalable and Efficient Object Detection
Deep Learning JP
Introduction to Local Image Features....
YiTingTseng6
Ad
More from Deep Learning JP
(20)
PPTX
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
PPTX
【DL輪読会】事前学習用データセットについて
Deep Learning JP
PPTX
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
PPTX
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
Deep Learning JP
PPTX
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
Deep Learning JP
PPTX
【DL輪読会】マルチモーダル LLM
Deep Learning JP
PDF
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
Deep Learning JP
PPTX
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
PDF
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
PPTX
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
PPTX
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
Deep Learning JP
PDF
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
Deep Learning JP
PDF
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
Deep Learning JP
PPTX
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
Deep Learning JP
PPTX
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
PDF
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
Deep Learning JP
PPTX
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
PDF
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
Deep Learning JP
PDF
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
Deep Learning JP
PPTX
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Deep Learning JP
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
【DL輪読会】事前学習用データセットについて
Deep Learning JP
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
Deep Learning JP
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
Deep Learning JP
【DL輪読会】マルチモーダル LLM
Deep Learning JP
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
Deep Learning JP
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
Deep Learning JP
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
Deep Learning JP
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
Deep Learning JP
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
Deep Learning JP
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
Deep Learning JP
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
Deep Learning JP
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
Deep Learning JP
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Deep Learning JP
[DL輪読会]RobustNet: Improving Domain Generalization in Urban- Scene Segmentation via Instance Selective Whitening
1.
DEEP LEARNING JP [DL
Papers] RobustNet: Improving Domain Generalization in Urban- Scene Segmentation via Instance SelectiveWhitening Yuting Lin, Kokusai Kogyo Co., Ltd.(国際航業) http://deeplearning.jp/ 1
2.
書誌情報 • タイトル RobustNet: Improving
Domain Generalization in Urban-Scene Segmentation via Instance Selective Whitening 著者 Sungha Choi*1,3 Sanghun Jung*2 Huiwon Yun4 Joanne T. Kim3 Seungryong Kim3 Jaegul Choo2 1LG AI Research 2KAIST 3Korea University 4Sogang University • CVPR2021(Oral)に採択 • Paper https://arxiv.org/abs/2103.15597 • Code https://github.com/shachoi/RobustNet 2
3.
背景 • Domain Generalization
(DG) によるunseen domain領域分割 既存の課題 Domain Adaptation (DA) はtarget domainを必要とするため、実用性にかける multiple source domain情報からのDomain Generalizationは、コストがかかる single source domainのDGを提案 3
4.
Motivation • Instance Normalization
(IN) – multiple sourceを必要としない汎化性能の向上が可能 – feature covariance (higher-order statistic of future representation) を考慮しない ため、INはdomain-specific style(色・テキスチャー等)の抽出が不十分 • Feature Whitening – image translation, style transfer, DAにおいて、domain-specific style情報を除去 する手法 • feature covarianceにおけるdomain-specific styleとdomain-invariant contentをdecouplingしたい 4
5.
Contribution instance selective
whitening lossを提案し、 feature covarianceから、 domain-specificとdomain-invariant情報を抽出 提案loss関数の計算リソースが低く、各既存手法に適用できる urban-scene segmentationに実験し、SOTAを達成 5
6.
既往研究 • DA/DG – meta-learning,
adversarial training, autoencoder, metric learning, data augmentation – batch normは識別能力を向上できる、instance normは過学習を防げる • Semantic segmentation in DG – DGは画像分類に多く研究されている一方、segmentationに関する研究がまだ少ない • Feature covariance – style transferにおいて、feature covariance (correlations) がstyle informationを表現 できる – whitening transformationはfeature representationsから、style informationを除去で きる • feature covarianceから、domain-specific styleを認識し、 style information を除去する手法を提案 6
7.
Preliminaries • Whitening transformation
(WT) – 各channelの分散を1に、任意channel pairの共分散を0にする線形変換 – where, µ=mean vector, Σµ=covariance matrix • WTの欠点 – 固有値(eigenvector)の計算コストが高い – GDWCT(group-wise deep whitening-and-coloring transformation)は、 暗黙的にΣµ を単位行列に近づけるloss関数を提案 – feature covarianceに対し、 domain-specific styleとdomain-invariant contentを分離 していないことが課題 7
8.
提案手法 • whitening transformed
featureの学習 – 中間特徴マップに対し、Instance Whitening Loss(IW loss)でXsの学習をguide 8
9.
提案手法 • Margin-based relaxation
of whitening loss – IW lossでは、 Σsが全部0になる傾向がある – instance-relaxed whitening (IRW) loss – 汎化性能の向上につながるcovarianceが残っているかの保証がない 9
10.
提案手法 • domain-specific styleとdomain-invariant
contentのdecoupling – domain shiftを起こしたstyleに関するcovarianceを特定して取り除く – color jittering/gaussian blurring等のphotometric変換によるaugmentationに起因する domain shiftを対象 • ネットワークの初期化:数epoch程度IW lossでcovariance matrixを学習 • augmentedデータも入力に加え、 それぞれのcovariance matrix (V)の分散行列を計算 • Vはphotometric変換に対するcovarianceの感度を示す。分散が高いcovariance matrix要素には、 domain-specific style情報が入っている 10
11.
提案手法 • domain-specific styleとdomain-invariant
contentのdecoupling • k-meansクラスタリングで、covariance matrixの右上の要素に対し、分散の大きさにより分類する • 高い要素を残すように、マスクを生成 • instance selective whitening (ISW) lossで、 domain-invariant content情報を抽出するcovariance matrixの学習をguide 11
12.
提案 • ネットワーク構造 – ResNetを元に、instance
norm layerを3つ追加 – それぞれのISW lossを計算 12
13.
実験 – Ablation
Studies • 対象:loss関数 – instance weighting (IW) loss – instance-relaxed whitening (IRW) loss – instance selective whitening (ISW) loss • 既存手法は、source domainに過学 習する傾向 • 提案手法は、source dimainでの精度 が低下するのが課題 13
14.
実験 – Ablation
Studies • 対象:loss関数 – instance weighting (IW) loss – instance-relaxed whitening (IRW) loss – instance selective whitening (ISW) loss • 既存手法は、source domainに過学 習する傾向 • 提案手法は、source dimainでの精度 が低下するのが課題 14
15.
実験 – Ablation
Studies • 対象:backbone – ShuffleNeV2 – MobileNetV2 • 対象 – 複数source domain 15
16.
実験 - 既存手法との比較 •
DG手法と比較 • DA手法と比較 – DAはtarget domainを使用する 16
17.
実験 - 計算コスト •
既存手法と同程度 17
18.
実験 – 定性評価 •
covariance matrixの可視化 – 左ペアが浅い層の結果、右ペアが深い層の結果 – style情報が浅い層にあり、深い層で除去されたことを確認できる 18
19.
実験 – 定性評価 •
whitened featuresで画像を再現 – U-Netで再現 – content情報を保持していることを確認できる 19
20.
考察 • Affine parameters –
既存手法では、元の分布の復元や表現能力の向上のため、norm layerに使う – 本手法では、affine parameters/1x1 convで実験したが、有効性を確認できなかった – affine parameters/1x1 convは、元の分布を復元する能力が欠けている • Photometric transformation – content情報に悪影響を与える – 今後は、他の方法も検討 20
21.
まとめ • instance selective
whitening (ISW) lossを提案 – 中間特徴マップに対し、domain-specific styleとdomain-invariant contentを分離 – モデルの汎化性能を向上 – urban-sceneにおけるsegmentationで、提案手法の有効性を確認 • 所感 – domainは有効に拡張されたが、拡張された分類境界に課題が残っている 21
Download