SlideShare a Scribd company logo
岡本大和
CVPR’19 SURVEY
Domain Adaptation
on Segmentation Task
自己紹介 岡本大和(おかもとやまと)
 京都大学でパターン認識を研究して修士課程修了
 オムロンで技術起点のBusiness Developmentを担当
 夢は京都をポスト・シリコンバレーにすること
⇒ 京都の学生と変人が持つパワーを世界に知らしめたい
@ICDM’18
Banquet
Twitter : RoadRoller_DESU
調査方針
CVPR’19の論文を対象に
Domain Adaptation を Segmentation Task に適用した論文を抽出
・Strong-Weak Distribution Alignment for Adaptive Object Detection
・Sliced Wasserstein Discrepancy for Unsupervised Domain Adaptation
・Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent Domain Adaptation
巻末では、
予備知識として近年ポピュラーなMask-R-CNNとRoI-Alignを解説
所感:
・segmentationタスクはpixel単位でClassificationする点が特徴的
・Domain-LOSSをどの段階で,どの部分に,どの強度でかけるかが主要論点
Strong-Weak Distribution Alignment for Adaptive Object Detection
Kuniaki Saito, Yoshitaka Ushiku, Tatsuya Harada, Kate Saenko
Boston University, The University of Tokyo, RIKEN
pdf: https://arxiv.org/pdf/1812.04798.pdf (CVPR’2019)
Git: https://github.com/VisionLearningGroup/DA_Detection
Sliced Wasserstein Discrepancy for Unsupervised Domain Adaptation
Chen-Yu Lee, Tanmay Batra, Mohammad Haris Baig, Daniel Ulbricht
Apple Inc
pdf: ttps://arxiv.org/pdf/1903.04064.pdf (CVPR’2019)
Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent Domain Adaptation
Yawei Luo, Liang Zheng, Tao Guan, Junqing Yu, Yi Yang
Huazhong University, Baidu Research, Australian National University
pdf: https://arxiv.org/pdf/1809.09478.pdf (CVPR’2019)
Git: https://github.com/RoyalVane/CLAN (Coming soon....)
(巻末付録)CyCADA: Cycle-Consistent Adversarial Domain Adaptation
Judy Hoffman, Eric Tzeng, Taesung Park, Jun-Yan Zhu, Phillip Isola, Kate Saenko, Alexei A. Efros, Trevor Darrell
EECS and BAIR, UC Berkeley, Openai, Boston University
pdf: http://proceedings.mlr.press/v80/hoffman18a/hoffman18a.pdf (ICML’2018)
Git: https://github.com/jhoffman/cycada_release
(巻末付録)Mask R-CNN、RoI-Align
Kaiming He Georgia Gkioxari Piotr Dollar Ross Girshick
Facebook AI Research
pdf: https://arxiv.org/pdf/1703.06870.pdf
Git: https://github.com/matterport/Mask_RCNN
Strong-Weak Distribution Alignment
for Adaptive Object Detection (CVPR’19)
Experiment:
Task Domain Adaptation on Semantic Segmentation
Model Faster RCNN + ROI-alignment + Domain Prediction Brunch
DataSet ・Adaptation between dissimilar domain(PASCAL⇒Clipart, Watercolor)
・Adaptation between similar domain(Cityscapes⇒Foggy Cityscapes)
・Adaptation from synthetic to real images(GTA ⇒ Cityscapes)
Key Idea:
• Feature MapのH*W個の局所特徴それぞれに強めのAdversarial lossをかける
• Feature Mapの全体に対しては弱めのAdversarial lossをかける
Sliced Wasserstein Discrepancy
for Unsupervised Domain Adaptation (CVPR’19)
Experiment:
Task Domain Adaptation on
Image Classification, Semantic Segmentation and Object Detection
Model VGG-16 + PSPNet, ResNet-101 + PSPNet (*for segmentation task)
DataSet GTA5 -> Cityscape, Synthia -> Cityscape (*for segmentation task)
Key Idea:
• 2つのClassifierでXtargetの予測結果が異なるようにClassifierを学習、重なるようにGeneratorを学習
• このとき予測結果の相違尺度にWasserstein-Distanceを用いるよう改良した
• 距離計算を簡易化するためにradial projectionとlinear projectionを導入したらしいが理解追い付かず
余談ですが Future Workに
・domain randomization
・open set adaptation
・zero-shot domain adaptation
とありました、期待!
Taking A Closer Look at Domain Shift: Category-level Adversaries for
Semantics Consistent Domain Adaptation (CVPR’19)
Experiment:
Task Domain Adaptation on Semantic Segmentation
Model DeepLab-v2 with ResNet-101
DataSet GTA5 -> Cityscape, Synthia -> Cityscape
Key Idea:
• Source-Dataにて、識別器C1とC2の判定結果の和が正しいSegmentationとなるようにLOSSをかける
• 識別器C1とC2が異なる観点を持つ(特徴量の多様性を確保する)ようにLOSSをかける
• 識別器C1とC2の出力から、Discriminatorがドメイン識別できないようにAdversarial-LOSSをかける
• Adversarial-LOSSは判定不一致度合(C1とC2の出力のコサイン距離平均)で重み付けする
(巻末付録)2018年の関連論文
CyCADA: Cycle-Consistent Adversarial Domain Adaptation(ICML’18)
Experiment:
Task Domain Adaptation on Semantic Segmentation
Model VGG16-FCN8s base, and DRN-26
DataSet GTA5 -> Cityscape, Cityscape -> GTA5
Key Idea:
• ドメイン変換する過程で情報損失が起きないように、Cycle lossを導入した
• S->T->Sとドメイン変換したときに元データと一致すれば、変換過程で情報損失がないという考え
(巻末付録)Mask R-CNN
画像中から物体を検出して識別する手法
R-CNN (CVPR’14)
・画像から物体候補領域であるRoI(Region of Interest)を抽出後、各RoIをCNNにかけて物体を検出
Faster-R-CNN (NIPS’15)
・FeatureMAPからRoIを抽出してからCNNで物体検出、R-CNNをEnd-To-Endで学習可能にした。
MASK-R-CNN(ICCV’17)
・Faster-R-CNNにmask-brunchを追加した。mask生成とClassificationのタスクを分離した点が特徴。
参考、画像引用:
・Mask R-CNN Slide Share https://www.slideshare.net/windmdk/mask-rcnn
・Fast R-CNN(Microsoft Research) https://arxiv.org/pdf/1504.08083.pdf
K種類のClassを想定してK個のmaskを出力
誤差逆伝播はClassifier-Brunchの出力クラスkのmaskにのみ適用
(巻末付録)RoI-Align
検出したRoIから固定サイズのFeature MAPを取得するための手法
RoI-Pooling(ICCV’15でMicrosoft Research が提案)
・RoI座標を整数値に丸めて領域を切出す(例:[(6.4, 2.8), (9.8, 4.2)] ⇒ [(6, 2), (9, 4)] )
・出力したいFeatureMAPサイズ(HxW)に領域分割して、それぞれでMaxやAverageでPoolingする
・整数値に丸めたり、HxWに領域分割するときに位置ずれが起きることが問題点
RoI-Align(ICCV’17でFacebook AI Research が提案)
・RoIを(整数値に丸めずに)そのまま出力したいFeatureMAPサイズ(HxW)に領域分割する
・RoIの内部にあるグリッド点の座標を(整数値に丸めずに)算出
・グリッド点の値を近傍4ピクセルからbilinear interpolationで算出
・それぞれMaxやAverageでPoolingする
参考、画像引用:
・最新の物体検出手法Mask R-CNNのRoI AlignとFast(er) R-CNNのRoI Poolingの違いを正しく理解する(@yu4u) https://qiita.com/yu4u/items/5cbe9db166a5d72f9eb8
・Mask R-CNN Slide Share https://www.slideshare.net/windmdk/mask-rcnn
RoI-Pooling RoI-Align

More Related Content

PPTX
[DL輪読会]Pyramid Stereo Matching Network
PDF
Icpによる原画像推定
PDF
ICCV2019読み会「Learning Meshes for Dense Visual SLAM」
PDF
ICML 2020 最適輸送まとめ
PPTX
第27回ロボティクスシンポジアスライド
PDF
大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成
PDF
ICCV19読み会 "Learning Single Camera Depth Estimation using Dual-Pixels"
PDF
Copy and-paste networks for deep video inpainting
[DL輪読会]Pyramid Stereo Matching Network
Icpによる原画像推定
ICCV2019読み会「Learning Meshes for Dense Visual SLAM」
ICML 2020 最適輸送まとめ
第27回ロボティクスシンポジアスライド
大域マッチングコスト最小化とLiDAR-IMUタイトカップリングに基づく三次元地図生成
ICCV19読み会 "Learning Single Camera Depth Estimation using Dual-Pixels"
Copy and-paste networks for deep video inpainting

Similar to CVPR2019 survey Domain Adaptation on Semantic Segmentation (20)

PDF
WWW2017論文読み会 Information Cascades と Graph Algorithms
PDF
CVPR2019 読み会「Understanding the Limitations of CNN-based Absolute Camera Pose ...
PDF
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
PDF
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
PDF
CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1
PDF
2012-03-08 MSS研究会
PDF
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
PDF
ADVENTUREの他のモジュール・関連プロジェクトの紹介
PPTX
Cedec2012 ai-contest-design-patterns-principles
PDF
KDDCUP2020 ML Track2
PPTX
20190227 第51回CV勉強会@関東
PDF
CVPR 2011 ImageNet Challenge 文献紹介
PDF
ICCV 2019 論文紹介 (26 papers)
PDF
NAPA 3次元モデルを用いたフロントローディングによる生産性向上
PDF
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
PPTX
CNNの構造最適化手法(第3回3D勉強会)
PDF
[豆ナイト]Java small object programming
PDF
20210531 ora jam_stackgan
PPTX
End-to-end learning of keypoint detector and descriptor for pose invariant 3D...
PDF
BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東)
WWW2017論文読み会 Information Cascades と Graph Algorithms
CVPR2019 読み会「Understanding the Limitations of CNN-based Absolute Camera Pose ...
(文献紹介)深層学習による動被写体ロバストなカメラの動き推定
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
CMSI計算科学技術特論B(4) アプリケーションの性能最適化の実例1
2012-03-08 MSS研究会
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
ADVENTUREの他のモジュール・関連プロジェクトの紹介
Cedec2012 ai-contest-design-patterns-principles
KDDCUP2020 ML Track2
20190227 第51回CV勉強会@関東
CVPR 2011 ImageNet Challenge 文献紹介
ICCV 2019 論文紹介 (26 papers)
NAPA 3次元モデルを用いたフロントローディングによる生産性向上
これからのコンピュータビジョン技術 - cvpaper.challenge in PRMU Grand Challenge 2016 (PRMU研究会 2...
CNNの構造最適化手法(第3回3D勉強会)
[豆ナイト]Java small object programming
20210531 ora jam_stackgan
End-to-end learning of keypoint detector and descriptor for pose invariant 3D...
BA-Net: Dense Bundle Adjustment Network (3D勉強会@関東)
Ad

More from Yamato OKAMOTO (20)

PDF
第七回全日本コンピュータビジョン勉強会 A Multiplexed Network for End-to-End, Multilingual OCR
PDF
部下のマネジメントはAI開発に学べ
PDF
ICLR2020 オンライン読み会 Deep Semi-Supervised Anomaly Detection
PDF
ICLR'2020 参加速報
PDF
Domain Generalization via Model-Agnostic Learning of Semantic Features
PDF
(SURVEY) Active Learning
PDF
(SURVEY) Semi Supervised Learning
PDF
[ICML2019読み会in京都] (LT)Bayesian Nonparametric Federated Learning of Neural Net...
PDF
[ICML2019読み会in京都] Agnostic Federated Learning
PDF
CVPR2019@ロングビーチ参加速報(後編 ~本会議~)
PDF
CVPR2019@ロングビーチ参加速報(前編~Tutorial&Workshop~)
PDF
ICML2019@Long Beach 参加速報(5~6日目 Workshop)
PDF
ICML2019@Long Beach 参加速報(最終日 Workshop)
PDF
ICML2019@Long Beach 参加速報(4日目)
PDF
ICML2019@Long Beach 参加速報(3日目)
PDF
ICML2019@Long Beach 参加速報(2日目)
PDF
ICML2019@Long Beach 参加速報(1日目)
PDF
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
PDF
ICLR'19 読み会 in 京都 [LT枠] Domain Adaptationの研究動向
PDF
ICLR'19 研究動向まとめ 『Domain Adaptation』『Feature Disentangle』
第七回全日本コンピュータビジョン勉強会 A Multiplexed Network for End-to-End, Multilingual OCR
部下のマネジメントはAI開発に学べ
ICLR2020 オンライン読み会 Deep Semi-Supervised Anomaly Detection
ICLR'2020 参加速報
Domain Generalization via Model-Agnostic Learning of Semantic Features
(SURVEY) Active Learning
(SURVEY) Semi Supervised Learning
[ICML2019読み会in京都] (LT)Bayesian Nonparametric Federated Learning of Neural Net...
[ICML2019読み会in京都] Agnostic Federated Learning
CVPR2019@ロングビーチ参加速報(後編 ~本会議~)
CVPR2019@ロングビーチ参加速報(前編~Tutorial&Workshop~)
ICML2019@Long Beach 参加速報(5~6日目 Workshop)
ICML2019@Long Beach 参加速報(最終日 Workshop)
ICML2019@Long Beach 参加速報(4日目)
ICML2019@Long Beach 参加速報(3日目)
ICML2019@Long Beach 参加速報(2日目)
ICML2019@Long Beach 参加速報(1日目)
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
ICLR'19 読み会 in 京都 [LT枠] Domain Adaptationの研究動向
ICLR'19 研究動向まとめ 『Domain Adaptation』『Feature Disentangle』
Ad

CVPR2019 survey Domain Adaptation on Semantic Segmentation

  • 2. 自己紹介 岡本大和(おかもとやまと)  京都大学でパターン認識を研究して修士課程修了  オムロンで技術起点のBusiness Developmentを担当  夢は京都をポスト・シリコンバレーにすること ⇒ 京都の学生と変人が持つパワーを世界に知らしめたい @ICDM’18 Banquet Twitter : RoadRoller_DESU
  • 3. 調査方針 CVPR’19の論文を対象に Domain Adaptation を Segmentation Task に適用した論文を抽出 ・Strong-Weak Distribution Alignment for Adaptive Object Detection ・Sliced Wasserstein Discrepancy for Unsupervised Domain Adaptation ・Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent Domain Adaptation 巻末では、 予備知識として近年ポピュラーなMask-R-CNNとRoI-Alignを解説 所感: ・segmentationタスクはpixel単位でClassificationする点が特徴的 ・Domain-LOSSをどの段階で,どの部分に,どの強度でかけるかが主要論点
  • 4. Strong-Weak Distribution Alignment for Adaptive Object Detection Kuniaki Saito, Yoshitaka Ushiku, Tatsuya Harada, Kate Saenko Boston University, The University of Tokyo, RIKEN pdf: https://arxiv.org/pdf/1812.04798.pdf (CVPR’2019) Git: https://github.com/VisionLearningGroup/DA_Detection Sliced Wasserstein Discrepancy for Unsupervised Domain Adaptation Chen-Yu Lee, Tanmay Batra, Mohammad Haris Baig, Daniel Ulbricht Apple Inc pdf: ttps://arxiv.org/pdf/1903.04064.pdf (CVPR’2019) Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent Domain Adaptation Yawei Luo, Liang Zheng, Tao Guan, Junqing Yu, Yi Yang Huazhong University, Baidu Research, Australian National University pdf: https://arxiv.org/pdf/1809.09478.pdf (CVPR’2019) Git: https://github.com/RoyalVane/CLAN (Coming soon....) (巻末付録)CyCADA: Cycle-Consistent Adversarial Domain Adaptation Judy Hoffman, Eric Tzeng, Taesung Park, Jun-Yan Zhu, Phillip Isola, Kate Saenko, Alexei A. Efros, Trevor Darrell EECS and BAIR, UC Berkeley, Openai, Boston University pdf: http://proceedings.mlr.press/v80/hoffman18a/hoffman18a.pdf (ICML’2018) Git: https://github.com/jhoffman/cycada_release (巻末付録)Mask R-CNN、RoI-Align Kaiming He Georgia Gkioxari Piotr Dollar Ross Girshick Facebook AI Research pdf: https://arxiv.org/pdf/1703.06870.pdf Git: https://github.com/matterport/Mask_RCNN
  • 5. Strong-Weak Distribution Alignment for Adaptive Object Detection (CVPR’19) Experiment: Task Domain Adaptation on Semantic Segmentation Model Faster RCNN + ROI-alignment + Domain Prediction Brunch DataSet ・Adaptation between dissimilar domain(PASCAL⇒Clipart, Watercolor) ・Adaptation between similar domain(Cityscapes⇒Foggy Cityscapes) ・Adaptation from synthetic to real images(GTA ⇒ Cityscapes) Key Idea: • Feature MapのH*W個の局所特徴それぞれに強めのAdversarial lossをかける • Feature Mapの全体に対しては弱めのAdversarial lossをかける
  • 6. Sliced Wasserstein Discrepancy for Unsupervised Domain Adaptation (CVPR’19) Experiment: Task Domain Adaptation on Image Classification, Semantic Segmentation and Object Detection Model VGG-16 + PSPNet, ResNet-101 + PSPNet (*for segmentation task) DataSet GTA5 -> Cityscape, Synthia -> Cityscape (*for segmentation task) Key Idea: • 2つのClassifierでXtargetの予測結果が異なるようにClassifierを学習、重なるようにGeneratorを学習 • このとき予測結果の相違尺度にWasserstein-Distanceを用いるよう改良した • 距離計算を簡易化するためにradial projectionとlinear projectionを導入したらしいが理解追い付かず 余談ですが Future Workに ・domain randomization ・open set adaptation ・zero-shot domain adaptation とありました、期待!
  • 7. Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent Domain Adaptation (CVPR’19) Experiment: Task Domain Adaptation on Semantic Segmentation Model DeepLab-v2 with ResNet-101 DataSet GTA5 -> Cityscape, Synthia -> Cityscape Key Idea: • Source-Dataにて、識別器C1とC2の判定結果の和が正しいSegmentationとなるようにLOSSをかける • 識別器C1とC2が異なる観点を持つ(特徴量の多様性を確保する)ようにLOSSをかける • 識別器C1とC2の出力から、Discriminatorがドメイン識別できないようにAdversarial-LOSSをかける • Adversarial-LOSSは判定不一致度合(C1とC2の出力のコサイン距離平均)で重み付けする
  • 8. (巻末付録)2018年の関連論文 CyCADA: Cycle-Consistent Adversarial Domain Adaptation(ICML’18) Experiment: Task Domain Adaptation on Semantic Segmentation Model VGG16-FCN8s base, and DRN-26 DataSet GTA5 -> Cityscape, Cityscape -> GTA5 Key Idea: • ドメイン変換する過程で情報損失が起きないように、Cycle lossを導入した • S->T->Sとドメイン変換したときに元データと一致すれば、変換過程で情報損失がないという考え
  • 9. (巻末付録)Mask R-CNN 画像中から物体を検出して識別する手法 R-CNN (CVPR’14) ・画像から物体候補領域であるRoI(Region of Interest)を抽出後、各RoIをCNNにかけて物体を検出 Faster-R-CNN (NIPS’15) ・FeatureMAPからRoIを抽出してからCNNで物体検出、R-CNNをEnd-To-Endで学習可能にした。 MASK-R-CNN(ICCV’17) ・Faster-R-CNNにmask-brunchを追加した。mask生成とClassificationのタスクを分離した点が特徴。 参考、画像引用: ・Mask R-CNN Slide Share https://www.slideshare.net/windmdk/mask-rcnn ・Fast R-CNN(Microsoft Research) https://arxiv.org/pdf/1504.08083.pdf K種類のClassを想定してK個のmaskを出力 誤差逆伝播はClassifier-Brunchの出力クラスkのmaskにのみ適用
  • 10. (巻末付録)RoI-Align 検出したRoIから固定サイズのFeature MAPを取得するための手法 RoI-Pooling(ICCV’15でMicrosoft Research が提案) ・RoI座標を整数値に丸めて領域を切出す(例:[(6.4, 2.8), (9.8, 4.2)] ⇒ [(6, 2), (9, 4)] ) ・出力したいFeatureMAPサイズ(HxW)に領域分割して、それぞれでMaxやAverageでPoolingする ・整数値に丸めたり、HxWに領域分割するときに位置ずれが起きることが問題点 RoI-Align(ICCV’17でFacebook AI Research が提案) ・RoIを(整数値に丸めずに)そのまま出力したいFeatureMAPサイズ(HxW)に領域分割する ・RoIの内部にあるグリッド点の座標を(整数値に丸めずに)算出 ・グリッド点の値を近傍4ピクセルからbilinear interpolationで算出 ・それぞれMaxやAverageでPoolingする 参考、画像引用: ・最新の物体検出手法Mask R-CNNのRoI AlignとFast(er) R-CNNのRoI Poolingの違いを正しく理解する(@yu4u) https://qiita.com/yu4u/items/5cbe9db166a5d72f9eb8 ・Mask R-CNN Slide Share https://www.slideshare.net/windmdk/mask-rcnn RoI-Pooling RoI-Align