SlideShare a Scribd company logo
3
Most read
4
Most read
6
Most read
DEEP LEARNING JP
[DL Papers]
Standardized Max Logits: A Simple yet Effective Approach
for Identifying Unexpected Road Obstacles in Urban-Scene
Segmentation
Yuting Lin, Kokusai Kogyo Co., Ltd.(国際航業)
http://deeplearning.jp/
1
書籍情報
• タイトル
– Standardized Max Logits: A Simple yet Effective Approach for Identifying
Unexpected Road Obstacles in Urban-Scene Segmentation
• 著者
– Sanghun Jung*1 Jungsoo Lee*1 Daehoon Gwak1 Sungha Choi2 Jaegul Choo1
– 1KAIST AI 2LG AI Research
• ICCV2021(oral)に採択
• Paper
– https://openaccess.thecvf.com/content/ICCV2021/html/Jung_Standardized_Max_L
ogits_A_Simple_yet_Effective_Approach_for_Identifying_ICCV_2021_paper.html
• Code
– https://github.com/shjung13/Standardized-max-logits
2
概要
• 提案手法の概要
– 道路等の都市環境にて、semantic segmentationにおける異常物体検出を対象
• 学習データとして定義されていないもの
• OOD(Out-of-Distribution)
– 簡単な解決策
• モデルの推定結果(確率)の活用
• クラスに依存するため、結果が不安定
– 本論文は、簡単な解決策を提案
• クラス間の推定結果を正規化
• 隣接の結果と照合し、結果を改善
• 別のデータセットや、再学習を要しない
3
既往研究
• Detecting unexpected objects in semantic segmentation
– 異常クラスの学習に、別のデータセットを使用
• ImageNet上の物体をcropし、学習データに貼り付ける
– 一般的OOD問題と扱う
• 再学習が必要となる
– 画像の再生成(resynthesis)
• segmentationの結果から、元の画像を再現し、元画像との差分を異常物とする
• 推論時間が長くなってしまう
4
既往研究
• Detecting unexpected objects in semantic segmentation
– 学習済モデルのみ利用
• 通常物体の推定確率(MSP, maximum softmax probability)が異常物体より高い
• MSPは高い確率を出す傾向があるため、異常物体の確率を高める恐れがある
• max logit(softmax前の確率)は、クラス毎にrangeが異なる
5
提案手法の全体図
1. Max logitを取得し、class-wiseな正規化を行う
 異常物体の確率は、一部のIn-distributionクラスより、高い可能性がある
2. 境界付近のfalse positiveを徐々に除去
 境界付近のFPの確率は低い傾向
 細かいFPに対し、local consistencyを利用してsmoothingを行う
6
提案手法
• Notation
– Input image: 𝑋 = 𝑅3×𝐻×𝑊,
– C=pre-defined class
– logit output 𝐹 ∈ 𝑅𝐶×𝐻×𝑊
– max logit 𝐿 ∈ 𝑅𝐻×𝑊
– prediction 𝑌 ∈ 𝑅𝐻×𝑊
– at location h, w
• 𝐿ℎ,𝑤 = max
𝑐
𝐹𝑐,ℎ,𝑤
• 𝑌ℎ,𝑤 = argmax
𝑐
𝐹𝑐,ℎ,𝑤
7
提案手法
• Standardized Max Logits (SML) in class-wise manner
– 学習サンプルから、各クラスのmax logitの平均𝜇𝑐と分散𝜎𝑐
2を取得しておく
– where i=training sample, は指示関数
– テスト画像の各画素に対し、SMLを計算
8
提案手法
• Enhancing with Local Semantics
– Iterative boundary suppression
– 境界に隣接しない画素のSMLを境界画素に伝播し、段階的に境界を縮小させ、境界
あたりのfalse positiveとfalse negativeを段階的に除去
• i-th iterationのboundary widthをriとする(ハイパラ)
• non-boundary maskを生成:該当画素の分類結果が同じかつ、距離< ri
9
提案手法
• Enhancing with Local Semantics
– Iterative boundary suppression
– 境界に隣接しない画素のSMLを境界画素に伝播し、段階的に境界を縮小させ、境界
あたりのfalse positiveとfalse negativeを段階的に除去
• 境界画素に、boundary-aware average poolingを適用
• boundary width ri はΔ2, iteration=4, r0=8
10
提案手法
• Enhancing with Local Semantics
– Dilated smoothing
– 細かい誤検出の分類確率が低い/高い場合、前の方法は除去できない
– local consistencyを利用し、dilated Gaussian kernelで除去
– where k=7, dilation rate=6, σ=1
11
実験 -データセット
• Fishyscapes Lost & Found
– Cityscapesの画像に、本物の異常物(from Lost & Found DS)を合成
• Fishyscapes Static
– Cityscapesのvalidationデータに、PASCAL VOCの物体を異常物体として合成
• Road Anomaly
– 60サンプルのみだが、様々な道路シーンがあり、チャレンジングなDS
12
Fishyscapes Road Anomaly
実験の設定
• Cityscapesで学習したDeepLabv3+を使用(backboneはResNet101)
• 評価基準
– AUROC: area under receiver operating characteristics
– AP
– FPR95: false positive rate at a true positive rate of 95%
13
実験結果
• Fishyscapes leaderboardとの比較
– 別情報・再学習が必要な手法と比較しても劣っていない
– 同条件の手法において、SOTA
14
実験結果
• 同条件の手法と比較
– 3つのDSで、SOTAを達成
– 特に、誤検出を大幅に削減
15
実験結果
• 定性評価
– 既存手法より、境界における誤検出を大幅に削減
16
実験 – ablation study
• SMLが最も効果的
– MSPは、異常物体とin-distributionをうまく分類できない可能性がある
– Max logitは、クラスに依存し、不安定になる
• Iterative boundary suppressionがない場合、確率の低いnon-boundary画素
は、boundary画素のSMLが伝播されてしまう可能性がある
17
考察
• Semantic segmentationへの影響
– 元のsegmentation結果は大きく劣化していない
– 提案手法の実用性が高い
18
考察
• 異なるbackboneの性能比較
– 提案手法の拡張性を確認
19
考察
• 処理時間・計算量
– 提案手法の計算量が少ない
20
まとめ
• 本論文は、semantic segmentationにおける異常物体を検出するシンプルな
手法を提案
• Standardized Max Logitは、(in-distribution)クラス間の違いを考慮した異常
物体の確率を推定
• Iterative boundary suppressとDilated smoothingで、false positiveとfalse
negativeを削減し、性能を向上
• 提案手法は、再学習と、追加のOODデータセットが不要で、計算量も少ない
• 十分な実験を行い、提案手法の有効性を検討
21

More Related Content

PDF
Active Learning 入門
PDF
機械学習におけるオンライン確率的最適化の理論
PDF
[DL輪読会]SlowFast Networks for Video Recognition
PDF
SSII2019企画: 点群深層学習の研究動向
PPTX
近年のHierarchical Vision Transformer
PDF
スペクトラルグラフ理論入門
PPTX
Semi supervised, weakly-supervised, unsupervised, and active learning
PDF
【メタサーベイ】Vision and Language のトップ研究室/研究者
Active Learning 入門
機械学習におけるオンライン確率的最適化の理論
[DL輪読会]SlowFast Networks for Video Recognition
SSII2019企画: 点群深層学習の研究動向
近年のHierarchical Vision Transformer
スペクトラルグラフ理論入門
Semi supervised, weakly-supervised, unsupervised, and active learning
【メタサーベイ】Vision and Language のトップ研究室/研究者

What's hot (20)

PDF
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
PPTX
[DL輪読会]GQNと関連研究,世界モデルとの関係について
PDF
【メタサーベイ】数式ドリブン教師あり学習
PPTX
Generative Adversarial Imitation Learningの紹介(RLアーキテクチャ勉強会)
PDF
最適化超入門
PPTX
Transformerを雰囲気で理解する
PPTX
ベイズ統計学の概論的紹介
PDF
局所特徴量と統計学習手法による物体検出
PDF
顕著性マップの推定手法
PDF
深層生成モデルと世界モデル
PDF
Layer Normalization@NIPS+読み会・関西
PDF
工学系大学4年生のための論文の読み方
PDF
信号処理・画像処理における凸最適化
PPTX
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
PPTX
[DL輪読会]モデルベース強化学習とEnergy Based Model
PPTX
Soft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
PDF
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
PDF
KDD'17読み会:Anomaly Detection with Robust Deep Autoencoders
PPTX
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
PDF
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
[DL輪読会]GQNと関連研究,世界モデルとの関係について
【メタサーベイ】数式ドリブン教師あり学習
Generative Adversarial Imitation Learningの紹介(RLアーキテクチャ勉強会)
最適化超入門
Transformerを雰囲気で理解する
ベイズ統計学の概論的紹介
局所特徴量と統計学習手法による物体検出
顕著性マップの推定手法
深層生成モデルと世界モデル
Layer Normalization@NIPS+読み会・関西
工学系大学4年生のための論文の読み方
信号処理・画像処理における凸最適化
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
[DL輪読会]モデルベース強化学習とEnergy Based Model
Soft Rasterizer: A Differentiable Renderer for Image-based 3D Reasoning
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
KDD'17読み会:Anomaly Detection with Robust Deep Autoencoders
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
Ad

Similar to 【DL輪読会】Standardized Max Logits: A Simple yet Effective Approach for Identifying Unexpected Road Obstacles in Urban-Scene Segmentation (20)

PPTX
Tell Me What They’re Holding: Weakly Supervised Object Detection with Transfe...
PDF
論文紹介:Towards Robust Adaptive Object Detection Under Noisy Annotations
PDF
Automatic selection of object recognition methods using reinforcement learning
PPTX
論文紹介 Fast imagetagging
PPTX
【DL輪読会】ViT + Self Supervised Learningまとめ
PDF
Paper reading best of both world
PDF
教師なし画像特徴表現学習の動向 {Un, Self} supervised representation learning (CVPR 2018 完全読破...
PPTX
物体検出の歴史(R-CNNからSSD・YOLOまで)
PDF
[DL輪読会]Generative Models of Visually Grounded Imagination
PDF
論文紹介:Learning from Noisy Pseudo Labels for Semi-Supervised Temporal Action Lo...
PDF
20140530.journal club
PDF
第3回WBAレクチャー:BRAに基づく海馬体の確率的生成モデルの構築
PDF
[論文紹介] BlendedMVS: A Large-scale Dataset for Generalized Multi-view Stereo Ne...
PPTX
【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...
PDF
(文献紹介)デブラー手法の紹介
PPTX
Rabbit challenge 3 DNN Day2
PDF
PDF
論文紹介:Masked Vision and Language Modeling for Multi-modal Representation Learning
PDF
機械学習応用システムの安全性の研究動向と今後の展望
PDF
[DL輪読会]自動運転技術の課題に役立つかもしれない論文3本
Tell Me What They’re Holding: Weakly Supervised Object Detection with Transfe...
論文紹介:Towards Robust Adaptive Object Detection Under Noisy Annotations
Automatic selection of object recognition methods using reinforcement learning
論文紹介 Fast imagetagging
【DL輪読会】ViT + Self Supervised Learningまとめ
Paper reading best of both world
教師なし画像特徴表現学習の動向 {Un, Self} supervised representation learning (CVPR 2018 完全読破...
物体検出の歴史(R-CNNからSSD・YOLOまで)
[DL輪読会]Generative Models of Visually Grounded Imagination
論文紹介:Learning from Noisy Pseudo Labels for Semi-Supervised Temporal Action Lo...
20140530.journal club
第3回WBAレクチャー:BRAに基づく海馬体の確率的生成モデルの構築
[論文紹介] BlendedMVS: A Large-scale Dataset for Generalized Multi-view Stereo Ne...
【DL輪読会】Pervasive Label Errors in Test Sets Destabilize Machine Learning Bench...
(文献紹介)デブラー手法の紹介
Rabbit challenge 3 DNN Day2
論文紹介:Masked Vision and Language Modeling for Multi-modal Representation Learning
機械学習応用システムの安全性の研究動向と今後の展望
[DL輪読会]自動運転技術の課題に役立つかもしれない論文3本
Ad

More from Deep Learning JP (20)

PPTX
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
PPTX
【DL輪読会】事前学習用データセットについて
PPTX
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
PPTX
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
PPTX
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
PPTX
【DL輪読会】マルチモーダル LLM
PDF
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
PPTX
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
PDF
【DL輪読会】Can Neural Network Memorization Be Localized?
PPTX
【DL輪読会】Hopfield network 関連研究について
PPTX
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
PDF
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
PPTX
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
PPTX
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
PDF
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
PPTX
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
PDF
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
PDF
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
PPTX
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
PPTX
【DL輪読会】VIP: Towards Universal Visual Reward and Representation via Value-Impl...
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】事前学習用データセットについて
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
【DL輪読会】マルチモーダル LLM
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
【DL輪読会】Can Neural Network Memorization Be Localized?
【DL輪読会】Hopfield network 関連研究について
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
【DL輪読会】VIP: Towards Universal Visual Reward and Representation via Value-Impl...

Recently uploaded (20)

PDF
Unlocking AI with Model Context Protocol (MCP)
PDF
Agricultural_Statistics_at_a_Glance_2022_0.pdf
PDF
The Rise and Fall of 3GPP – Time for a Sabbatical?
PPTX
sap open course for s4hana steps from ECC to s4
PDF
Optimiser vos workloads AI/ML sur Amazon EC2 et AWS Graviton
PDF
7 ChatGPT Prompts to Help You Define Your Ideal Customer Profile.pdf
PPTX
Programs and apps: productivity, graphics, security and other tools
PPT
“AI and Expert System Decision Support & Business Intelligence Systems”
PDF
Chapter 3 Spatial Domain Image Processing.pdf
PDF
Advanced methodologies resolving dimensionality complications for autism neur...
DOCX
The AUB Centre for AI in Media Proposal.docx
PPTX
Spectroscopy.pptx food analysis technology
PDF
gpt5_lecture_notes_comprehensive_20250812015547.pdf
PDF
Diabetes mellitus diagnosis method based random forest with bat algorithm
PPTX
KOM of Painting work and Equipment Insulation REV00 update 25-dec.pptx
PPTX
Big Data Technologies - Introduction.pptx
PDF
Electronic commerce courselecture one. Pdf
PDF
Machine learning based COVID-19 study performance prediction
PPTX
A Presentation on Artificial Intelligence
PDF
Per capita expenditure prediction using model stacking based on satellite ima...
Unlocking AI with Model Context Protocol (MCP)
Agricultural_Statistics_at_a_Glance_2022_0.pdf
The Rise and Fall of 3GPP – Time for a Sabbatical?
sap open course for s4hana steps from ECC to s4
Optimiser vos workloads AI/ML sur Amazon EC2 et AWS Graviton
7 ChatGPT Prompts to Help You Define Your Ideal Customer Profile.pdf
Programs and apps: productivity, graphics, security and other tools
“AI and Expert System Decision Support & Business Intelligence Systems”
Chapter 3 Spatial Domain Image Processing.pdf
Advanced methodologies resolving dimensionality complications for autism neur...
The AUB Centre for AI in Media Proposal.docx
Spectroscopy.pptx food analysis technology
gpt5_lecture_notes_comprehensive_20250812015547.pdf
Diabetes mellitus diagnosis method based random forest with bat algorithm
KOM of Painting work and Equipment Insulation REV00 update 25-dec.pptx
Big Data Technologies - Introduction.pptx
Electronic commerce courselecture one. Pdf
Machine learning based COVID-19 study performance prediction
A Presentation on Artificial Intelligence
Per capita expenditure prediction using model stacking based on satellite ima...

【DL輪読会】Standardized Max Logits: A Simple yet Effective Approach for Identifying Unexpected Road Obstacles in Urban-Scene Segmentation

  • 1. DEEP LEARNING JP [DL Papers] Standardized Max Logits: A Simple yet Effective Approach for Identifying Unexpected Road Obstacles in Urban-Scene Segmentation Yuting Lin, Kokusai Kogyo Co., Ltd.(国際航業) http://deeplearning.jp/ 1
  • 2. 書籍情報 • タイトル – Standardized Max Logits: A Simple yet Effective Approach for Identifying Unexpected Road Obstacles in Urban-Scene Segmentation • 著者 – Sanghun Jung*1 Jungsoo Lee*1 Daehoon Gwak1 Sungha Choi2 Jaegul Choo1 – 1KAIST AI 2LG AI Research • ICCV2021(oral)に採択 • Paper – https://openaccess.thecvf.com/content/ICCV2021/html/Jung_Standardized_Max_L ogits_A_Simple_yet_Effective_Approach_for_Identifying_ICCV_2021_paper.html • Code – https://github.com/shjung13/Standardized-max-logits 2
  • 3. 概要 • 提案手法の概要 – 道路等の都市環境にて、semantic segmentationにおける異常物体検出を対象 • 学習データとして定義されていないもの • OOD(Out-of-Distribution) – 簡単な解決策 • モデルの推定結果(確率)の活用 • クラスに依存するため、結果が不安定 – 本論文は、簡単な解決策を提案 • クラス間の推定結果を正規化 • 隣接の結果と照合し、結果を改善 • 別のデータセットや、再学習を要しない 3
  • 4. 既往研究 • Detecting unexpected objects in semantic segmentation – 異常クラスの学習に、別のデータセットを使用 • ImageNet上の物体をcropし、学習データに貼り付ける – 一般的OOD問題と扱う • 再学習が必要となる – 画像の再生成(resynthesis) • segmentationの結果から、元の画像を再現し、元画像との差分を異常物とする • 推論時間が長くなってしまう 4
  • 5. 既往研究 • Detecting unexpected objects in semantic segmentation – 学習済モデルのみ利用 • 通常物体の推定確率(MSP, maximum softmax probability)が異常物体より高い • MSPは高い確率を出す傾向があるため、異常物体の確率を高める恐れがある • max logit(softmax前の確率)は、クラス毎にrangeが異なる 5
  • 6. 提案手法の全体図 1. Max logitを取得し、class-wiseな正規化を行う  異常物体の確率は、一部のIn-distributionクラスより、高い可能性がある 2. 境界付近のfalse positiveを徐々に除去  境界付近のFPの確率は低い傾向  細かいFPに対し、local consistencyを利用してsmoothingを行う 6
  • 7. 提案手法 • Notation – Input image: 𝑋 = 𝑅3×𝐻×𝑊, – C=pre-defined class – logit output 𝐹 ∈ 𝑅𝐶×𝐻×𝑊 – max logit 𝐿 ∈ 𝑅𝐻×𝑊 – prediction 𝑌 ∈ 𝑅𝐻×𝑊 – at location h, w • 𝐿ℎ,𝑤 = max 𝑐 𝐹𝑐,ℎ,𝑤 • 𝑌ℎ,𝑤 = argmax 𝑐 𝐹𝑐,ℎ,𝑤 7
  • 8. 提案手法 • Standardized Max Logits (SML) in class-wise manner – 学習サンプルから、各クラスのmax logitの平均𝜇𝑐と分散𝜎𝑐 2を取得しておく – where i=training sample, は指示関数 – テスト画像の各画素に対し、SMLを計算 8
  • 9. 提案手法 • Enhancing with Local Semantics – Iterative boundary suppression – 境界に隣接しない画素のSMLを境界画素に伝播し、段階的に境界を縮小させ、境界 あたりのfalse positiveとfalse negativeを段階的に除去 • i-th iterationのboundary widthをriとする(ハイパラ) • non-boundary maskを生成:該当画素の分類結果が同じかつ、距離< ri 9
  • 10. 提案手法 • Enhancing with Local Semantics – Iterative boundary suppression – 境界に隣接しない画素のSMLを境界画素に伝播し、段階的に境界を縮小させ、境界 あたりのfalse positiveとfalse negativeを段階的に除去 • 境界画素に、boundary-aware average poolingを適用 • boundary width ri はΔ2, iteration=4, r0=8 10
  • 11. 提案手法 • Enhancing with Local Semantics – Dilated smoothing – 細かい誤検出の分類確率が低い/高い場合、前の方法は除去できない – local consistencyを利用し、dilated Gaussian kernelで除去 – where k=7, dilation rate=6, σ=1 11
  • 12. 実験 -データセット • Fishyscapes Lost & Found – Cityscapesの画像に、本物の異常物(from Lost & Found DS)を合成 • Fishyscapes Static – Cityscapesのvalidationデータに、PASCAL VOCの物体を異常物体として合成 • Road Anomaly – 60サンプルのみだが、様々な道路シーンがあり、チャレンジングなDS 12 Fishyscapes Road Anomaly
  • 13. 実験の設定 • Cityscapesで学習したDeepLabv3+を使用(backboneはResNet101) • 評価基準 – AUROC: area under receiver operating characteristics – AP – FPR95: false positive rate at a true positive rate of 95% 13
  • 14. 実験結果 • Fishyscapes leaderboardとの比較 – 別情報・再学習が必要な手法と比較しても劣っていない – 同条件の手法において、SOTA 14
  • 17. 実験 – ablation study • SMLが最も効果的 – MSPは、異常物体とin-distributionをうまく分類できない可能性がある – Max logitは、クラスに依存し、不安定になる • Iterative boundary suppressionがない場合、確率の低いnon-boundary画素 は、boundary画素のSMLが伝播されてしまう可能性がある 17
  • 18. 考察 • Semantic segmentationへの影響 – 元のsegmentation結果は大きく劣化していない – 提案手法の実用性が高い 18
  • 21. まとめ • 本論文は、semantic segmentationにおける異常物体を検出するシンプルな 手法を提案 • Standardized Max Logitは、(in-distribution)クラス間の違いを考慮した異常 物体の確率を推定 • Iterative boundary suppressとDilated smoothingで、false positiveとfalse negativeを削減し、性能を向上 • 提案手法は、再学習と、追加のOODデータセットが不要で、計算量も少ない • 十分な実験を行い、提案手法の有効性を検討 21