SlideShare a Scribd company logo
6
Most read
14
Most read
16
Most read
深層学習におけるデータ拡張の原理と最新動向
2021.6.10
中山 英樹(東京大学)
幡谷 龍一郎(東京大学)
 前半)データ拡張とは
◦ データ拡張の例
◦ なぜうまくいくのか
◦ 画像データ拡張のアプローチ
 後半)データ拡張の自動設計法
2
目次
データ拡張 (data augmentation) とは
3
もっとたくさん欲しい
学習データ
の変わらないような変換 を用意し、変換画像も訓練に用いる
ネコであることは変わらな
い画像変換
教師付き学習
データ ラベル
「実質」のデータ数を増やすことで汎化性能を向上させる
損失関数
例:画像分類
 AlexNet [Krizhevsky+ 12] 以来,様々な分野で成果を発揮
4
深層学習とデータ拡張
[Baird 93]
[Yeager+ 96]
[Simard+ 91]
 90年代から文字認識のために利用されてきた
AlexNetは6,000万のパラメータがあり,120万枚の画像に過適合する
データ拡張+Dropoutによる正則化が重要
表現学習への応用
5
FixMatch [Sohn+20]
各クラスに4枚しかラベル
付き画像がなくても90%
近い精度
近づける
SimCLR [Chen+20]
近づける 遠ざける
ラベルなしでも教師あり
学習に近い表現を獲得
意味に対して不変な変換後の画像の特徴表現が近くなるように
特徴抽出ネットワークを学習 [Bengio +13]
半教師あり学習: ラベルが一部しかない設定で学習
自己教師あり学習: ラベルがない設定で良い表現を学習
他分野での例(自然言語処理)
 Easy Data Augmentation [Wei&Zou 19]
特にデータ少ない場合に有効
 構文木の利用 [Şahin&Steedman 18] 「切り抜き」:主要でない木の部位を削除
「回転」:順番を入れ替え
6
なぜうまくいくのか?
7
 ①データ分布を埋めることによる正則化
 ②タスクに関する事前知識をデータの外から与えている
◦ 「同じさ」は対象物によって異なる
?
=
データ拡張の方法を設計するときは、①・②のどちらの
効果を与えるものかを考えることが大事
適当にデータを増やせばよいというものではない(錬金術ではない!)
「データ拡張ならでは」
の効果としてはこちらが
特に大事
(講演者の意見)
画像データ拡張のアプローチ①:経験的な変換
8
 基本的な画像処理
0.7 ネコ
0.3 + 0.7
0.3 イヌ
反転 クロップ 平行移動 回転 色調変化
 mixup [Zhang+ 18] [Tokozume+, 18]
◦ 二枚の画像とラベルを線形に混合
 Cutout [DeVries+ 17] [Zhong+, 17]
◦ ランダムに画像の一部を矩形でマスク
画像データ拡張のアプローチ②:生成モデルの利用
9
 画像生成モデルの発展 e.g., BigGAN [Brock+ 19]
実は生成画像
 注:画像生成によるデータ拡張はまだ十分に確立されてはいない
◦ 特に、生成画像は高周波成分が実画像と異なる [Daznic+ 20]
→ そのままではデータ拡張には不向き? [Ravuri&Vinyals 19]
画像データ拡張のアプローチ②:生成モデルの利用
1
0
視線推定タスクでの性能向上
 シミュレータとの組合せ [Shrivastava+ 17]
◦ CG画像を実画像へ変換
 条件付きGANの利用 [Han+ 19]
◦ 位置・大きさ等を指定した
腫瘍画像生成
いずれの場合も、元の画像データセット
以外の情報を入れていることが重要
1
0
データ拡張の課題
11
 適切なデータ拡張ポリシーの設計は難しい
◦ 通常、タスクごとに設計者の試行錯誤を要する
反転 クロップ 平行移動 回転 色調変化
・・・
どの変換を使う?どのくらいの強さ?どれくらいの頻度?
データ拡張を自動的に設計することはできないだろうか?
深層学習におけるデータ拡張の原理と最新動向
幡谷龍一郎
1
画像認識のためのデータ拡張の高速な設計
データ拡張 (Data Augmentation) とは
2
ラベルの変わらないような画像変換 aφ : x !→ x′
!→
例:左右反転 aφ
動物画像分類:同一のラベル
を用意
!→ 文字画像分類:異なるラベル
データ数が多いほど機械学習モデルの性能は向上
→ 現実にはデータ数は容易には増やせない
画像変換によって実質的なデータ数を増やす
必要な画像変換はデータ・タスクに依存
d d
画像のデータ拡張
3
強度
確率
組合せ
pRot
1 − pRot
rotate( ⋅ ; μRot)
pInv
1 − pInv
invert( ⋅ ; )
pInv
1 − pInv
solarize
rotate
translate_x
invert
画像変換の集合
solarize
多様な画像が得られる
→実質データ数が増えて性能向上
パラメータ 例:評価損失最小化
データ拡張戦略の設計は「組合せ」「確率」「強度」の最適化
データ拡張戦略の自動設計
4
非常に広大な探索空間
∼ の可能な組合せ
→ 強化学習やベイズ最適化などの利用
1032
1064
CNNの学習に時間がかかる
→小さなCNNや学習データの一部のみの使用で代用
ただしAutoAugmentは探索が高コスト
CIFAR-10 Baseline AA
error rates 3.1 2.6
AutoAugment [Cubuk+19]
(CIFAR-10には5000GPU時間)
→ 高速化の研究が進められてきた
データ拡張戦略の自動設計
5
非常に広大な探索空間
∼ の可能な組合せ
→ 強化学習やベイズ最適化などの利用
1032
1064
CNNの学習に時間がかかる
→小さなCNNや学習データの一部のみの使用で代用
ただしAutoAugmentは探索が高コスト
CIFAR-10 Baseline AA
error rates 3.1 2.6
AutoAugment [Cubuk+19]
(CIFAR-10には5000GPU時間)
→ 高速化の研究が進められてきた
→ 戦略を微分可能にすることで
勾配降下法による高速化
→CNNの学習の繰り返しを
 避けることで高速化
Faster AutoAugmentは
精度劣化なしに15分程度で探索可能
Faster AutoAugment [Hataya+2020]
6
戦略
元画像 変換後の画像
分布間距離
誤差逆伝播
+ 分類損失
元画像と変換後の画像を近づける 変換がクラスを変えないように制限
強度
確率
組合せ
pRot
1 − pRot
rotate( ⋅ ; μRot)
pInv
1 − pInv
invert( ⋅ ; )
pInv
1 − pInv
solarize
rotate
translate_x
invert
画像変換の集合
solarize
Faster AutoAugment [Hataya+2020]
Faster AutoAugment [Hataya+2020]
• データ拡張の目的は分布の一致
7
元画像の分布 変換画像の分布
データ拡張では変換画像によって
元画像分布の欠損を補いたい
• GANの損失の応用
戦略
元画像 変換後の画像
元画像 or 変換画像?
誤差逆伝播
実験結果
• 探索時間の比較 (GPU時間)
• 戦略の性能比較(テスト誤差率)*
8
Dataset AA Fast AA Faster AA
CIFAR-10 5,000 3.5 0.23
SVHN 1,000 1.5 0.061
ImageNet 15,000 450 2.3
Dataset Baseline AA Fast AA Faster AA
CIFAR-10 3.1 2.6 2.7 2.6
CIFAR-100 18.8 17.1 17.3 17.3
SVHN 1.3 1.1 1.1 1.2
ImageNet 23.7 22.4 22.4 22.7
Faster AutoAugmentは極めて高速に探索が可能
Faster AutoAugmentの戦略は先行研究とほぼ同等
* ImageNetではResNet-50 [He+16],そのほかのデータでは WRN28-10 [Zagoruyko&Komodakis 17] を使用
AA:AutoAugment [Cubuk+ 2019]
Fast AA:Fast AutoAugment [Lim+ 2019]
実験結果
9
Dataset ランダム Faster AA
CIFAR-100 21.6 20.9
戦略の学習は必要?*
Dataset 分類損失なし Faster AA
CIFAR-100 21.5 20.9
分類損失は必要?*
* WRN40-2 [Zagoruyko&Komodakis 17] を使用
戦略
元画像 変換後の画像
分布間距離
誤差逆伝播
+ 分類損失
元画像と変換後の画像を近づける 変換がクラスを変えないように制限
まとめ
10
データ数が多いほど機械学習モデルの性能は向上
→ 現実にはデータ数は容易には増やせない
画像変換で「実質的な」データ数を増やすデータ拡張が有効
有効なデータ拡張戦略を自動設計する手法が登場
→特に微分可能なデータ拡張戦略は高速に探索可能
https:!"github.com/moskomule/dda
https:!"github.com/albumentations-team/autoalbument
Faster AutoAugmentについて
実装:
問合せ: hataya@nlab.c.i.u-tokyo.ac.jp

More Related Content

PPTX
Curriculum Learning (関東CV勉強会)
PPTX
モデル高速化百選
PPTX
Triplet Loss 徹底解説
PDF
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
PPTX
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
PDF
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
PDF
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
PPTX
[DL輪読会]相互情報量最大化による表現学習
Curriculum Learning (関東CV勉強会)
モデル高速化百選
Triplet Loss 徹底解説
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
[DL輪読会]相互情報量最大化による表現学習

What's hot (20)

PDF
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
PPTX
Transformerを雰囲気で理解する
PDF
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
PDF
三次元表現まとめ(深層学習を中心に)
PDF
機械学習モデルの判断根拠の説明
PPTX
【DL輪読会】時系列予測 Transfomers の精度向上手法
PPTX
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
PDF
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
PDF
Domain Adaptation 発展と動向まとめ(サーベイ資料)
PDF
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
PDF
Transformer メタサーベイ
PDF
Transformerを多層にする際の勾配消失問題と解決法について
PDF
Neural networks for Graph Data NeurIPS2018読み会@PFN
PDF
ドメイン適応の原理と応用
PDF
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
PPTX
近年のHierarchical Vision Transformer
PDF
自己教師学習(Self-Supervised Learning)
PDF
SSII2019企画: 点群深層学習の研究動向
PDF
【メタサーベイ】基盤モデル / Foundation Models
PPTX
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
Transformerを雰囲気で理解する
SSII2022 [SS1] ニューラル3D表現の最新動向〜 ニューラルネットでなんでも表せる?? 〜​
三次元表現まとめ(深層学習を中心に)
機械学習モデルの判断根拠の説明
【DL輪読会】時系列予測 Transfomers の精度向上手法
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
【DL輪読会】How Much Can CLIP Benefit Vision-and-Language Tasks?
Domain Adaptation 発展と動向まとめ(サーベイ資料)
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
Transformer メタサーベイ
Transformerを多層にする際の勾配消失問題と解決法について
Neural networks for Graph Data NeurIPS2018読み会@PFN
ドメイン適応の原理と応用
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
近年のHierarchical Vision Transformer
自己教師学習(Self-Supervised Learning)
SSII2019企画: 点群深層学習の研究動向
【メタサーベイ】基盤モデル / Foundation Models
[DL輪読会]ドメイン転移と不変表現に関するサーベイ
Ad

Similar to SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向 (13)

PPTX
大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック
PPTX
[DL輪読会]AutoAugment: LearningAugmentation Strategies from Data & Learning Data...
PDF
文献紹介:CutDepth: Edge-aware Data Augmentation in Depth Estimation
PPTX
Hello deeplearning!
PDF
2019/5/24 Chainer familyで始める深層学習 ハンズオンの部
PDF
数学で解き明かす深層学習の原理
PDF
AutoAugment:Learning AUgmentation Policies from Data
PDF
NVIDIA Seminar ディープラーニングによる画像認識と応用事例
PDF
ビッグデータ・AI 活用最前線:「Data Augmentation (データ拡張)」という新しい常識
PDF
Fast autoaugment
PDF
Ibis2016okanohara
PDF
Fast AutoAugment
PDF
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
大域的探索から局所的探索へデータ拡張 (Data Augmentation)を用いた学習の探索テクニック
[DL輪読会]AutoAugment: LearningAugmentation Strategies from Data & Learning Data...
文献紹介:CutDepth: Edge-aware Data Augmentation in Depth Estimation
Hello deeplearning!
2019/5/24 Chainer familyで始める深層学習 ハンズオンの部
数学で解き明かす深層学習の原理
AutoAugment:Learning AUgmentation Policies from Data
NVIDIA Seminar ディープラーニングによる画像認識と応用事例
ビッグデータ・AI 活用最前線:「Data Augmentation (データ拡張)」という新しい常識
Fast autoaugment
Ibis2016okanohara
Fast AutoAugment
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
Ad

More from SSII (20)

PDF
SSII2022 [TS3] コンテンツ制作を支援する機械学習技術​〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜​
PDF
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
PDF
SSII2022 [OS3-04] Human-in-the-Loop 機械学習
PDF
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
PDF
SSII2022 [OS3-02] Federated Learningの基礎と応用
PDF
SSII2022 [OS3-01] 深層学習のための効率的なデータ収集と活用
PDF
SSII2022 [OS2-01] イメージング最前線
PDF
SSII2022 [OS1-01] AI時代のチームビルディング
PDF
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
PDF
SSII2021 [SS2] Deepfake Generation and Detection – An Overview (ディープフェイクの生成と検出)
PDF
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
PDF
SSII2021 [TS3] 機械学習のアノテーションにおける データ収集​ 〜 精度向上のための仕組み・倫理や社会性バイアス 〜
PDF
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
PDF
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
PDF
SSII2021 [OS3-03] 画像と点群を用いた、森林という広域空間のゾーニングと施業管理
PDF
SSII2021 [OS3-02] BIM/CIMにおいて安価に点群を取得する目的とその利活用
PDF
SSII2021 [OS3-01] 設備や環境の高品質計測点群取得と自動モデル化技術
PDF
SSII2021 [OS3] 広域環境の3D計測と認識 ~ 人が活動する場のセンシングとモデル化 ~(オーガナイザーによる冒頭の導入)
PDF
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
PDF
SSII2021 [OS1-03] エネルギーの情報化:需要家主体の分散協調型電力マネージメント
SSII2022 [TS3] コンテンツ制作を支援する機械学習技術​〜 イラストレーションやデザインの基礎から最新鋭の技術まで 〜​
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
SSII2022 [OS3-04] Human-in-the-Loop 機械学習
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
SSII2022 [OS3-02] Federated Learningの基礎と応用
SSII2022 [OS3-01] 深層学習のための効率的なデータ収集と活用
SSII2022 [OS2-01] イメージング最前線
SSII2022 [OS1-01] AI時代のチームビルディング
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
SSII2021 [SS2] Deepfake Generation and Detection – An Overview (ディープフェイクの生成と検出)
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII2021 [TS3] 機械学習のアノテーションにおける データ収集​ 〜 精度向上のための仕組み・倫理や社会性バイアス 〜
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [OS3-03] 画像と点群を用いた、森林という広域空間のゾーニングと施業管理
SSII2021 [OS3-02] BIM/CIMにおいて安価に点群を取得する目的とその利活用
SSII2021 [OS3-01] 設備や環境の高品質計測点群取得と自動モデル化技術
SSII2021 [OS3] 広域環境の3D計測と認識 ~ 人が活動する場のセンシングとモデル化 ~(オーガナイザーによる冒頭の導入)
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS1-03] エネルギーの情報化:需要家主体の分散協調型電力マネージメント

Recently uploaded (9)

PDF
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
PDF
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
PDF
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
PDF
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
PDF
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
PDF
液体クラトム抽出物供給側分析:世界の生産能力・販売量・平均価格動向(2025-2031)
PDF
口腔内スキャナー市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
PDF
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
PDF
Qlik TECH TALK セミナー:What's New In Qlik ~ 2025年7月リリース最新機能のご紹介
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
液体クラトム抽出物供給側分析:世界の生産能力・販売量・平均価格動向(2025-2031)
口腔内スキャナー市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
Qlik TECH TALK セミナー:What's New In Qlik ~ 2025年7月リリース最新機能のご紹介

SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向