SlideShare a Scribd company logo
株式会社 古川
ニューラルネットワークを用いた
画像生成技術・教師なし特徴量学習
UNSUPERVISED REPRESENTATION LEARNING
WITH DEEP CONVOLUTIONAL
GENERATIVE ADVERSARIAL NETWORKS
(Alec Radford & Luke Metz et al. 2015)
Nextremer Inc.
注意事項
・資料の信憑性などについて責任を負いません
・何か著作権上の問題やその他のご指摘があれば
ご連絡ください
If you have any problem, let me know.
tomohiro.furukawa (atmark) nextremer.com
Nextremer Inc.
構成
・Generative Adversarial Networks
              (GAN)
・Deep Convolutional GAN
・実験結果・考察
・実装例 
・まとめ
Nextremer Inc.
Generative Adversarial Networks
2つのニューラルネットを戦わせる
ランダム
ベクトル
認識・生成を交互に学習し精度向上
本物の
画像
生成
画像
Discriminator(正確に識別したい)
Generator(本物に近く生成したい)
画像が
本物か偽物か
識別
Nextremer Inc.
Generative Adversarial Networks
( Generative Adversarial Nets , 2014, Ian J. Goodfellow et al より引用)
+
生成画像
G生成ネットは関数を小さくするように学習
識別関数=D識別ネットが正しい識別を行う度合い
生成画像が本物である確率
本物の画像が本物である確率
Nextremer Inc.
Generative Adversarial Networks
( Generative Adversarial Nets , 2014, Ian J. Goodfellow et al より引用)
k回識別ネット、1回生成ネットの学習を繰り返す
Nextremer Inc.
Laplacian Generative Adversarial Networks
画像を周波数ごとに分けて識別・生成させるGAN
<画像の周波数>
明るさの変化の周期を波としてとらえる
Nextremer Inc.
Laplacian Generative Adversarial Networks
画像を周波数ごとに分けて識別・生成させるGAN
Laplacian Pyramidの詳細については
The Laplacian Pyramid as a Compact Image Code
1983 P.J.Burt et al. を参照のこと
Nextremer Inc.
Deep Convolutional GAN
特別な構造を持ったGenerative Adversarial Nets
・プーリング層を畳み込み層に置き換え
 生成ネットではfractionally-strided畳み込み層
・batch normalizationを行う
 (バッチ単位で各層への入力を正規化)
・全結合層を排除
・活性化関数をReluとする(最終層のみTanh)
・識別ネットでは全層にてLeakyReLUを使用
Nextremer Inc.
Deep Convolutional GAN
<fractionally-stridedとは>
他の論文のdeconvolutionと同義だと思われる
1.逆プーリング
2.畳み込み
p q
r s
p q
r s
0
00
0
00
0
00
0
00
p q
r s
0
00
0
00
0
00
0
00
0で埋める
h12h11 h13
h22h21 h23
h32h31 h33
✖ ✖ チャネル数
フィルタ
Nextremer Inc.
Deep Convolutional GAN
( Empirical Evaluation of Rectified Activations in Convolution
Network , 2015, Bing Xu et al より引用)
<Leaky Reluとは>
通常のReluと異なり
0以下の場合に
勾配をつけて処理
本論文の勾配は0.2
Nextremer Inc.
Deep Convolutional GAN
・入力は100要素のランダムベクトル
・4つのfractionally-strided convolution層
・64 x 64ピクセルの画像を生成
LSUNデータセットに使われた生成ネットワーク
Nextremer Inc.
実験結果 
Nextremer Inc.
識別ネットを特徴抽出器とした分類精度検証 
ImagenetデータセットでDCGANを訓練したにもかかわらず
Cifar10データセットに対して他の分類手法と比較して高精度
Nextremer Inc.
画像生成結果
・ノイズが見られることから過学習ではないと言える
(画像をそのまま記憶はしていない)
5エポック学習後、生成されたベッドルームの画像
Nextremer Inc.
識別ネットワークのback propagation
Reluの順伝播
<guided backpropagation>
back
propagation
deconvnet
guided
backpropagation
順伝播で
マイナスの要素を
ゼロにする
マイナスの要素を
ゼロにする
上記を両方行う
( STRIVING FOR SIMPLICITY: THE ALL CONVOLUTIONAL NET , 2014,
Springenberg et al より引用)
Nextremer Inc.
・学習済み識別ネットワークでは
ベッドの特徴を捉えていることがわかる
学習なしフィルタ  学習済みフィルタ
識別ネットワークのback propagation
Nextremer Inc.
窓なしベッドルーム画像の生成
1. 窓のある画像とない画像を生成
2. 生成ネットワークの出力から
 どのユニットが窓に関するものかを判別
3. 窓に関するユニットを排除して、窓のない画像を生成
元画像
窓なし
生成画像
Nextremer Inc.
画像の足し算・引き算
メガネの男性 男性 女性 メガネの女性
生成ネットワークに投入する
Zベクトルを足し算・引き算
1つのベクトルだけでは
出力結果が不安定になるので
3つを平均している
Nextremer Inc.
実装 
Nextremer Inc.
Githubソースコード
https://github.com/Newmu/dcgan_code
tensorflow版を使用
Mac OSXにてtheano, tensorflow, chainerを
入れようと試したがうまくいかなかった
OS : Ubuntu
Tensorflow 0.6.0は
 CUDA : 7.0かつ、cuDNNv2でなければならない
<実行環境>
theano…cuDNNとの連携ができない
chainer…cupyがimportできない など
(学習パラメータは元コードから変更なし)
Nextremer Inc.
データ画像と結果
<花> 約1350枚 x 水増し20=27200枚を入力
(データの水増し=彩度変更・回転などで画像枚数を増幅)
8エポック後の
生成画像
Nextremer Inc.
まとめ
・Deep Convolutional GANという
 特定の構造を持ったGANによって
 従来よりノイズの少ない画像生成に成功
・画像生成の元ベクトルzから
 画像の意味を表現でき演算が可能
Nextremer Inc.
会社紹介
社員数 15名 設立 2012年10月
事業内容 人工知能テクノロジーを
     取り入れた対話システムの開発
開発技術 自然言語処理・画像認識
PR用対話ロボット
 A.I.Samurai
Nextremer Inc.
機械学習エンジニア募集中
wantedlyにて
Nextremer
で検索

More Related Content

PDF
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
PDF
DeNAにおける機械学習・深層学習活用
PDF
Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3
PDF
コンピュータビジョンの研究開発状況
PPTX
【機械学習勉強会】画像の翻訳 ”Image-to-Image translation”
PPTX
[DL輪読会] MoCoGAN: Decomposing Motion and Content for Video Generation
PDF
FeUdal Networks for Hierarchical Reinforcement Learning
PDF
ECCV2020 オーラル論文完全読破 (2/2)
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
DeNAにおける機械学習・深層学習活用
Adversarial Networks の画像生成に迫る @WBAFLカジュアルトーク#3
コンピュータビジョンの研究開発状況
【機械学習勉強会】画像の翻訳 ”Image-to-Image translation”
[DL輪読会] MoCoGAN: Decomposing Motion and Content for Video Generation
FeUdal Networks for Hierarchical Reinforcement Learning
ECCV2020 オーラル論文完全読破 (2/2)

What's hot (20)

PDF
動画認識サーベイv1(メタサーベイ )
PDF
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
PDF
NIPS2017読み会@PFN: Hierarchical Reinforcement Learning + α
PDF
これから始める人の為のディープラーニング基礎講座
PDF
Towards Performant Video Recognition
PPTX
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
PDF
Deep learningの概要とドメインモデルの変遷
PDF
動画認識における代表的なモデル・データセット(メタサーベイ)
PDF
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
PDF
優れた問いを見つける(中京大学講演)
PPTX
深層強化学習入門
PDF
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
PDF
MIRU2018 tutorial
PDF
【CVPR 2019】SPADE: Semantic Image Synthesis with Spatially-Adaptive Normalization
PDF
cvpaper.challenge -CVの動向とこれからの問題を作るために- (東京大学講演)
PDF
CVPR 2018 速報
PDF
モデルアーキテクチャ観点からのDeep Neural Network高速化
PPTX
CNNチュートリアル
PDF
Vision and Language(メタサーベイ )
PPTX
深層学習とTensorFlow入門
動画認識サーベイv1(メタサーベイ )
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
NIPS2017読み会@PFN: Hierarchical Reinforcement Learning + α
これから始める人の為のディープラーニング基礎講座
Towards Performant Video Recognition
CVPR 2015 論文紹介(NTT研究所内勉強会用資料)
Deep learningの概要とドメインモデルの変遷
動画認識における代表的なモデル・データセット(メタサーベイ)
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
優れた問いを見つける(中京大学講演)
深層強化学習入門
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
MIRU2018 tutorial
【CVPR 2019】SPADE: Semantic Image Synthesis with Spatially-Adaptive Normalization
cvpaper.challenge -CVの動向とこれからの問題を作るために- (東京大学講演)
CVPR 2018 速報
モデルアーキテクチャ観点からのDeep Neural Network高速化
CNNチュートリアル
Vision and Language(メタサーベイ )
深層学習とTensorFlow入門
Ad

Viewers also liked (20)

PDF
現在のDNNにおける未解決問題
PPTX
打倒 PaintsChainer おうちで始めるDCGAN
PDF
Unsupervised learning represenation with DCGAN
PPTX
A (Very) Gentle Introduction to Generative Adversarial Networks (a.k.a GANs)
PDF
Generative adversarial networks
PPTX
CNNの可視化手法Grad-CAMの紹介~CNNさん、あなたはどこを見ているの?~ | OHS勉強会#6
PDF
An Introduction to Metric Learning for Clustering
PDF
Improving neural networks by preventing co adaptation of feature detectors
PDF
Distance Metric Learning
PDF
Metric learning ICML2010 tutorial
PDF
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...
PDF
Information-Theoretic Metric Learning
PPTX
Image net classification with Deep Convolutional Neural Networks
PPTX
勾配降下法の 最適化アルゴリズム
PDF
Deep Residual Learning (ILSVRC2015 winner)
PDF
機械学習プロフェッショナルシリーズ 深層学習 chapter3 確率的勾配降下法
PDF
20150930
PDF
Argmax Operations in NLP
PDF
最先端NLP勉強会 “Learning Language Games through Interaction” Sida I. Wang, Percy L...
PDF
Generative adversarial networks
現在のDNNにおける未解決問題
打倒 PaintsChainer おうちで始めるDCGAN
Unsupervised learning represenation with DCGAN
A (Very) Gentle Introduction to Generative Adversarial Networks (a.k.a GANs)
Generative adversarial networks
CNNの可視化手法Grad-CAMの紹介~CNNさん、あなたはどこを見ているの?~ | OHS勉強会#6
An Introduction to Metric Learning for Clustering
Improving neural networks by preventing co adaptation of feature detectors
Distance Metric Learning
Metric learning ICML2010 tutorial
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...
Information-Theoretic Metric Learning
Image net classification with Deep Convolutional Neural Networks
勾配降下法の 最適化アルゴリズム
Deep Residual Learning (ILSVRC2015 winner)
機械学習プロフェッショナルシリーズ 深層学習 chapter3 確率的勾配降下法
20150930
Argmax Operations in NLP
最先端NLP勉強会 “Learning Language Games through Interaction” Sida I. Wang, Percy L...
Generative adversarial networks
Ad

Deep Convolutional Generative Adversarial Networks - Nextremer勉強会資料