SlideShare a Scribd company logo
Deeply-Recursive	Convolutional	
Network	for	Image	Super-
Resolution
北海道⼤学⼤学院 情報科学研究科 情報理⼯学専攻
複雑系⼯学講座 調和系⼯学研究室
修⼠1年 桶智輝
論⽂情報
タイトル
– Deeply-Recursive	Convolutional	Network
for	Image	Super-Resolution
発表学会
– CVPR2016
被参照数
– 45件(2017/6/26)
著者
– Jiwon Kim,	Jung	Kwon	Lee	and	Kyoung Mu	Lee
(Department	of	ECE,	ASRI,	Seoul	National	University,	Korea)
2
概要
画像を⼤きく、輪郭をシャープに
= 低解像度の画像を⾼解像度に変換!
低解像度 ⾼解像度
3
先⾏研究
VDSR	[CVPR2016]
– Very	DeepなCNNでSRに成功している論⽂
– 同じ構造の畳込み層を20層重ねた構造
※ SR:超解像技術(Super-Resolution)
20回同じ構造の畳み込み層を繰り返し
…
低解像度 ⾼解像度
Conv3x3-64	/	relu
4
先⾏研究
VDSR	[CVPR2016]
– Very	DeepなCNNでSRに成功している論⽂
– 同じ構造の畳込み層を20層重ねた構造
※ SR:超解像技術(Super-Resolution)
20回同じ構造の畳み込み層を繰り返し
層とパラメータを1つの層にして再帰すればいいのでは?
…
低解像度 ⾼解像度
Conv3x3-64	/	relu
5
ネットワークの設計⽅針1
受容野が広くなるように設計
– 受容野の広さ=情報量
– SRにおいて情報量は⾼解像度に復元するための鍵
狭い受容野の情報量 広い受容野の情報量
6
ネットワークの設計⽅針1
受容野が広くなるように設計
– 受容野の広さ=情報量
– SRにおいて情報量は⾼解像度に復元するための鍵
狭い受容野の情報量 広い受容野の情報量
7
ネットワークの構成⽅針2
受容野を広くするための2つの⽅法
1 1 2 4
5 6 7 8
3 2 1 0
1 2 3 4
6 8
3 4
畳み込み層の使⽤
• 層がパラメータを持つ
• パラメータの増加は
学習を難しくする
プーリング層の使⽤
• パラメータは持たない
• Max-Poolingでは
最⼤値以外の情報を失う
8
ネットワークの構成⽅針2
受容野を広くするための2つの⽅法
Deep	Recursive	NN では
パラメータを増やさずに畳み込み層を増やす事ができる
畳み込み層の使⽤
• 層がパラメータを持つ
• パラメータの増加は
学習を難しくする
9
従来のDeep	Recursive	NNの問題点
1. 浅い(3層が限界)
2. 次元が下がる
3. 過学習
Eigen	et	al.(ICLR	WS2014),	Liang	et	al.(CVPR	2015)
本論⽂で提案する
Deeply	Recursive	Convolutional	Network(DRCN)は上記
の問題を解決
10
ベースとなるアプローチ
同じ層を再帰的(最⼤16回)に⽤いることで
Very	Deepなネットワーク構造を実現
– 何度も畳み込みを⾏うことで受容野を広く
– パラメータを増やさずに畳み込み回数を増やしている
𝑓"#$"% 𝑔 𝑓'"()*
11
ベースとなるアプローチ
• Inference	Network内の畳
み込み層の
パラメータは共有
• ⼊出⼒マップ
𝐻*	 𝑛 = −1,0, . . , 𝐷 + 1
のサイズは⼀定
12
学習上の問題点
DeepなRecursive	CNNを学習させるのは難しい
1. 勾配発散・消失問題
2. 適切な再帰回数の決定
これらの問題を解決するように改善
1. Skip-connection
• ⼊⼒画像を直接Reconstruction	Netに加える
2. Recursive-supervision
• Inference	Netで⾏われる再帰毎の出⼒マップを保存し、
Reconstruction	Netの出⼒をensembleしてFinal	Outputとする
13
改善したアプローチ1 ー Skip-connection
• ⼊⼒画像を直接Reconstruction	Netに⼊⼒
SRでは⼊⼒画像は正解データとの相関が⾼いため、推測に重要
深い構造でも⼊⼒が消失や発散することなく、推測に利⽤可能
14
改善したアプローチ2 ー Recursive-supervision
• 再帰毎の出⼒𝐻*を保持し、Reconstruction	Netに⼊⼒
• 全てのOutputをensembleし、Final	Outputを決定
全ての再帰回数のOutputからFinal	Outputを決定するため、
適切な再帰回数を設定する必要がない
15
改善したアプローチ3 ー 数式では
• 再帰回数dでの出⼒ 𝑦7%(Output	d)
– 𝑦9% = 𝑓'"()* 𝑥, 𝑔 %
𝑓"#$"% 𝑥 , 𝑑 = 1,2,3, … 𝐷
• 最終出⼒(Final	Output)
– 𝑦7 = Σ%@A
B
𝜔% D 𝑦7%
16
誤差関数の設計
Immidiate	Outputの誤差
– 𝑙A 𝜃 = Σ%@A
B
ΣG@A
H A
IBH
||𝑦 K − 𝑦7%
(K)
||I
Final	Output	の誤差
– 𝑙I 𝜃 = ΣG@A
H
||𝑦 K − Σ%@A
B
𝜔% D 𝑦7%
(K)
||I
Total	の誤差
– 𝐿 𝜃 = 𝛼𝑙A 𝜃 + 1 − 𝛼 𝑙I 𝜃 + 𝛽||𝜃||I
• 𝛼:中間出力の重み
• 𝛽:Weight	Decayの係数
17
Training	Data
91枚の鮮明な画像データセット(Yang	et	al.)
41x41のサイズでstrideを21取って切り取ったもの
18
Test	Data
4種類のデータセット
– Set5,	Set14,	B100,	Urban100
19
評価指標
⼈間の⽬で⾒たとき重要となるのは輝度
• PSNR(ピーク信号対雑⾳⽐)
– 𝑃𝑆𝑁𝑅 = 10 D logAY
Z[]
^
Z_`
• 𝑀𝐴𝑋d:⾼解像度画像の輝度の最⼤値
• 𝑀𝑆𝐸:⾼解像度画像と低解像度画像の間での輝度の平均⼆乗誤差
– 値が⼤きいほど雑⾳が少ない(=よい)
• SSIM(Structural	similarity)
– 輝度値、コントラスト、構造の3つの変化を評価するも
の
20
実験結果1
再帰回数による影響
– 縦軸:PSNR
– 横軸:ネットワークの再帰回数
再帰回数が多いほどPSNRは⼤きくなった
21
実験結果2
Ensembleによる影響
– 縦軸:PSNR
– 横軸:選択した再帰層の回数
• 問題によって最適な再帰回数は異なった
• Ensembleしたものが最もPSNRが⾼くなった
点線:Ensembleした
Final	OutputのPSNR
⾚:2倍のサイズ
緑:3倍のサイズ
⻘:4倍のサイズ
ネットワークはすべて
16回再帰する構造
22
実験結果3
23
実験結果4
24
実験結果5
25
実験結果6
26
まとめ
1. 新しいSRのネットワーク
Deeply-Recursive	Convolutional	Networkを提案
– 層を追加してもパラメータは増えない
2. 学習を安定させるための構造
Recursive-supervisionとSkip-connectionを提案
3. State-of-the-artな性能を発揮
4. ⼊⼒や中間層の出⼒を保持したい
他タスクにも簡単に適⽤可能
27

More Related Content

PPTX
2018 07 02_dense_pose
PPTX
A simple neural network mnodule for relation reasoning
PPTX
Densely Connected Convolutional Networks
PDF
Deep Forest: Towards An Alternative to Deep Neural Networks
PPTX
関西CVPRML勉強会資料20150627
PDF
semantic segmentation サーベイ
PPTX
U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介
PDF
[論文紹介] Convolutional Neural Network(CNN)による超解像
2018 07 02_dense_pose
A simple neural network mnodule for relation reasoning
Densely Connected Convolutional Networks
Deep Forest: Towards An Alternative to Deep Neural Networks
関西CVPRML勉強会資料20150627
semantic segmentation サーベイ
U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介
[論文紹介] Convolutional Neural Network(CNN)による超解像

What's hot (20)

PPTX
[DL輪読会]MetaFormer is Actually What You Need for Vision
PPTX
[DL輪読会]相互情報量最大化による表現学習
PPTX
【論文紹介】How Powerful are Graph Neural Networks?
PPTX
[DL輪読会]Deep Face Recognition: A Survey
PPTX
【DL輪読会】Data-Efficient Reinforcement Learning with Self-Predictive Representat...
PPTX
[DL輪読会]Graph R-CNN for Scene Graph Generation
PDF
Overcoming Catastrophic Forgetting in Neural Networks読んだ
PDF
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
PPTX
CNNの構造最適化手法について
PPTX
[DL輪読会]Encoder-Decoder with Atrous Separable Convolution for Semantic Image S...
PPTX
[DL輪読会]Dense Captioning分野のまとめ
PDF
20150930
PDF
グラフデータ分析 入門編
PPTX
SeRanet
PPTX
ResNetの仕組み
PDF
【DL輪読会】Where do Models go Wrong? Parameter-Space Saliency Maps for Explainabi...
PDF
NVIDIA Seminar ディープラーニングによる画像認識と応用事例
PDF
論文 Solo Advent Calendar
PPTX
深層学習 第4章 大規模深層学習の実現技術
PPTX
[DL輪読会]Xception: Deep Learning with Depthwise Separable Convolutions
[DL輪読会]MetaFormer is Actually What You Need for Vision
[DL輪読会]相互情報量最大化による表現学習
【論文紹介】How Powerful are Graph Neural Networks?
[DL輪読会]Deep Face Recognition: A Survey
【DL輪読会】Data-Efficient Reinforcement Learning with Self-Predictive Representat...
[DL輪読会]Graph R-CNN for Scene Graph Generation
Overcoming Catastrophic Forgetting in Neural Networks読んだ
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
CNNの構造最適化手法について
[DL輪読会]Encoder-Decoder with Atrous Separable Convolution for Semantic Image S...
[DL輪読会]Dense Captioning分野のまとめ
20150930
グラフデータ分析 入門編
SeRanet
ResNetの仕組み
【DL輪読会】Where do Models go Wrong? Parameter-Space Saliency Maps for Explainabi...
NVIDIA Seminar ディープラーニングによる画像認識と応用事例
論文 Solo Advent Calendar
深層学習 第4章 大規模深層学習の実現技術
[DL輪読会]Xception: Deep Learning with Depthwise Separable Convolutions
Ad

Viewers also liked (20)

PDF
Generating Videos with Scene Dynamics
PPTX
Globally and Locally Consistent Image Completion
PPTX
DLゼミ20170522
PPTX
Colorful image colorization
PPTX
勉強会用スライド
PPTX
Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Network
PPTX
DeepLoco
PDF
AI勉強会用スライド
PPTX
Mobilenet
PPTX
Ai勉強会20170127
PPTX
勉強会用スライド
PPTX
Deep voice
PPTX
7月10日(月)dl
PPTX
A3C解説
PDF
【2016.02】cvpaper.challenge2016
PDF
【2016.01】(1/3)cvpaper.challenge2016
PDF
【2016.01】(2/3)cvpaper.challenge2016
PDF
【2016.04】cvpaper.challenge2016
PDF
【2016.01】(3/3)cvpaper.challenge2016
PDF
【2016.03】cvpaper.challenge2016
Generating Videos with Scene Dynamics
Globally and Locally Consistent Image Completion
DLゼミ20170522
Colorful image colorization
勉強会用スライド
Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Network
DeepLoco
AI勉強会用スライド
Mobilenet
Ai勉強会20170127
勉強会用スライド
Deep voice
7月10日(月)dl
A3C解説
【2016.02】cvpaper.challenge2016
【2016.01】(1/3)cvpaper.challenge2016
【2016.01】(2/3)cvpaper.challenge2016
【2016.04】cvpaper.challenge2016
【2016.01】(3/3)cvpaper.challenge2016
【2016.03】cvpaper.challenge2016
Ad

Similar to Deeply-Recursive Convolutional Network for Image Super-Resolution (20)

PDF
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
PDF
【2016.05】cvpaper.challenge2016
PPTX
Res netと派生研究の紹介
PPTX
【DL輪読会】LAR-SR: A Local Autoregressive Model for Image Super-Resolution
PPTX
Super resolution survey 20180809
PDF
Deep Residual Learning (ILSVRC2015 winner)
PDF
Deep residual learning for image recognition
PDF
SSD: Single Shot MultiBox Detector (ECCV2016)
PDF
【2015.07】(2/2)cvpaper.challenge@CVPR2015
PPTX
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
PDF
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
PDF
2014/02/23 CV勉強会発表資料 nksm_r
PDF
2値化CNN on FPGAでGPUとガチンコバトル(公開版)
PPTX
Deep Learning on Rescale - Oct/11/2016 at Rescale night
PDF
Tutorial-DeepLearning-PCSJ-IMPS2016
PPTX
畳み込みニューラルネットワークの高精度化と高速化
PDF
0から理解するニューラルネットアーキテクチャサーチ(NAS)
PPTX
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
PDF
深層学習 - 画像認識のための深層学習 ①
PDF
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
【2016.05】cvpaper.challenge2016
Res netと派生研究の紹介
【DL輪読会】LAR-SR: A Local Autoregressive Model for Image Super-Resolution
Super resolution survey 20180809
Deep Residual Learning (ILSVRC2015 winner)
Deep residual learning for image recognition
SSD: Single Shot MultiBox Detector (ECCV2016)
【2015.07】(2/2)cvpaper.challenge@CVPR2015
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
When NAS Meets Robustness: In Search of Robust Architectures against Adversar...
2014/02/23 CV勉強会発表資料 nksm_r
2値化CNN on FPGAでGPUとガチンコバトル(公開版)
Deep Learning on Rescale - Oct/11/2016 at Rescale night
Tutorial-DeepLearning-PCSJ-IMPS2016
畳み込みニューラルネットワークの高精度化と高速化
0から理解するニューラルネットアーキテクチャサーチ(NAS)
CVPR2018 pix2pixHD論文紹介 (CV勉強会@関東)
深層学習 - 画像認識のための深層学習 ①
Convolutional Neural Networks のトレンド @WBAFLカジュアルトーク#2

More from harmonylab (20)

PDF
【卒業論文】LLMを用いたMulti-Agent-Debateにおける反論の効果に関する研究
PDF
【卒業論文】深層学習によるログ異常検知モデルを用いたサイバー攻撃検知に関する研究
PDF
【卒業論文】LLMを用いたエージェントの相互作用による俳句の生成と評価に関する研究
PPTX
【修士論文】帝国議会および国会議事速記録における可能表現の長期的変遷に関する研究
PPTX
【修士論文】競輪における注目レース選定とLLMを用いたレース紹介記事生成に関する研究
PDF
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
PDF
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
PPTX
【修士論文】LLMを用いた俳句推敲と批評文生成に関する研究
PDF
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
PPTX
【DLゼミ】Generative Image Dynamics, CVPR2024
PDF
From Pretraining Data to Language Models to Downstream Tasks: Tracking the Tr...
PDF
Generating Automatic Feedback on UI Mockups with Large Language Models
PDF
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
PPTX
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
PPTX
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
PPTX
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
PPTX
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
PPTX
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
PPTX
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
PPTX
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone
【卒業論文】LLMを用いたMulti-Agent-Debateにおける反論の効果に関する研究
【卒業論文】深層学習によるログ異常検知モデルを用いたサイバー攻撃検知に関する研究
【卒業論文】LLMを用いたエージェントの相互作用による俳句の生成と評価に関する研究
【修士論文】帝国議会および国会議事速記録における可能表現の長期的変遷に関する研究
【修士論文】競輪における注目レース選定とLLMを用いたレース紹介記事生成に関する研究
【卒業論文】ステレオカメラによる車両制御における深層学習の適用に関する研究(A Study on Application of Deep Learning...
A Study on the Method for Generating Deformed Route Maps for Supporting Detou...
【修士論文】LLMを用いた俳句推敲と批評文生成に関する研究
【修士論文】視覚言語モデルを用いた衣服画像ペアの比較文章生成に関する研究(A Study on the Generation of Comparative...
【DLゼミ】Generative Image Dynamics, CVPR2024
From Pretraining Data to Language Models to Downstream Tasks: Tracking the Tr...
Generating Automatic Feedback on UI Mockups with Large Language Models
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【修士論文】代替出勤者の選定業務における依頼順決定方法に関する研究   千坂知也
【修士論文】経路探索のための媒介中心性に基づく道路ネットワーク階層化手法に関する研究
A Study on Decision Support System for Snow Removal Dispatch using Road Surfa...
【卒業論文】印象タグを用いた衣服画像生成システムに関する研究
【卒業論文】大規模言語モデルを用いたマニュアル文章修正手法に関する研究
DLゼミ:Primitive Generation and Semantic-related Alignment for Universal Zero-S...
DLゼミ: MobileOne: An Improved One millisecond Mobile Backbone

Deeply-Recursive Convolutional Network for Image Super-Resolution