Bread Company
深層Neural Networkの
積分表現について
1
2018/1/27 k1ito @UTokyo
Bread Company
今日の内容
●論文:
Integral Representation Theory of Deep Neural Networks
Sho Sonoda(2017)
目標:
深層Neural Network(特にDAE)を
1.双対リッジレット変換
2.輸送写像
で定式化する。
2
Bread Company
今日の内容
●論文:
Integral Representation Theory of Deep Neural Networks
Sho Sonoda(2017)
3行でいうと、
● ニューラルネットワーク—(連続化)→双対リッジレット変換
● 双対リッジレット変換=輸送写像
● 輸送写像でNeural Networkを定式化し、解釈する。
3
Bread Company
今日の結果
●双対リッジレット変換と輸送写像をつかうと、
DAEでプレトレーニングされた2段階学習は
というキレイな式で表され、解釈ができる。[p136]
4
Bread Company
参考文献
●原論文(サーベイ・解説が丁寧)
http://altmetrics.ceek.jp/article/hdl.handle.net/2065/00054630
●原論文著者による解説
http://www.airc.aist.go.jp/seminar_detail/docs/seminar02-sonoda.pdf
●特にWasserstein幾何の部分にスポットをあてた論文
http://www.math.tsukuba.ac.jp/~aoshima-lab/abst_2017/sonoda.pdf
●最適輸送理論の文書まとめ
http://tam5917.hatenablog.com/entry/2018/01/19/213040
●なんかめっちゃRTされた僕のTweet
https://twitter.com/k1ito/status/943267602578599936
5
Bread Company
目次
● 深層ニューラルネットワークの数学的定式化
ニューラルネットワークは数学的に定式化可能
万能関数近似機ではあるが、中間層が何かは諸説ある
● リッジレット変換について
● 輸送写像について
6
Bread Company
深層ニューラルネットワークの数学的定式化[p57]
●3層Neural Networkの問題設定は以下のように定式化される
ある関数 を次のような関数𝑔で近似する
𝑎𝑗, 𝑏𝑗 ∈ ℝ 𝑚×ℝ を中間層パラメータとよび、
𝕐 𝑚+1
≔ ℝ 𝑚
× ℝ で中間層パラメータの空間を表す。
7
Bread Company
深層ニューラルネットワークに関するRemark1 [p25]
●ニューラルネットワークは万能関数近似機
8
Bread Company
深層ニューラルネットワークに関するRemark2[pp19-22]
NNは浅くても万能。なのに、なぜDeepなのか?
●①表現能力が向上(Bengio et al., 2006a; Montufar et al., 2014)
●②学習能力が向上
○サンプル複雑性 (Arora et al. (2014))
○Stability (Giryes et al. (2015a) )
○Rademacher 複雑性(Neyshabur et al. (2015))
中間層は何を表しているのかには諸説ある。
● 特徴量説
● ランダム説
● 無限層に関する研究
9
Bread Company
目次
● 深層ニューラルネットワークの数学的定式化
ニューラルネットワークは数学的に定式化可能
万能関数近似機ではあるが、中間層が何かは諸説ある
● リッジレット変換について
リッジレット変換はラドン領域でのウェーブレット変換である。
これを離散化することによりニューラルネットワークが得られる
● 輸送写像について
10
Bread Company
リッジレット変換
●リッジレット変換はRadon領域でのWavelet変換と呼ばれる
●本章では、
●Fourier変換 (Radon変換・Wavelet変換の基礎となる)
●Radon変換
●Wavelet変換
●Ridgelet変換
の順番で解説する
11
Bread Company
Fourier変換 [pp37-39]
12
Fourier変換=関数を周波数ごとに分解
Fourier逆変換=周波数ごとに集めて関数を再構成
Bread Company
Radon変換 [pp39-41]
●Radon変換 (u,p)で定まる線にそって積分→CTスキャン
●反転公式=スキャンされたデータから復元
13
Bread Company
ウェーブレット変換 [pp41-42]
14
反転公式
をみたすとき、以下が成立
ウェーブレット変換=周波数(a)と位置(b)で関数を分解
Bread Company
リッジレット変換 [pp58-59]
15
Bread Company
リッジレット変換の再構成公式 [p59]
16
Bread Company
Ridgelet変換=Radon変換+Wavelet変換 p61
17
つまり、CTスキャンして得られたRfを更にウェーブレットで分解
Bread Company 18
Bread Company
目次
● 深層ニューラルネットワークの数学的定式化
ニューラルネットワークは数学的に定式化可能
万能関数近似機ではあるが、中間層が何かは諸説ある
● リッジレット変換について
リッジレット変換はラドン領域でのウェーブレット変換である。
これを離散化することによりニューラルネットワークが得られる
● 輸送写像について
Wasserstein距離とは確率分布と確率分布の距離を測るもの
これらを用いてDAEを定式化する。
19
Bread Company
最適輸送について
20
→日本語でOK
Bread Company
何を言ってるのかわからないので簡単な例で
●点xを点yに移したいとき、必要な労力は? = D(x,y) =距離
21
Bread Company
何を言ってるのかわからないので簡単な例で
●地点𝑥1, 𝑥2, … , 𝑥 𝑛に1/n kgの荷物があり、
それを地点𝑦1, 𝑦2, … , 𝑦𝑛に1/n kgづつ輸送するときのコストは?
22
Bread Company
何を言ってるのかわからないので簡単な例で
●より一般の例で(?)
23
Bread Company
何を言ってるのかわからないので簡単な例で
●現在:基地1に60人、基地2に90人、基地3に150人兵士がいる。
●戦場Aに120人、戦場Bに90人、戦場Cに90人配備する。
●それぞれの間の距離はdで与えられる。
24
Bread Company
つまり、ある制約条件下で、コストを最小化する
25
Bread Company
最適輸送について(再訪)
26
Wasserstein距離はいまさっきの連続・一般化だった
Bread Company
最適輸送が何の役に立つのか
27
Bread Company
最適輸送が何の役に立つのか(2)
●Wasserstein GAN
Generatorが本物と偽物のWasserstein距離を最小化し続ける。
→本物っぽい偽物ができるようになる
28
Bread Company
DAEに応用する(feelingだけ)
29
・そもそもDAEとは
Bread Company
DAEに応用する
30
つまり、次のようなgを求める問題となる。
Bread Company
DAEに応用する
31
このようなgは汎関数微分によって以下のように求まる。
実際
Bread Company
DAEに応用する
32
さらに雑音が正規分布に従うときは、さらに簡単にできる
より
Bread Company
DAEに応用する
33
よって、DAEの写像が満たすべき条件を与える。まず、
次に、質量保存から
そして、この初期条件から
Bread Company
DAEに応用する
34
これらの方程式は、Wasserstein幾何学から次にまとめられる。(論文読んで)
これをL層つみかさねて、積分表現を得ると
Bread Company
DAEに応用する
35
これが意味するところは
であり、輸送写像をfにかませることにより
複雑さが軽減される
Bread Company 36

More Related Content

PPTX
2014 3 13(テンソル分解の基礎)
PDF
「世界モデル」と関連研究について
PDF
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
PDF
敵対的生成ネットワーク(GAN)
PDF
Deep Learningによる超解像の進歩
PPTX
深層学習の数理
PDF
Layer Normalization@NIPS+読み会・関西
PDF
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
2014 3 13(テンソル分解の基礎)
「世界モデル」と関連研究について
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
敵対的生成ネットワーク(GAN)
Deep Learningによる超解像の進歩
深層学習の数理
Layer Normalization@NIPS+読み会・関西
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向

What's hot (20)

PDF
数学で解き明かす深層学習の原理
PDF
KDD'17読み会:Anomaly Detection with Robust Deep Autoencoders
PPTX
[DL輪読会]相互情報量最大化による表現学習
PPTX
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
PPTX
Graph convolution (スペクトルアプローチ)
PDF
PRML学習者から入る深層生成モデル入門
PDF
因果探索: 基本から最近の発展までを概説
PPTX
【解説】 一般逆行列
PPTX
Active Convolution, Deformable Convolution ―形状・スケールを学習可能なConvolution―
PDF
【基調講演】『深層学習の原理の理解に向けた理論の試み』 今泉 允聡(東大)
PPTX
ようやく分かった!最尤推定とベイズ推定
PDF
研究効率化Tips Ver.2
PPTX
Curriculum Learning (関東CV勉強会)
PDF
最適輸送の解き方
PPTX
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
PDF
R-CNNの原理とここ数年の流れ
PDF
21世紀の手法対決 (MIC vs HSIC)
PDF
深層生成モデルと世界モデル
PPTX
[DL輪読会]Learning Latent Dynamics for Planning from Pixels
PDF
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
数学で解き明かす深層学習の原理
KDD'17読み会:Anomaly Detection with Robust Deep Autoencoders
[DL輪読会]相互情報量最大化による表現学習
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
Graph convolution (スペクトルアプローチ)
PRML学習者から入る深層生成モデル入門
因果探索: 基本から最近の発展までを概説
【解説】 一般逆行列
Active Convolution, Deformable Convolution ―形状・スケールを学習可能なConvolution―
【基調講演】『深層学習の原理の理解に向けた理論の試み』 今泉 允聡(東大)
ようやく分かった!最尤推定とベイズ推定
研究効率化Tips Ver.2
Curriculum Learning (関東CV勉強会)
最適輸送の解き方
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
R-CNNの原理とここ数年の流れ
21世紀の手法対決 (MIC vs HSIC)
深層生成モデルと世界モデル
[DL輪読会]Learning Latent Dynamics for Planning from Pixels
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
Ad

Similar to 深層ニューラルネットワークの積分表現(Deepを定式化する数学) (15)

PPTX
[DL輪読会]Deep Face Recognition: A Survey
PDF
attention_is_all_you_need_nips17_論文紹介
PPTX
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
PPTX
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
PPTX
[DL輪読会]Abstractive Summarization of Reddit Posts with Multi-level Memory Netw...
PDF
CluBERT: A Cluster-Based Approach for Learning Sense Distributions in Multipl...
PDF
DAシンポジウム2019招待講演「深層学習モデルの高速なTraining/InferenceのためのHW/SW技術」 金子紘也hare
PDF
Deep learningの概要とドメインモデルの変遷
PPTX
Efficient Neural Architecture Search via Parameters Sharing @ ICML2018読み会
PPTX
畳み込みニューラルネットワークの高精度化と高速化
PDF
introduce to Multimodal Deep Learning for Robust RGB-D Object Recognition
PDF
Convolutional Neural Netwoks で自然言語処理をする
PDF
Generative deeplearning #02
PPTX
Variational Template Machine for Data-to-Text Generation
PDF
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
[DL輪読会]Deep Face Recognition: A Survey
attention_is_all_you_need_nips17_論文紹介
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
[DL輪読会]Abstractive Summarization of Reddit Posts with Multi-level Memory Netw...
CluBERT: A Cluster-Based Approach for Learning Sense Distributions in Multipl...
DAシンポジウム2019招待講演「深層学習モデルの高速なTraining/InferenceのためのHW/SW技術」 金子紘也hare
Deep learningの概要とドメインモデルの変遷
Efficient Neural Architecture Search via Parameters Sharing @ ICML2018読み会
畳み込みニューラルネットワークの高精度化と高速化
introduce to Multimodal Deep Learning for Robust RGB-D Object Recognition
Convolutional Neural Netwoks で自然言語処理をする
Generative deeplearning #02
Variational Template Machine for Data-to-Text Generation
[cvpaper.challenge] 超解像メタサーベイ #meta-study-group勉強会
Ad

More from Katsuya Ito (18)

PDF
ICML2021の連合学習の論文
PDF
金融時系列解析入門 AAMAS2021 著者発表会
PDF
西山計量経済学第8章 制限従属変数モデル
PDF
CF-FinML 金融時系列予測のための機械学習
PDF
非同期時系列のLead-lag効果推定のための新しい推定量
PDF
表明保証と補償責任
PDF
Gali3章Monetary Policy, Inflation, and the Business Cycle~the basic new keynes...
PDF
新問題研究 要件事実
PDF
Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定
PDF
Convex Analysis and Duality (based on "Functional Analysis and Optimization" ...
PPTX
量子プログラミング入門
PDF
最近強化学習の良記事がたくさん出てきたので勉強しながらまとめた
PDF
異常検知と変化検知で復習するPRML
PDF
ICLR 2018 Best papers 3本を紹介
PPTX
計算数学I TA小話①(TeXについて)
PPTX
Black-Scholesの面白さ
PDF
Goodfellow先生おすすめのGAN論文6つを紹介
PDF
とぽろじー入門(画像なし版)
ICML2021の連合学習の論文
金融時系列解析入門 AAMAS2021 著者発表会
西山計量経済学第8章 制限従属変数モデル
CF-FinML 金融時系列予測のための機械学習
非同期時系列のLead-lag効果推定のための新しい推定量
表明保証と補償責任
Gali3章Monetary Policy, Inflation, and the Business Cycle~the basic new keynes...
新問題研究 要件事実
Dynamic Time Warping を用いた高頻度取引データのLead-Lag 効果の推定
Convex Analysis and Duality (based on "Functional Analysis and Optimization" ...
量子プログラミング入門
最近強化学習の良記事がたくさん出てきたので勉強しながらまとめた
異常検知と変化検知で復習するPRML
ICLR 2018 Best papers 3本を紹介
計算数学I TA小話①(TeXについて)
Black-Scholesの面白さ
Goodfellow先生おすすめのGAN論文6つを紹介
とぽろじー入門(画像なし版)

深層ニューラルネットワークの積分表現(Deepを定式化する数学)