DEEP LEARNING JP
[DL Papers]
Unbiased Gradient Estimation in Unrolled Computation
Graphs with Persistent Evolution Strategies
Hiroki Furuta
http://deeplearning.jp/
書誌情報
• タイトル: Unbiased Gradient Estimation in Unrolled Computation Graphs
with Persistent Evolution Strategies
• 著者・所属: Paul Vicol12, Luke Metz2, Jascha Sohl-Dickstein2
1University of Tronto, 2Google Brain
• URL: http://proceedings.mlr.press/v139/vicol21a.html
• 概要: RNNやメタ学習に現れるunrolledな計算グラフは勾配の計算に課題
が多かった。Persistent Evolution Strategiesでこれらを解決した。
ICML2021 Outstanding paper
2
Unrolled Computational Graph
• RNNやメタ学習などに見られる
• (一口に言うと)計算グラフにループ構造が入る場合に、それらを無理やり
forward pathのみに直す [解説記事(英語)]
• forward path: ある関数 𝑓で𝑠𝑡を𝑠𝑡+1に変換する
𝑓の例: RNNのforward path, メタ学習のoptimizer (SGD, RMSprop, etc.)
3
事前知識
• 目的関数:
各ステップのLossが前のstepのstate 𝑠𝑡−1に依存している
• BPTTなど
逆伝播の計算を𝐾 ≪ 𝑇までで打ち切ることで計算量を減らすアプローチがある
(Truncation)
• 進化計算(Evolution Strategies; ES)
有限差分を用いてblack-boxな関数の勾配を推定する
4
Unrolled Computational Graphの課題
• メモリ使用量がunroll length(𝑇)に対して線形に増えてしまう
• 𝑇stepのunrollそれぞれに対してパラメータを1回しか更新できないため、計
算量が多い。またパラメータの更新が遅くなる
• unroll length(𝑇)が長いほど勾配爆発や勾配消失が起こりやすくなる
特にメタ学習で顕著
• 計算量やメモリ使用量の課題に対してはTruncationで対処することが多い
Truncated Backprop Through Time (TBPTT) [Tallec & Ollivier 2017]
5
Unrolled Computational Graphの課題
• Truncationの問題は、逆伝播の計算をsub-sequenceに分割することによっ
て、biasedな勾配(真の勾配と一致しない)になること
例えば短期間の依存性しか捉えられなくなるなどの影響が出る
• またUnrolled Computational Graphの損失関数のlandscapeは非連続やカオ
スな構造になっていることが多く、最適化が難しい [Metz et al. 2019]
ESにより、そのような損失関数のunbiasedな勾配の推定量を計算することはできる
が、計算時間の観点から結局Truncationを用いることが多い
6
関連研究
• Real-time recurrent learning (RTRL) [Williams & Zipser 1989]
BPTTと異なりオンラインでパラメータ更新ができる
truncation biasはないが、メモリ&計算量、勾配の分散が大きい、実装が複雑、限ら
れたclassのモデルにしか適用できないなどの課題がある
 Tallec & Ollivier 2017, Mujika et al. 2018, Benzing et al. 2019, Cooijmans & Martens 2019
• Hyperparameter optimization (HO)
(1) black-box, (2) grey-box, (3) gradient-based なアプローチがある
 (1) Bergstra & Bengio 2012, Snoek et al. 2012, Salimans et al. 2018, (2) Swersky et al. 2014, Jamieson &
Talwalkar 2016, Li et al. 2017, Jaderberg et al. 2017, Lorraine & Duvenaud 2018, MacKay et al. 2019, (3)
Lorraine et al., 2020, Maclaurin et al. 2015 7
Persistent Evolution Strategies
• Notation:
• ESで を近似する; 𝑃 パラメータ数
• 平均0分散𝜎2のGaussianからサンプルされる摂動
8
※ Supplementary
Material に具体例が
載っていてわかりや
すい
Persistent Evolution Strategies
• 𝑁個のサンプルによるMonte-Carlo推定で勾配を求める
• 各stepでparticleを加える & perturbationのaccumulationがポイント
9
ES vs PES
• アルゴリズム
10
Persistent Evolution Strategies
• ESはtruncated unrollsごとに𝑠を初期化する
• PESはtruncated unrolls間で同じ𝑠を使う
直感的な解釈としては過去の履歴情報が𝑠に保存される
11
PES is Unbiased for Quadratic Losses
• 損失関数が二次形式(quadratic)であるとPESの勾配はunbiasedになる
12
PES is Unbiased for Quadratic Losses
• 続き
13
実験
• 勾配の分散
particleの数(𝑁): 大  勾配の分散: 小
• Meta-objective surface
2D regressionのトイタスク
14
実験
• Influence Balancing task
最適化の際にshort-horizon biasに敏感なタスク
PESはtruncation biasを解消できている
15
実験
• Learned Optimizer Meta-Optimization
MLP-based learned optimizerをCIFAR-10の分類問題について最適化
inner-stepは𝑇 = 1000, truncation lengthは𝐾 = 4
16
MNISTの分類タスクでlearning rateとDecayのmeta-
optimization; 右: training loss, 左: validation accuracy
実験
• Continuous Control
RLアルゴリズム (SACなど)でも最大で150ぐらい
17
まとめ
• Unrolledな計算グラフにおいて、unbiasedな勾配の推定を可能にした
Persistent Evolution Strategies (PES)を提案した。
• これまではbiasedな勾配しか得られないことが課題だったtruncated unrolls
(例: RNNのtruncated BPTTなど)からでも、unbiasedな勾配を高速に求める
ことができる
• 実験でRNNに近いタスク、ハイパーパラメータ最適化、強化学習、メタ学習
など幅広いタスクに適用可能であることを実証。
18

More Related Content

PDF
IUI 2016 Presentation Slide
PPTX
Disentangled Representation Learning of Deep Generative Models
PPTX
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
PPTX
【DL輪読会】事前学習用データセットについて
PPTX
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
PPTX
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
PPTX
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
PPTX
【DL輪読会】マルチモーダル LLM
IUI 2016 Presentation Slide
Disentangled Representation Learning of Deep Generative Models
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
【DL輪読会】事前学習用データセットについて
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
【DL輪読会】マルチモーダル LLM

More from Deep Learning JP (20)

PDF
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
PPTX
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
PDF
【DL輪読会】Can Neural Network Memorization Be Localized?
PPTX
【DL輪読会】Hopfield network 関連研究について
PPTX
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
PDF
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
PDF
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
PPTX
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
PPTX
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
PDF
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
PPTX
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
PDF
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
PDF
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
PPTX
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
PPTX
【DL輪読会】VIP: Towards Universal Visual Reward and Representation via Value-Impl...
PDF
【DL輪読会】Deep Transformers without Shortcuts: Modifying Self-attention for Fait...
PPTX
【DL輪読会】マルチモーダル 基盤モデル
PPTX
【DL輪読会】TrOCR: Transformer-based Optical Character Recognition with Pre-traine...
PDF
【DL輪読会】HyperDiffusion: Generating Implicit Neural Fields withWeight-Space Dif...
PPTX
【DL輪読会】大量API・ツールの扱いに特化したLLM
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
【DL輪読会】Can Neural Network Memorization Be Localized?
【DL輪読会】Hopfield network 関連研究について
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
【DL輪読会】VIP: Towards Universal Visual Reward and Representation via Value-Impl...
【DL輪読会】Deep Transformers without Shortcuts: Modifying Self-attention for Fait...
【DL輪読会】マルチモーダル 基盤モデル
【DL輪読会】TrOCR: Transformer-based Optical Character Recognition with Pre-traine...
【DL輪読会】HyperDiffusion: Generating Implicit Neural Fields withWeight-Space Dif...
【DL輪読会】大量API・ツールの扱いに特化したLLM
Ad

Recently uploaded (20)

PPTX
Final SEM Unit 1 for mit wpu at pune .pptx
PPTX
O2C Customer Invoices to Receipt V15A.pptx
PPTX
Tartificialntelligence_presentation.pptx
PDF
sustainability-14-14877-v2.pddhzftheheeeee
PDF
Video forgery: An extensive analysis of inter-and intra-frame manipulation al...
PPTX
MicrosoftCybserSecurityReferenceArchitecture-April-2025.pptx
PDF
Unlock new opportunities with location data.pdf
PPTX
Web Crawler for Trend Tracking Gen Z Insights.pptx
PPTX
Modernising the Digital Integration Hub
PDF
Microsoft Solutions Partner Drive Digital Transformation with D365.pdf
PDF
Hybrid model detection and classification of lung cancer
PPTX
The various Industrial Revolutions .pptx
PDF
NewMind AI Weekly Chronicles – August ’25 Week III
PDF
Univ-Connecticut-ChatGPT-Presentaion.pdf
PDF
A Late Bloomer's Guide to GenAI: Ethics, Bias, and Effective Prompting - Boha...
PDF
Hybrid horned lizard optimization algorithm-aquila optimizer for DC motor
PDF
August Patch Tuesday
PDF
Zenith AI: Advanced Artificial Intelligence
PDF
WOOl fibre morphology and structure.pdf for textiles
PDF
Hindi spoken digit analysis for native and non-native speakers
Final SEM Unit 1 for mit wpu at pune .pptx
O2C Customer Invoices to Receipt V15A.pptx
Tartificialntelligence_presentation.pptx
sustainability-14-14877-v2.pddhzftheheeeee
Video forgery: An extensive analysis of inter-and intra-frame manipulation al...
MicrosoftCybserSecurityReferenceArchitecture-April-2025.pptx
Unlock new opportunities with location data.pdf
Web Crawler for Trend Tracking Gen Z Insights.pptx
Modernising the Digital Integration Hub
Microsoft Solutions Partner Drive Digital Transformation with D365.pdf
Hybrid model detection and classification of lung cancer
The various Industrial Revolutions .pptx
NewMind AI Weekly Chronicles – August ’25 Week III
Univ-Connecticut-ChatGPT-Presentaion.pdf
A Late Bloomer's Guide to GenAI: Ethics, Bias, and Effective Prompting - Boha...
Hybrid horned lizard optimization algorithm-aquila optimizer for DC motor
August Patch Tuesday
Zenith AI: Advanced Artificial Intelligence
WOOl fibre morphology and structure.pdf for textiles
Hindi spoken digit analysis for native and non-native speakers
Ad

[DL輪読会]Unbiased Gradient Estimation in Unrolled Computation Graphs with Persistent Evolution Strategies

  • 1. DEEP LEARNING JP [DL Papers] Unbiased Gradient Estimation in Unrolled Computation Graphs with Persistent Evolution Strategies Hiroki Furuta http://deeplearning.jp/
  • 2. 書誌情報 • タイトル: Unbiased Gradient Estimation in Unrolled Computation Graphs with Persistent Evolution Strategies • 著者・所属: Paul Vicol12, Luke Metz2, Jascha Sohl-Dickstein2 1University of Tronto, 2Google Brain • URL: http://proceedings.mlr.press/v139/vicol21a.html • 概要: RNNやメタ学習に現れるunrolledな計算グラフは勾配の計算に課題 が多かった。Persistent Evolution Strategiesでこれらを解決した。 ICML2021 Outstanding paper 2
  • 3. Unrolled Computational Graph • RNNやメタ学習などに見られる • (一口に言うと)計算グラフにループ構造が入る場合に、それらを無理やり forward pathのみに直す [解説記事(英語)] • forward path: ある関数 𝑓で𝑠𝑡を𝑠𝑡+1に変換する 𝑓の例: RNNのforward path, メタ学習のoptimizer (SGD, RMSprop, etc.) 3
  • 4. 事前知識 • 目的関数: 各ステップのLossが前のstepのstate 𝑠𝑡−1に依存している • BPTTなど 逆伝播の計算を𝐾 ≪ 𝑇までで打ち切ることで計算量を減らすアプローチがある (Truncation) • 進化計算(Evolution Strategies; ES) 有限差分を用いてblack-boxな関数の勾配を推定する 4
  • 5. Unrolled Computational Graphの課題 • メモリ使用量がunroll length(𝑇)に対して線形に増えてしまう • 𝑇stepのunrollそれぞれに対してパラメータを1回しか更新できないため、計 算量が多い。またパラメータの更新が遅くなる • unroll length(𝑇)が長いほど勾配爆発や勾配消失が起こりやすくなる 特にメタ学習で顕著 • 計算量やメモリ使用量の課題に対してはTruncationで対処することが多い Truncated Backprop Through Time (TBPTT) [Tallec & Ollivier 2017] 5
  • 6. Unrolled Computational Graphの課題 • Truncationの問題は、逆伝播の計算をsub-sequenceに分割することによっ て、biasedな勾配(真の勾配と一致しない)になること 例えば短期間の依存性しか捉えられなくなるなどの影響が出る • またUnrolled Computational Graphの損失関数のlandscapeは非連続やカオ スな構造になっていることが多く、最適化が難しい [Metz et al. 2019] ESにより、そのような損失関数のunbiasedな勾配の推定量を計算することはできる が、計算時間の観点から結局Truncationを用いることが多い 6
  • 7. 関連研究 • Real-time recurrent learning (RTRL) [Williams & Zipser 1989] BPTTと異なりオンラインでパラメータ更新ができる truncation biasはないが、メモリ&計算量、勾配の分散が大きい、実装が複雑、限ら れたclassのモデルにしか適用できないなどの課題がある  Tallec & Ollivier 2017, Mujika et al. 2018, Benzing et al. 2019, Cooijmans & Martens 2019 • Hyperparameter optimization (HO) (1) black-box, (2) grey-box, (3) gradient-based なアプローチがある  (1) Bergstra & Bengio 2012, Snoek et al. 2012, Salimans et al. 2018, (2) Swersky et al. 2014, Jamieson & Talwalkar 2016, Li et al. 2017, Jaderberg et al. 2017, Lorraine & Duvenaud 2018, MacKay et al. 2019, (3) Lorraine et al., 2020, Maclaurin et al. 2015 7
  • 8. Persistent Evolution Strategies • Notation: • ESで を近似する; 𝑃 パラメータ数 • 平均0分散𝜎2のGaussianからサンプルされる摂動 8 ※ Supplementary Material に具体例が 載っていてわかりや すい
  • 9. Persistent Evolution Strategies • 𝑁個のサンプルによるMonte-Carlo推定で勾配を求める • 各stepでparticleを加える & perturbationのaccumulationがポイント 9
  • 10. ES vs PES • アルゴリズム 10
  • 11. Persistent Evolution Strategies • ESはtruncated unrollsごとに𝑠を初期化する • PESはtruncated unrolls間で同じ𝑠を使う 直感的な解釈としては過去の履歴情報が𝑠に保存される 11
  • 12. PES is Unbiased for Quadratic Losses • 損失関数が二次形式(quadratic)であるとPESの勾配はunbiasedになる 12
  • 13. PES is Unbiased for Quadratic Losses • 続き 13
  • 14. 実験 • 勾配の分散 particleの数(𝑁): 大  勾配の分散: 小 • Meta-objective surface 2D regressionのトイタスク 14
  • 15. 実験 • Influence Balancing task 最適化の際にshort-horizon biasに敏感なタスク PESはtruncation biasを解消できている 15
  • 16. 実験 • Learned Optimizer Meta-Optimization MLP-based learned optimizerをCIFAR-10の分類問題について最適化 inner-stepは𝑇 = 1000, truncation lengthは𝐾 = 4 16 MNISTの分類タスクでlearning rateとDecayのmeta- optimization; 右: training loss, 左: validation accuracy
  • 17. 実験 • Continuous Control RLアルゴリズム (SACなど)でも最大で150ぐらい 17
  • 18. まとめ • Unrolledな計算グラフにおいて、unbiasedな勾配の推定を可能にした Persistent Evolution Strategies (PES)を提案した。 • これまではbiasedな勾配しか得られないことが課題だったtruncated unrolls (例: RNNのtruncated BPTTなど)からでも、unbiasedな勾配を高速に求める ことができる • 実験でRNNに近いタスク、ハイパーパラメータ最適化、強化学習、メタ学習 など幅広いタスクに適用可能であることを実証。 18