Upload
Download free for 30 days
Login
Submit Search
【DL輪読会】DayDreamer: World Models for Physical Robot Learning
Download as PPTX, PDF
0 likes
1,168 views
Deep Learning JP
2022/9/30 Deep Learning JP http://deeplearning.jp/seminar-2/
Technology
Related topics:
Deep Learning
Read more
1 of 15
Download now
Downloaded 30 times
1
2
3
4
5
6
7
8
Most read
9
10
11
12
13
Most read
14
15
Most read
More Related Content
PPTX
[DL輪読会]World Models
Deep Learning JP
PPTX
[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination
Deep Learning JP
PDF
【DL輪読会】A Path Towards Autonomous Machine Intelligence
Deep Learning JP
PPTX
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
Deep Learning JP
PPTX
【DL輪読会】The Forward-Forward Algorithm: Some Preliminary
Deep Learning JP
PDF
【DL輪読会】Diffusion Policy: Visuomotor Policy Learning via Action Diffusion
Deep Learning JP
PDF
【DL輪読会】Mastering Diverse Domains through World Models
Deep Learning JP
PPTX
[DL輪読会]Learning Latent Dynamics for Planning from Pixels
Deep Learning JP
[DL輪読会]World Models
Deep Learning JP
[DL輪読会]Dream to Control: Learning Behaviors by Latent Imagination
Deep Learning JP
【DL輪読会】A Path Towards Autonomous Machine Intelligence
Deep Learning JP
[DL輪読会]“SimPLe”,“Improved Dynamics Model”,“PlaNet” 近年のVAEベース系列モデルの進展とそのモデルベース...
Deep Learning JP
【DL輪読会】The Forward-Forward Algorithm: Some Preliminary
Deep Learning JP
【DL輪読会】Diffusion Policy: Visuomotor Policy Learning via Action Diffusion
Deep Learning JP
【DL輪読会】Mastering Diverse Domains through World Models
Deep Learning JP
[DL輪読会]Learning Latent Dynamics for Planning from Pixels
Deep Learning JP
What's hot
(20)
PPTX
【DL輪読会】Transformers are Sample Efficient World Models
Deep Learning JP
PDF
ドメイン適応の原理と応用
Yoshitaka Ushiku
PDF
[DL輪読会]近年のオフライン強化学習のまとめ —Offline Reinforcement Learning: Tutorial, Review, an...
Deep Learning JP
PDF
GAN(と強化学習との関係)
Masahiro Suzuki
PDF
画像生成・生成モデル メタサーベイ
cvpaper. challenge
PPTX
backbone としての timm 入門
Takuji Tahara
PDF
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
Deep Learning JP
PDF
[DL輪読会]Deep Learning 第15章 表現学習
Deep Learning JP
PDF
【DL輪読会】DINOv2: Learning Robust Visual Features without Supervision
Deep Learning JP
PPTX
Curriculum Learning (関東CV勉強会)
Yoshitaka Ushiku
PPTX
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
Deep Learning JP
PPTX
近年のHierarchical Vision Transformer
Yusuke Uchida
PPTX
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
PDF
実装レベルで学ぶVQVAE
ぱんいち すみもと
PDF
Skip Connection まとめ(Neural Network)
Yamato OKAMOTO
PDF
【DL輪読会】Implicit Behavioral Cloning
Deep Learning JP
PDF
【DL輪読会】Segment Anything
Deep Learning JP
PDF
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII
PDF
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
Deep Learning JP
PDF
最適輸送の解き方
joisino
【DL輪読会】Transformers are Sample Efficient World Models
Deep Learning JP
ドメイン適応の原理と応用
Yoshitaka Ushiku
[DL輪読会]近年のオフライン強化学習のまとめ —Offline Reinforcement Learning: Tutorial, Review, an...
Deep Learning JP
GAN(と強化学習との関係)
Masahiro Suzuki
画像生成・生成モデル メタサーベイ
cvpaper. challenge
backbone としての timm 入門
Takuji Tahara
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
Deep Learning JP
[DL輪読会]Deep Learning 第15章 表現学習
Deep Learning JP
【DL輪読会】DINOv2: Learning Robust Visual Features without Supervision
Deep Learning JP
Curriculum Learning (関東CV勉強会)
Yoshitaka Ushiku
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
Deep Learning JP
近年のHierarchical Vision Transformer
Yusuke Uchida
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
実装レベルで学ぶVQVAE
ぱんいち すみもと
Skip Connection まとめ(Neural Network)
Yamato OKAMOTO
【DL輪読会】Implicit Behavioral Cloning
Deep Learning JP
【DL輪読会】Segment Anything
Deep Learning JP
SSII2021 [SS1] Transformer x Computer Visionの 実活用可能性と展望 〜 TransformerのCompute...
SSII
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
Deep Learning JP
最適輸送の解き方
joisino
Ad
Similar to 【DL輪読会】DayDreamer: World Models for Physical Robot Learning
(20)
PDF
[DL輪読会]Imagination-Augmented Agents for Deep Reinforcement Learning / Learnin...
Deep Learning JP
PPTX
「機械学習とは?」から始める Deep learning実践入門
Hideto Masuoka
PDF
Ibis2016okanohara
Preferred Networks
PPTX
全脳関西編(松尾)
Yutaka Matsuo
PDF
[DL輪読会]画像を使ったSim2Realの現況
Deep Learning JP
PPTX
Hello deeplearning!
T2C_
PDF
実社会・実環境におけるロボットの機械学習
Kuniyuki Takahashi
PDF
Deep learningの概要とドメインモデルの変遷
Taiga Nomi
PDF
Generative deeplearning #02
逸人 米田
PDF
Akira shibata at developer summit 2016
Akira Shibata
PDF
実社会・実環境におけるロボットの機械学習 ver. 2
Kuniyuki Takahashi
PDF
Deep Learningの基礎と応用
Seiya Tokui
PPTX
[DL輪読会]“Spatial Attention Point Network for Deep-learning-based Robust Autono...
Deep Learning JP
PDF
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
Preferred Networks
PPTX
[DL輪読会]Temporal DifferenceVariationalAuto-Encoder
Deep Learning JP
PDF
【DeepLearning研修】Transfomerの基礎と応用 --第4回 マルチモーダルへの展開
Sony - Neural Network Libraries
PDF
[DL輪読会]Learning to Act by Predicting the Future
Deep Learning JP
PPTX
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
Deep Learning JP
PPTX
Robogen論文よみ勉強会の資料。論文の内容と使われている技術の整理をざっくりと説明
natsutan0
PDF
[DL輪読会]Learning Task Informed Abstractions
Deep Learning JP
[DL輪読会]Imagination-Augmented Agents for Deep Reinforcement Learning / Learnin...
Deep Learning JP
「機械学習とは?」から始める Deep learning実践入門
Hideto Masuoka
Ibis2016okanohara
Preferred Networks
全脳関西編(松尾)
Yutaka Matsuo
[DL輪読会]画像を使ったSim2Realの現況
Deep Learning JP
Hello deeplearning!
T2C_
実社会・実環境におけるロボットの機械学習
Kuniyuki Takahashi
Deep learningの概要とドメインモデルの変遷
Taiga Nomi
Generative deeplearning #02
逸人 米田
Akira shibata at developer summit 2016
Akira Shibata
実社会・実環境におけるロボットの機械学習 ver. 2
Kuniyuki Takahashi
Deep Learningの基礎と応用
Seiya Tokui
[DL輪読会]“Spatial Attention Point Network for Deep-learning-based Robust Autono...
Deep Learning JP
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
Preferred Networks
[DL輪読会]Temporal DifferenceVariationalAuto-Encoder
Deep Learning JP
【DeepLearning研修】Transfomerの基礎と応用 --第4回 マルチモーダルへの展開
Sony - Neural Network Libraries
[DL輪読会]Learning to Act by Predicting the Future
Deep Learning JP
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
Deep Learning JP
Robogen論文よみ勉強会の資料。論文の内容と使われている技術の整理をざっくりと説明
natsutan0
[DL輪読会]Learning Task Informed Abstractions
Deep Learning JP
Ad
More from Deep Learning JP
(20)
PPTX
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
PPTX
【DL輪読会】事前学習用データセットについて
Deep Learning JP
PPTX
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
PPTX
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
Deep Learning JP
PPTX
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
Deep Learning JP
PPTX
【DL輪読会】マルチモーダル LLM
Deep Learning JP
PDF
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
Deep Learning JP
PPTX
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
PDF
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
PPTX
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
Deep Learning JP
PDF
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
Deep Learning JP
PDF
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
Deep Learning JP
PPTX
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
Deep Learning JP
PPTX
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
PDF
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
Deep Learning JP
PPTX
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
PDF
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
Deep Learning JP
PDF
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
Deep Learning JP
PPTX
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Deep Learning JP
PPTX
【DL輪読会】VIP: Towards Universal Visual Reward and Representation via Value-Impl...
Deep Learning JP
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
【DL輪読会】事前学習用データセットについて
Deep Learning JP
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
Deep Learning JP
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
Deep Learning JP
【DL輪読会】マルチモーダル LLM
Deep Learning JP
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
Deep Learning JP
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
Deep Learning JP
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
Deep Learning JP
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
Deep Learning JP
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
Deep Learning JP
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
Deep Learning JP
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
Deep Learning JP
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
Deep Learning JP
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Deep Learning JP
【DL輪読会】VIP: Towards Universal Visual Reward and Representation via Value-Impl...
Deep Learning JP
【DL輪読会】DayDreamer: World Models for Physical Robot Learning
1.
1 DEEP LEARNING JP [DL
Papers] http://deeplearning.jp/ DayDreamer: World Models for Physical Robot Learning Yuya Ikeda, MatsuoLab B4
2.
書誌情報 題名 DayDreamer:
World Models for Physical Robot Learning 著者 Philipp Wu* Alejandro Escontrela* Danijar Hafner* Ken Goldberg Pieter Abbeel University of California, Berkeley 会議 CoRL2022 URL https://arxiv.org/pdf/2206.14176.pdf 2
3.
概要 実ロボットを用いたタスクをDreamerで直接学習 実機・オンラインで数時間で学習
4種類のタスク環境での検証を行なった 一貫したハイパーパラメータを使用 主要なモデルフリーRLアルゴリズムと比較実験を行い、Dreamerの有効性を検証 実世界ロボット学習のための枠組みを示した 3 引用 https://danijar.com/project/ daydreamer/
4.
背景 深層学習は大量のデータを用いることで高い精度を実現してきた ロボット学習の課題・・・実機でのデータ収集コストが非常に高い → シミュレータの活用 高速・並列に動かせるのでデータを効率的に集められる シミュレータをどのように作成するか
人が設計したシミュレータを用いる方針 学習によって獲得したシミュレータを用いる方針 4
5.
背景 人が設計したシミュレータを利用したデータ収集 環境・ロボットのモデルをシミュレータで再現しデータを集め学習
シミュレータ(sim)で学習した方策を実機(real)で利用(sim-to-real) 人が設計したシミュレータの課題 sim-to-realした際に性能が発揮できない場合がある realの環境やモデルがsimで正確に再現できていないことに起因 この環境差はreality gapと呼ばれる reality gapに対処する主な工夫 sim環境をランダム化する (domain randomization) 汎化性能の向上が期待できる 5 引用 : https://openai.com/blog/solving-rubiks-cube/
6.
背景 学習によってシミュレータを獲得する方針 モデルベースRL
以下を繰り返し行う ・方策に基づき行動し、環境からデータを収集 ・データから環境のモデルを学習する ・学習した環境のモデル(世界モデル)から方策を更新 世界モデルをシミュレータとして利用できるためサンプル 効率が良い Model-Based Reinforcement Learning for Atari SimPLeと呼ばれるモデルベースRLでAtariをプレイ モデルフリーRLと比較して数倍のサンプル効率 6 引用 : Model-Based Reinforcement Learning for Atari
7.
背景 sim-to-real vs モデルベースRL
sim-to-real reality gapが課題 domain randomizationなどによりある程度解ける 実機を用いたロボット学習では主流 モデルベースRL 正確な世界モデルを学習することが難しい 成果はAtariなどに限られており、実ロボットへの活用はあまりなかった → DayDreamerが登場 7
8.
DayDreamer ネットワーク DreamerV2
高いサンプル効率を発揮したモデルベースRLの一種 アルゴリズムはそのまま使用している タスク 各タスクで同一のパラメータを使用 A1 Quadruped Walking UR5 Multi-Object Visual Pick and Place XArm Visual Pick and Place Sphero Navigation 8 引用 : https://arxiv.org/pdf/2206.14176.pdf
9.
A1 Quadruped Walking
タスク詳細 12DOFの4脚ロボットで歩行を行うタスク 入力はモータの角度、姿勢、角速度 アクションは各モータの角度 初期状態は仰向けになった状態 報酬 9 Unitree A1
10.
A1 Quadruped Walking
実装上の工夫 訓練可能な領域の端に到達したら、ロボットの姿勢を変えず手動で位置を戻す (リ セットを用いない) ロボットが転がりやすいようにシェルを3Dプリンタで作成 結果 1時間後には前進するように 10分の追加学習で外乱に耐えるように SACは立ち上がることができなかった 10 引用 : https://www.youtube.com/watch?v=A6Rg0qRwTYs 引用 : https://arxiv.org/pdf/2206.14176.pdf
11.
UR5 Multi-Object Visual
Pick and Place タスク詳細 5DOFのロボットアームで複数物体のpick and placeを行うタスク 片方の容器からもう片方の容器へ移動させることが目標 入力はロボットの位置、RGB画像 アクションはグリッパのx, y, zの変位とグリッパの開閉 報酬 物体をつかむと+1 つかんだ物体を同じ容器内で離してしまうと-1 つかんだ物体を異なる容器内で離すと+10 結果 8時間後に人がテレオペした時に近い性能 RainbowやPPOは物体をつかんでも同じ容器に落としてしまう 11 引用 : https://arxiv.org/pdf/2206.14176.pdf
12.
XArm Visual Pick
and Place タスク詳細 7DOFのロボットアームで単一物体のpick and placeを行うタスク 片方の容器からもう片方の容器へ移動させることが目標 紐でロボットアームと物体を接続 物体が角でスタックしないようにするための工夫 入力はロボットの位置、RGB画像、Depth画像 アクション、報酬はUR5の実験と同様 結果 10時間後に人がテレオペした時に近い性能 Rainbowでは学習できなかった 12 引用 : https://arxiv.org/pdf/2206.14176.pdf
13.
XArm Visual Pick
and Place 結果 照明条件が大きく変化した際性能が低下するが、5時間ほどで元の水準に Dreamerが適応的に学習していることを示している ここはあまり意義がわからなかった RGBに加えてDepthを入力している影響はどれくらいなのか Depthを使っていないUR5の方は照明条件に関する言及はない 13 引用 : https://arxiv.org/pdf/2206.14176.pdf
14.
Sphero Navigation タスク詳細
車輪付きロボットを目標位置までナビゲーションするタスク ロボットは左右対称なので観測履歴から方向を推定する必要がある 入力はRGB画像 アクションはロボットのトルク 報酬 ゴールとのL2距離を負にした値 結果 2時間でナビゲーションができるように DrQv2でも近い性能を達成 DrQv2 : 画像ベース連続値制御モデルフリーRLアルゴリズム 14 引用 : https://arxiv.org/pdf/2206.14176.pdf
15.
まとめ・感想 実世界ロボットを用いたタスクをDreamerで直接学習 モデルベースRLを用いることで低時間(〜10h)で実機のみで学習が可能
Dreamerをそのまま適用してきちんと動作しているのが驚き 実世界ロボット学習のための枠組みを示した 実機を使って世界モデルを学習する新しいアプローチ 人が設計するシミュレータと世界モデルをうまく組み合わせることができるとより高度 なことができそう ハードウェアや設定に論文に明示されていないトリックがありそう コードが公開されている&A1が利用できるので動かしてみたい 本当は輪読会までに動かしたいと思っていたが準備が間に合わなかった 15
Download