Submit Search
[DL輪読会]“Spatial Attention Point Network for Deep-learning-based Robust Autonomous Robot Motion Generation”
Download as PPTX, PDF
1 like
1,471 views
Deep Learning JP
2021/07/30 Deep Learning JP: http://deeplearning.jp/seminar-2/
Technology
Related topics:
Deep Learning
Read more
1 of 15
Download now
Download to read offline
1
2
Most read
3
4
5
6
7
8
Most read
9
10
11
Most read
12
13
14
15
More Related Content
PDF
Transformerを多層にする際の勾配消失問題と解決法について
Sho Takase
PDF
SSII2019企画: 点群深層学習の研究動向
SSII
PPTX
Generative Adversarial Imitation Learningの紹介(RLアーキテクチャ勉強会)
Yusuke Nakata
PDF
三次元点群を取り扱うニューラルネットワークのサーベイ
Naoya Chiba
PPTX
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
Deep Learning JP
PDF
3D CNNによる人物行動認識の動向
Kensho Hara
PPTX
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
Deep Learning JP
PPTX
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
Deep Learning JP
Transformerを多層にする際の勾配消失問題と解決法について
Sho Takase
SSII2019企画: 点群深層学習の研究動向
SSII
Generative Adversarial Imitation Learningの紹介(RLアーキテクチャ勉強会)
Yusuke Nakata
三次元点群を取り扱うニューラルネットワークのサーベイ
Naoya Chiba
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
Deep Learning JP
3D CNNによる人物行動認識の動向
Kensho Hara
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
Deep Learning JP
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
Deep Learning JP
What's hot
(20)
PDF
強化学習と逆強化学習を組み合わせた模倣学習
Eiji Uchibe
PPTX
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
Yusuke Uchida
PPTX
[DL輪読会]Pay Attention to MLPs (gMLP)
Deep Learning JP
PPTX
近年のHierarchical Vision Transformer
Yusuke Uchida
PDF
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Preferred Networks
PDF
Action Recognitionの歴史と最新動向
Ohnishi Katsunori
PDF
画像生成・生成モデル メタサーベイ
cvpaper. challenge
PDF
三次元表現まとめ(深層学習を中心に)
Tomohiro Motoda
PDF
動作認識の最前線:手法,タスク,データセット
Toru Tamaki
PDF
【チュートリアル】コンピュータビジョンによる動画認識
Hirokatsu Kataoka
PDF
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
SSII
PDF
ドメイン適応の原理と応用
Yoshitaka Ushiku
PDF
深層強化学習の分散化・RNN利用の動向〜R2D2の紹介をもとに〜
Jun Okumura
PPTX
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
Kosuke Shinoda
PPTX
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
Deep Learning JP
PDF
【DL輪読会】Diffusion Policy: Visuomotor Policy Learning via Action Diffusion
Deep Learning JP
PPTX
[DL輪読会]Objects as Points
Deep Learning JP
PPTX
Curriculum Learning (関東CV勉強会)
Yoshitaka Ushiku
PPTX
強化学習アルゴリズムPPOの解説と実験
克海 納谷
PDF
最近強化学習の良記事がたくさん出てきたので勉強しながらまとめた
Katsuya Ito
強化学習と逆強化学習を組み合わせた模倣学習
Eiji Uchibe
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
Yusuke Uchida
[DL輪読会]Pay Attention to MLPs (gMLP)
Deep Learning JP
近年のHierarchical Vision Transformer
Yusuke Uchida
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Preferred Networks
Action Recognitionの歴史と最新動向
Ohnishi Katsunori
画像生成・生成モデル メタサーベイ
cvpaper. challenge
三次元表現まとめ(深層学習を中心に)
Tomohiro Motoda
動作認識の最前線:手法,タスク,データセット
Toru Tamaki
【チュートリアル】コンピュータビジョンによる動画認識
Hirokatsu Kataoka
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
SSII
ドメイン適応の原理と応用
Yoshitaka Ushiku
深層強化学習の分散化・RNN利用の動向〜R2D2の紹介をもとに〜
Jun Okumura
PyTorchLightning ベース Hydra+MLFlow+Optuna による機械学習開発環境の構築
Kosuke Shinoda
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
Deep Learning JP
【DL輪読会】Diffusion Policy: Visuomotor Policy Learning via Action Diffusion
Deep Learning JP
[DL輪読会]Objects as Points
Deep Learning JP
Curriculum Learning (関東CV勉強会)
Yoshitaka Ushiku
強化学習アルゴリズムPPOの解説と実験
克海 納谷
最近強化学習の良記事がたくさん出てきたので勉強しながらまとめた
Katsuya Ito
Ad
Similar to [DL輪読会]“Spatial Attention Point Network for Deep-learning-based Robust Autonomous Robot Motion Generation”
(20)
PPTX
[DL輪読会]Differentiable Mapping Networks: Learning Structured Map Representatio...
Deep Learning JP
PPT
Deep Auto-Encoder Neural Networks in Reiforcement Learnning (第 9 回 Deep Learn...
Ohsawa Goodfellow
PDF
Point net
Fujimoto Keisuke
PDF
GTC 2016 ディープラーニング最新情報
NVIDIA Japan
PDF
Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)
Ohsawa Goodfellow
PDF
[DL輪読会]Making Sense of Vision and Touch: Self-Supervised Learning of Multimod...
Deep Learning JP
PDF
[DL輪読会]Imagination-Augmented Agents for Deep Reinforcement Learning / Learnin...
Deep Learning JP
PDF
IROS2020 survey
robotpaperchallenge
PDF
3DFeat-Net
Takuya Minagawa
PDF
20150930
nlab_utokyo
PDF
[DL輪読会]Unsupervised Learning of 3D Structure from Images
Deep Learning JP
PDF
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
Preferred Networks
PDF
Ibis2016okanohara
Preferred Networks
PDF
第126回 ロボット工学セミナー 三次元点群と深層学習
Naoya Chiba
PPTX
[DL輪読会]SOLAR: Deep Structured Representations for Model-Based Reinforcement L...
Deep Learning JP
PPTX
Deep learning survey(途中)
shunkimurakami
PPTX
[DL輪読会]PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metr...
Deep Learning JP
PDF
Learning Spatial Common Sense with Geometry-Aware Recurrent Networks
Kento Doi
PPTX
【DL輪読会】Data-Efficient Reinforcement Learning with Self-Predictive Representat...
Deep Learning JP
PDF
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...
mmisono
[DL輪読会]Differentiable Mapping Networks: Learning Structured Map Representatio...
Deep Learning JP
Deep Auto-Encoder Neural Networks in Reiforcement Learnning (第 9 回 Deep Learn...
Ohsawa Goodfellow
Point net
Fujimoto Keisuke
GTC 2016 ディープラーニング最新情報
NVIDIA Japan
Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)
Ohsawa Goodfellow
[DL輪読会]Making Sense of Vision and Touch: Self-Supervised Learning of Multimod...
Deep Learning JP
[DL輪読会]Imagination-Augmented Agents for Deep Reinforcement Learning / Learnin...
Deep Learning JP
IROS2020 survey
robotpaperchallenge
3DFeat-Net
Takuya Minagawa
20150930
nlab_utokyo
[DL輪読会]Unsupervised Learning of 3D Structure from Images
Deep Learning JP
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
Preferred Networks
Ibis2016okanohara
Preferred Networks
第126回 ロボット工学セミナー 三次元点群と深層学習
Naoya Chiba
[DL輪読会]SOLAR: Deep Structured Representations for Model-Based Reinforcement L...
Deep Learning JP
Deep learning survey(途中)
shunkimurakami
[DL輪読会]PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metr...
Deep Learning JP
Learning Spatial Common Sense with Geometry-Aware Recurrent Networks
Kento Doi
【DL輪読会】Data-Efficient Reinforcement Learning with Self-Predictive Representat...
Deep Learning JP
論文輪読: Deep neural networks are easily fooled: High confidence predictions for...
mmisono
Ad
More from Deep Learning JP
(20)
PPTX
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
PPTX
【DL輪読会】事前学習用データセットについて
Deep Learning JP
PPTX
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
PPTX
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
Deep Learning JP
PPTX
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
Deep Learning JP
PPTX
【DL輪読会】マルチモーダル LLM
Deep Learning JP
PDF
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
Deep Learning JP
PPTX
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
PDF
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
PPTX
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
PPTX
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
Deep Learning JP
PDF
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
Deep Learning JP
PDF
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
Deep Learning JP
PPTX
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
Deep Learning JP
PPTX
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
PDF
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
Deep Learning JP
PPTX
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
PDF
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
Deep Learning JP
PDF
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
Deep Learning JP
PPTX
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Deep Learning JP
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
【DL輪読会】事前学習用データセットについて
Deep Learning JP
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
Deep Learning JP
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
Deep Learning JP
【DL輪読会】マルチモーダル LLM
Deep Learning JP
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
Deep Learning JP
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
Deep Learning JP
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
Deep Learning JP
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
Deep Learning JP
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
Deep Learning JP
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
Deep Learning JP
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
Deep Learning JP
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
Deep Learning JP
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Deep Learning JP
[DL輪読会]“Spatial Attention Point Network for Deep-learning-based Robust Autonomous Robot Motion Generation”
1.
1 DEEP LEARNING JP [DL
Papers] http://deeplearning.jp/ “Spatial Attention Point Network for Deep-learning-based Robust Autonomous Robot Motion Generation” KokiYamane, University ofTsukuba
2.
書誌情報 • タイトル – Spatial
Attention Point Network for Deep-learning-based Robust Autonomous Robot Motion Generation • 著者 – Hideyuki Ichiwara, Hiroshi Ito, Kenjiro Yamamoto, Hiroki Mori, Tetsuya Ogata • 所属 – 早稲田大学 尾形研究室 • https://arxiv.org/abs/2103.01598 2
3.
概要 • オブジェクトを限定しない汎用的なpick-and-place • 画像を使った模倣学習 •
end-to-end learning – タスクに必要な状態表現とタスク自体を同時に学習 • 画像を特徴点で表すことで必要な情報のみを抽出 – 画像特有の環境変化の影響を抑制してロバストな動作を実現 3
4.
背景 • ロボットのタスクの大半はpick-and-place • 現状はオブジェクトごとに個別のアルゴリズムを設計して使用 –
オブジェクトごとに物体検出の学習をしたり掴み方や運び方をプログラミングするの は大変 • 模倣学習 – 人間の操作したデータを教師データとして学習 – 明示的にプログラミングする必要がない – 比較的サンプル効率が高い – データを集めるのは大変 • 限られたデータで汎化性能を実現する必要がある 4
5.
既存研究 • Deep Spatial
Auto Encoder (DSAE) [Abbeel+, 2016] – CNNの最後に2D Softmaxを入れて注目すべき位置を抽出 – ヒューリスティックな後処理 • カルマンフィルタで値が飛ぶのを抑制 • 学習時の分布から離れた特徴点は削除 5
6.
既存研究 • Deep Spatial
Auto Encoder (DSAE) [Abbeel+, 2016] – 画像なしで強化学習を行い,集めた画像で表現学習してから画像あり強化学習 – 特徴点の位置と速度を状態とする – 4つのタスクで実験 6
7.
提案手法 • Spatial Attention
Point Network – 現在の画像と関節角を入力し,次ステップの画像と関節角を予測 – 2D Softmaxで特徴点抽出 – 通常の画像特徴量を別で抽出し,画像予測のみに利用 • 明るさや背景などの動作に関わらない情報はLSTMを通さないようにする 7
8.
提案手法 • Loss関数 – 画像のMSE –
関節角のMSE – 前ステップの画像特徴点と現在の画像特徴点のMSE • 特徴点がなるべく動かないようにする正則化項 • 現実世界の物体は瞬間移動しないという事前知識を与える 8
9.
補足 • 提案手法ではゼロパディングを積極的に用いている • ゼロパディングの有効性 –
How much position information do convolutional neural networks encode?[Islam+, 2020] – CNNが暗黙的に各ピクセルの位置情報を保持しているという仮説を検証 – 画像から各ピクセルの位置を表す値を予測するタスク – パディングが全くないモデルはパディングを入れたモデルと比べて非常に精度が悪 かった – パディングが位置を表すのに大きな役割を果たしていることを示唆 9
10.
実験 • 7自由度ロボットアーム • 2つのタスク –
Picking task • 物体位置ごとに各4回のデータ – Pick-and-place task • 組み合わせごとに各3回のデータ • ベースライン – 2D Softmax + LSTM[Abbeel+, 2015] – DSAE+LSTM[Abbeel+, 2016] – MRAE[Ogata+, 2020] 10
11.
実験 • 環境設定 – 学習時と同じ環境 –
明るさを変えた環境 – 背景を変えた環境 – 障害物を配置した環境 11
12.
結果 • Picking task –
100%の成功率を達成 • Pick-and-place task – 90%近い成功率を達成 • 環境変化しても成功率はほぼ変わらず 12
13.
結果 • LSTMの内部状態を主成分分析で可視化 – 提案手法は既存手法と比べて,物体の位置に応 じて内部状態が均等に分布している –
Placeでは内部状態が一点に収束 – Pickでは物体の位置に応じて内部状態が変化 – 物体の位置を内部状態に適切に反映している • 位置に対してロバスト • 内挿性能が高い 13
14.
まとめ • 画像内の物体の位置を抽象的に学習 • 次ステップの画像を予測して学習に利用 •
pickで100%,pick-and-placeで90%近くの成功率を達成 • 明るさや背景などの状況の変化に対して汎化性能を持つ 14
15.
今後の課題 • タスクによって特徴点では必要な情報を表しきれない可能性がある – 物体の向きや種類,画像内のロボットの姿勢を解釈できない –
布や紐など,非剛体を扱うことはできるか • 画像のEncoder-Decoderは同時に学習するべきか? – 同時に学習することでより最適な表現を学習できる – 並列処理できないLSTMが学習のボトルネックになる – 画像と動作という複数のLossを足すことで学習がやや不安定になる 15
Download