More Related Content
深層強化学習 Pydata.Okinawa Meetup #22 Study aiラビットチャレンジ 深層学習Day4 Similar to Imitation learning for robotics 勉強会資料(20240701) (20)
ビジョンとロボットの強化学習(更新版) Reinforcement Learning in Computer Vision and Robotics. 未来画像予測モデルと時間重み付けを導入した価値関数に基づく強化学習 強化学習とは (MIJS 分科会資料 2016/10/11) [DL輪読会]Learning to Act by Predicting the Future [DL輪読会]Unsupervised Neural Machine Translation [DL輪読会]Meta Reinforcement Learning Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vi... [DL輪読会]Imagination-Augmented Agents for Deep Reinforcement Learning / Learnin... Start rl with_unity_machine_learning_agents Decision Transformer: Reinforcement Learning via Sequence Modeling 「機械学習とは?」から始める Deep learning実践入門 Deep learningの世界に飛び込む前の命綱 More from Natsutani Minoru (20)
スモールデータ勉強会発表資料(2024年6月10日)公開用 夏谷実 @natsutan AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話 AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話 AutoMLとQumicoを使って、ラズパイでディープラーニングを動かす話 不足するAI人材に対する「パソナテックの人材育成ソリューション」 Imitation learning for robotics 勉強会資料(20240701)
- 14. 14
強化学習の出力(差分or座標)
ロボ制御の場合、出力は2種類
(x, y, z, roll, pitch, yaw)の
変化量を推論する
RT-1、RT-2、RT-X
(x, y, z, roll, pitch, yaw)の
移動先を推論する
こっちの方が学習しやすい。
ただし、実機の場所とAIが認識してい
る場所がどんどんずれていく。
ハンドを後少し回転さ
せて、5cm右に移動
(0.32, 025, 1.02)に移動して、
法線(0.22, 1.33, -0.2)にハン
ドの向きを合わせて