Submit Search
[DLHacks 実装] DeepPose: Human Pose Estimation via Deep Neural Networks
6 likes
3,350 views
Deep Learning JP
Deep Learning JP: http://deeplearning.jp/hacks/
Technology
Related topics:
Deep Learning
Read more
1 of 12
Download now
Downloaded 25 times
1
2
3
4
5
6
7
8
9
10
11
12
More Related Content
PDF
Deep Learningによる超解像の進歩
Hiroto Honda
PDF
Attentionの基礎からTransformerの入門まで
AGIRobots
PDF
DeepPose: Human Pose Estimation via Deep Neural Networks
Shunta Saito
PDF
【メタサーベイ】Vision and Language のトップ研究室/研究者
cvpaper. challenge
PPTX
[DL輪読会]Objects as Points
Deep Learning JP
PDF
Action Recognitionの歴史と最新動向
Ohnishi Katsunori
PPTX
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
Deep Learning JP
PDF
Transformerを多層にする際の勾配消失問題と解決法について
Sho Takase
Deep Learningによる超解像の進歩
Hiroto Honda
Attentionの基礎からTransformerの入門まで
AGIRobots
DeepPose: Human Pose Estimation via Deep Neural Networks
Shunta Saito
【メタサーベイ】Vision and Language のトップ研究室/研究者
cvpaper. challenge
[DL輪読会]Objects as Points
Deep Learning JP
Action Recognitionの歴史と最新動向
Ohnishi Katsunori
[DL輪読会]Set Transformer: A Framework for Attention-based Permutation-Invariant...
Deep Learning JP
Transformerを多層にする際の勾配消失問題と解決法について
Sho Takase
What's hot
(20)
PPTX
画像処理AIを用いた異常検知
Hideo Terada
PDF
全力解説!Transformer
Arithmer Inc.
PDF
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
Deep Learning JP
PPTX
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Yusuke Uchida
PDF
3次元レジストレーション(PCLデモとコード付き)
Toru Tamaki
PDF
深層学習によるHuman Pose Estimationの基礎
Takumi Ohkuma
PDF
画像認識モデルを作るための鉄板レシピ
Takahiro Kubo
PPTX
SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)
Yusuke Uchida
PDF
【メタサーベイ】Neural Fields
cvpaper. challenge
PDF
画像生成・生成モデル メタサーベイ
cvpaper. challenge
PPTX
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
Deep Learning JP
PPTX
[DL輪読会]Pay Attention to MLPs (gMLP)
Deep Learning JP
PDF
動画認識サーベイv1(メタサーベイ )
cvpaper. challenge
PDF
点群深層学習 Meta-study
Naoya Chiba
PPTX
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
Yusuke Uchida
PDF
SSII2019企画: 点群深層学習の研究動向
SSII
PDF
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
Deep Learning JP
PPTX
畳み込みニューラルネットワークの研究動向
Yusuke Uchida
PPTX
Curriculum Learning (関東CV勉強会)
Yoshitaka Ushiku
PDF
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII
画像処理AIを用いた異常検知
Hideo Terada
全力解説!Transformer
Arithmer Inc.
【DL輪読会】マルチエージェント強化学習における近年の 協調的方策学習アルゴリズムの発展
Deep Learning JP
Swin Transformer (ICCV'21 Best Paper) を完璧に理解する資料
Yusuke Uchida
3次元レジストレーション(PCLデモとコード付き)
Toru Tamaki
深層学習によるHuman Pose Estimationの基礎
Takumi Ohkuma
画像認識モデルを作るための鉄板レシピ
Takahiro Kubo
SuperGlue;Learning Feature Matching with Graph Neural Networks (CVPR'20)
Yusuke Uchida
【メタサーベイ】Neural Fields
cvpaper. challenge
画像生成・生成モデル メタサーベイ
cvpaper. challenge
【DL輪読会】Flamingo: a Visual Language Model for Few-Shot Learning 画像×言語の大規模基盤モ...
Deep Learning JP
[DL輪読会]Pay Attention to MLPs (gMLP)
Deep Learning JP
動画認識サーベイv1(メタサーベイ )
cvpaper. challenge
点群深層学習 Meta-study
Naoya Chiba
You Only Look One-level Featureの解説と見せかけた物体検出のよもやま話
Yusuke Uchida
SSII2019企画: 点群深層学習の研究動向
SSII
[DL輪読会]Learning Transferable Visual Models From Natural Language Supervision
Deep Learning JP
畳み込みニューラルネットワークの研究動向
Yusuke Uchida
Curriculum Learning (関東CV勉強会)
Yoshitaka Ushiku
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向
SSII
Similar to [DLHacks 実装] DeepPose: Human Pose Estimation via Deep Neural Networks
(20)
PPTX
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
Deep Learning JP
PPTX
[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...
Deep Learning JP
PPTX
[DL輪読会]3D Human Pose Estimation @ CVPR’19 / ICCV’19
Deep Learning JP
PDF
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
Toru Tamaki
PPTX
よわよわPCによる姿勢推定 -PoseNet-
Yuto Mori
PPTX
[DL輪読会]Human Pose Estimation @ ECCV2018
Deep Learning JP
PPTX
2018 07 02_dense_pose
harmonylab
PDF
PFI成果発表会2014発表資料 Where Do You Look?
Hokuto Kagaya
PPTX
Sprint16 papers research
MisakiRyo
PPTX
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Deep Learning JP
PPTX
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Takumi Ohkuma
PDF
[DL Hacks 実装]Representation Learning by Rotating Your Faces
Deep Learning JP
PDF
AIoTLT 組み込み人姿勢検出CNN
Yukiyoshi Sasao
PPTX
CVPR Festival
Masafumi Noda
PPTX
【DL輪読会】EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Pointsfor...
Deep Learning JP
PPTX
Eccv2018 report day2
Atsushi Hashimoto
PDF
CVPR2017勉強会 Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
Koichi Takahashi
PDF
【メタサーベイ】Face, Gesture, and Body Pose
cvpaper. challenge
PDF
CVPR2011 Festival PDF
Masafumi Noda
PDF
[DL輪読会]CVPR2019:Weakly-Supervised Discovery of Geometry-Aware Representation ...
Deep Learning JP
[DL輪読会]Deep High-Resolution Representation Learning for Human Pose Estimation
Deep Learning JP
[DL輪読会]VoxelPose: Towards Multi-Camera 3D Human Pose Estimation in Wild Envir...
Deep Learning JP
[DL輪読会]3D Human Pose Estimation @ CVPR’19 / ICCV’19
Deep Learning JP
論文紹介:Deep Learning-Based Human Pose Estimation: A Survey
Toru Tamaki
よわよわPCによる姿勢推定 -PoseNet-
Yuto Mori
[DL輪読会]Human Pose Estimation @ ECCV2018
Deep Learning JP
2018 07 02_dense_pose
harmonylab
PFI成果発表会2014発表資料 Where Do You Look?
Hokuto Kagaya
Sprint16 papers research
MisakiRyo
【DL輪読会】ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Deep Learning JP
「解説資料」ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Takumi Ohkuma
[DL Hacks 実装]Representation Learning by Rotating Your Faces
Deep Learning JP
AIoTLT 組み込み人姿勢検出CNN
Yukiyoshi Sasao
CVPR Festival
Masafumi Noda
【DL輪読会】EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Pointsfor...
Deep Learning JP
Eccv2018 report day2
Atsushi Hashimoto
CVPR2017勉強会 Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
Koichi Takahashi
【メタサーベイ】Face, Gesture, and Body Pose
cvpaper. challenge
CVPR2011 Festival PDF
Masafumi Noda
[DL輪読会]CVPR2019:Weakly-Supervised Discovery of Geometry-Aware Representation ...
Deep Learning JP
More from Deep Learning JP
(20)
PPTX
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
PPTX
【DL輪読会】事前学習用データセットについて
Deep Learning JP
PPTX
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
PPTX
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
Deep Learning JP
PPTX
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
Deep Learning JP
PPTX
【DL輪読会】マルチモーダル LLM
Deep Learning JP
PDF
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
Deep Learning JP
PPTX
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
PDF
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
PPTX
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
PPTX
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
Deep Learning JP
PDF
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
Deep Learning JP
PDF
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
Deep Learning JP
PPTX
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
Deep Learning JP
PPTX
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
PDF
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
Deep Learning JP
PPTX
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
PDF
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
Deep Learning JP
PDF
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
Deep Learning JP
PPTX
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Deep Learning JP
【DL輪読会】AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners
Deep Learning JP
【DL輪読会】事前学習用データセットについて
Deep Learning JP
【DL輪読会】 "Learning to render novel views from wide-baseline stereo pairs." CVP...
Deep Learning JP
【DL輪読会】Zero-Shot Dual-Lens Super-Resolution
Deep Learning JP
【DL輪読会】BloombergGPT: A Large Language Model for Finance arxiv
Deep Learning JP
【DL輪読会】マルチモーダル LLM
Deep Learning JP
【 DL輪読会】ToolLLM: Facilitating Large Language Models to Master 16000+ Real-wo...
Deep Learning JP
【DL輪読会】AnyLoc: Towards Universal Visual Place Recognition
Deep Learning JP
【DL輪読会】Can Neural Network Memorization Be Localized?
Deep Learning JP
【DL輪読会】Hopfield network 関連研究について
Deep Learning JP
【DL輪読会】SimPer: Simple self-supervised learning of periodic targets( ICLR 2023 )
Deep Learning JP
【DL輪読会】RLCD: Reinforcement Learning from Contrast Distillation for Language M...
Deep Learning JP
【DL輪読会】"Secrets of RLHF in Large Language Models Part I: PPO"
Deep Learning JP
【DL輪読会】"Language Instructed Reinforcement Learning for Human-AI Coordination "
Deep Learning JP
【DL輪読会】Llama 2: Open Foundation and Fine-Tuned Chat Models
Deep Learning JP
【DL輪読会】"Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware"
Deep Learning JP
【DL輪読会】Parameter is Not All You Need:Starting from Non-Parametric Networks fo...
Deep Learning JP
【DL輪読会】Drag Your GAN: Interactive Point-based Manipulation on the Generative ...
Deep Learning JP
【DL輪読会】Self-Supervised Learning from Images with a Joint-Embedding Predictive...
Deep Learning JP
【DL輪読会】Towards Understanding Ensemble, Knowledge Distillation and Self-Distil...
Deep Learning JP
[DLHacks 実装] DeepPose: Human Pose Estimation via Deep Neural Networks
1.
DeepPose: Human Pose
Estimation via Deep Neural Networks 東京⼤学⼤学院⼯学系研究科 技術経営戦略学専攻 松尾研究室 ⼤野峻典
2.
発表の⽬的 • 今回の発表のハイライト – DeepPose,
姿勢検知界隈 – PyTorchでの実装⽅法・ノウハウ理解 – 実装を⼿元で動かしてみる発表スタイル試み 2
3.
書誌情報 3 • 論⽂名:“DeepPose: Human
Pose Estimation via Deep Neural Networks” – https://arxiv.org/pdf/1312.4659 • 著者:Alexander Toshev, Christian Szegedy – Google • 公開⽇:20 Aug 2014 • IEEE Conference on Computer Vision and Pattern Recognition, 2014 • ※ 特に断りが無い場合は, 上記論⽂, Slide, Videoから引⽤
4.
こういうことができる 4
5.
CNNによる姿勢推定 • GoogleLeNetチームの⼈が書いたCNNによる姿勢推定 • AlexNetのアーキテクチャをそのまま利⽤ •
Dec 2013時点でSoTA • CNNを利⽤した回帰問題としての姿勢推定の最初の論⽂で以降ベンチマー ク 5
6.
Introduction • ⼈間は隠れている関節の位置を推測できる – 他の部位の様⼦や対象⼈物の動きから推測 –
→ 「全体的に⾒て, 推測する」ことが重要 • DNNならこの辺うまくできそう. • 既存研究では, パーツごと検出してあとでパーツ間の関係を考慮する⼿法が 多い. • → DNNなら特徴量設計しなくていい & パーツ検出器設計いらない & 関節 間の相互関係などのモデルもいらない • DeepPoseでは 複数のDNNを直列につなげる – ⼤まかに各関節の初期位置を推定するDNN – 推定された位置の画像を切り出したもの⽤いて, 関節位置推定するDNN ← – 各関節推定のためのDCNNの直列の繋ぎ合わせ 6
7.
Deep Learning Model
for Pose Estimation • データセット – x: 画像 – y: k個の各関節の位置座標値を⼀列に連結したベクトル 7
8.
⼈物領域の切り出し 8 • 元画像から固定サイズ(220x220)で⼈物領域を切り出す. – 学習時:アノテーションされている関節位置から上下左右端にある関節に合わせて, Crop.
⼤きさに合わせてScale, Padding. – 推論時:⼈物領域のbounding box推定.(※) • 切り出しに合わせて座標位置も変換.
9.
CNNによる関節位置の推定 • 画像xを姿勢ベクトルyに回帰する関数ψ(x;θ) ∈
R2kを学習.(k:関節数) • ψを事前に決めたサイズ(220x220)の3チャンネルの⼊⼒画像を取り, 2k次 元のベクトルy*を出⼒するDeep Convolutional Neural Networkで近似. • CNNのアーキテクチャ:AlexNet – 最終層は1000unitsではなく2k units – 13層アーキテクチャ:C(55 x 55 x 96) - LRN - P - C(27 x 27 x 256) - LRN - P - C(13 x 13 x 384) - C(13 x 13 x 384) - C(13 x 13 x 256) - P - F(4096) - F(4096) - F(2k) – 活性化関数には全てReLu – フィルタサイズは, 下から順位, 11x11, 5x5, 3x3, 3x3 9
10.
複数DCNNの直列接続 • DCNNの⼊⼒が220x220なので荒い画像しか⾒れない. • 各関節の正確な位置推定のため,
同じアーキテクチャのDCNNを複数, 直列 に接続する. – パラメータはステージごとに⽤意(全体で共有はしない) • 1つ下のステージの予測結果と、正解のズレ(yi (s-1) - yi)の平均と分散を 計算し, これらをパラメータとして1つ正規分布と使って⽣成したノイズを 正解に付加して予測結果とする • 各ステージのBounding boxは, 予測値(y)と, 体幹部の⼤きさ(diam)で取得 10
11.
訓練 • データ前処理 – 画像から⼈物領域切り出し. –
データセット内のデータを⼈物領域切り出した画像上の座標に変換. • 誤差関数 – 予測ベクトルψ(x;θ)と正解ベクトルyの間のユークリッド距離 – K個の関節ごとのL2距離の合計(MSE) • 勾配降下法:Momentum SGD or Adam • Data Augumentation: ランダムCrop, ランダムノイズ 11
12.
実装説明 • https://github.com/DLHacks/DeepPose 12
Download