Submit Search
ROS User Group Meeting #28 マルチ深層学習とROS
0 likes
2,264 views
Hiroki Nakahara
ROS User Group MeetingでLTに使った資料です。 マルチ深層学習タスクをROS上で動かすことにチャレンジしています。
Engineering
Read more
1 of 24
Download now
Downloaded 13 times
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
More Related Content
PDF
DSF2018講演スライド
Hiroki Nakahara
PDF
FPGAX2016 ドキュンなFPGA
Hiroki Nakahara
PDF
FPGAX2019
Hiroki Nakahara
PDF
2値化CNN on FPGAでGPUとガチンコバトル(公開版)
Hiroki Nakahara
PDF
2値ディープニューラルネットワークと組込み機器への応用: 開発中のツール紹介
Hiroki Nakahara
PDF
(公開版)FPGAエクストリームコンピューティング2017
Hiroki Nakahara
PDF
SBRA2018講演資料
Hiroki Nakahara
PDF
高位合成でDeep learning
Mori Labo.
DSF2018講演スライド
Hiroki Nakahara
FPGAX2016 ドキュンなFPGA
Hiroki Nakahara
FPGAX2019
Hiroki Nakahara
2値化CNN on FPGAでGPUとガチンコバトル(公開版)
Hiroki Nakahara
2値ディープニューラルネットワークと組込み機器への応用: 開発中のツール紹介
Hiroki Nakahara
(公開版)FPGAエクストリームコンピューティング2017
Hiroki Nakahara
SBRA2018講演資料
Hiroki Nakahara
高位合成でDeep learning
Mori Labo.
What's hot
(20)
PPTX
深層学習 第4章 大規模深層学習の実現技術
孝昌 田中
PDF
Verilog-HDL Tutorial (1)
Hiroki Nakahara
PDF
Tensor flow usergroup 2016 (公開版)
Hiroki Nakahara
PDF
(公開版)Reconf研2017GUINNESS
Hiroki Nakahara
PDF
Nested RNSを用いたディープニューラルネットワークのFPGA実装
Hiroki Nakahara
PDF
Binarized Neural Networks
Shotaro Sano
PDF
モデルアーキテクチャ観点からのDeep Neural Network高速化
Yusuke Uchida
PDF
Convolutional Neural Network @ CV勉強会関東
Hokuto Kagaya
PPTX
畳み込みニューラルネットワークの研究動向
Yusuke Uchida
PDF
「ゼロから作るDeep learning」の畳み込みニューラルネットワークのハードウェア化
marsee101
PDF
ディープラーニング最新動向と技術情報
NVIDIA Japan
PDF
電波望遠鏡用の分光器をAltera SDK for OpenCL使ってサクッと作ってみた
Hiroki Nakahara
PPTX
Res netと派生研究の紹介
masataka nishimori
PDF
深層学習入門
Danushka Bollegala
PDF
semantic segmentation サーベイ
yohei okawa
PDF
GRU-Prednetを実装してみた(途中経過)
Taichi Iki
PPTX
CNNの構造最適化手法について
MasanoriSuganuma
PPTX
多層NNの教師なし学習 コンピュータビジョン勉強会@関東 2014/5/26
Takashi Abe
PPTX
Pred net使ってみた
koji ochiai
PDF
PreadNet
Junya Kuwada
深層学習 第4章 大規模深層学習の実現技術
孝昌 田中
Verilog-HDL Tutorial (1)
Hiroki Nakahara
Tensor flow usergroup 2016 (公開版)
Hiroki Nakahara
(公開版)Reconf研2017GUINNESS
Hiroki Nakahara
Nested RNSを用いたディープニューラルネットワークのFPGA実装
Hiroki Nakahara
Binarized Neural Networks
Shotaro Sano
モデルアーキテクチャ観点からのDeep Neural Network高速化
Yusuke Uchida
Convolutional Neural Network @ CV勉強会関東
Hokuto Kagaya
畳み込みニューラルネットワークの研究動向
Yusuke Uchida
「ゼロから作るDeep learning」の畳み込みニューラルネットワークのハードウェア化
marsee101
ディープラーニング最新動向と技術情報
NVIDIA Japan
電波望遠鏡用の分光器をAltera SDK for OpenCL使ってサクッと作ってみた
Hiroki Nakahara
Res netと派生研究の紹介
masataka nishimori
深層学習入門
Danushka Bollegala
semantic segmentation サーベイ
yohei okawa
GRU-Prednetを実装してみた(途中経過)
Taichi Iki
CNNの構造最適化手法について
MasanoriSuganuma
多層NNの教師なし学習 コンピュータビジョン勉強会@関東 2014/5/26
Takashi Abe
Pred net使ってみた
koji ochiai
PreadNet
Junya Kuwada
Ad
Similar to ROS User Group Meeting #28 マルチ深層学習とROS
(20)
PDF
16th_ACRi_Webinar_Kumamoto-Univ_Okawa_20240308.pdf
直久 住川
PPTX
ゼロから深層学習を学ぶ方法 - CMS大阪夏祭り2017
Tomo Masuda
PDF
マイクロソフトが考えるAI活用のロードマップ
Deep Learning Lab(ディープラーニング・ラボ)
PDF
DAシンポジウム2019招待講演「深層学習モデルの高速なTraining/InferenceのためのHW/SW技術」 金子紘也hare
Preferred Networks
PDF
実社会・実環境におけるロボットの機械学習 ver. 2
Kuniyuki Takahashi
PPTX
Image net classification with Deep Convolutional Neural Networks
Shingo Horiuchi
PDF
Deep Learningと画像認識 ~歴史・理論・実践~
nlab_utokyo
PPTX
「機械学習とは?」から始める Deep learning実践入門
Hideto Masuoka
PDF
FPGA, AI, エッジコンピューティング
Hideo Terada
PDF
GTC 2016 ディープラーニング最新情報
NVIDIA Japan
PDF
【Deep Learning】AlexNetの解説&実装 by PyTorch (colabリンク付き)
Daichi Hayashi
PDF
IROS2020 survey
robotpaperchallenge
PPTX
2018/06/23 Sony"s deep learning software and the latest information
Sony Network Communications Inc.
PDF
20140726.西野研セミナー
Hayaru SHOUNO
PDF
[DL輪読会]Making Sense of Vision and Touch: Self-Supervised Learning of Multimod...
Deep Learning JP
PDF
TAI_GDEP_Webinar_1a_27Oct2020
ssuser5b12d1
PDF
MANABIYA Machine Learning Hands-On
陽平 山口
PDF
MIRU2018 tutorial
Takayoshi Yamashita
PDF
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
nlab_utokyo
PDF
MIRU_Preview_JSAI2019
Takayoshi Yamashita
16th_ACRi_Webinar_Kumamoto-Univ_Okawa_20240308.pdf
直久 住川
ゼロから深層学習を学ぶ方法 - CMS大阪夏祭り2017
Tomo Masuda
マイクロソフトが考えるAI活用のロードマップ
Deep Learning Lab(ディープラーニング・ラボ)
DAシンポジウム2019招待講演「深層学習モデルの高速なTraining/InferenceのためのHW/SW技術」 金子紘也hare
Preferred Networks
実社会・実環境におけるロボットの機械学習 ver. 2
Kuniyuki Takahashi
Image net classification with Deep Convolutional Neural Networks
Shingo Horiuchi
Deep Learningと画像認識 ~歴史・理論・実践~
nlab_utokyo
「機械学習とは?」から始める Deep learning実践入門
Hideto Masuoka
FPGA, AI, エッジコンピューティング
Hideo Terada
GTC 2016 ディープラーニング最新情報
NVIDIA Japan
【Deep Learning】AlexNetの解説&実装 by PyTorch (colabリンク付き)
Daichi Hayashi
IROS2020 survey
robotpaperchallenge
2018/06/23 Sony"s deep learning software and the latest information
Sony Network Communications Inc.
20140726.西野研セミナー
Hayaru SHOUNO
[DL輪読会]Making Sense of Vision and Touch: Self-Supervised Learning of Multimod...
Deep Learning JP
TAI_GDEP_Webinar_1a_27Oct2020
ssuser5b12d1
MANABIYA Machine Learning Hands-On
陽平 山口
MIRU2018 tutorial
Takayoshi Yamashita
Deep Learningによる画像認識革命 ー歴史・最新理論から実践応用までー
nlab_utokyo
MIRU_Preview_JSAI2019
Takayoshi Yamashita
Ad
More from Hiroki Nakahara
(19)
PDF
FCCM2020: High-Throughput Convolutional Neural Network on an FPGA by Customiz...
Hiroki Nakahara
PDF
ISCAS'18: A Deep Neural Network on the Nested RNS (NRNS) on an FPGA: Applied ...
Hiroki Nakahara
PDF
ISMVL2018: A Ternary Weight Binary Input Convolutional Neural Network
Hiroki Nakahara
PDF
FPGA2018: A Lightweight YOLOv2: A binarized CNN with a parallel support vecto...
Hiroki Nakahara
PDF
FPT17: An object detector based on multiscale sliding window search using a f...
Hiroki Nakahara
PDF
A Random Forest using a Multi-valued Decision Diagram on an FPGa
Hiroki Nakahara
PDF
Altera sdk for open cl アンケート集計結果(公開版)
Hiroki Nakahara
PDF
Naist2015 dec ver1
Hiroki Nakahara
PDF
FPL15 talk: Deep Convolutional Neural Network on FPGA
Hiroki Nakahara
PDF
私のファミコンのfpsは530000です。もちろんフルパワーで(以下略
Hiroki Nakahara
PDF
Verilog-HDL Tutorial (15) software
Hiroki Nakahara
PDF
Verilog-HDL Tutorial (15) hardware
Hiroki Nakahara
PDF
Verilog-HDL Tutorial (14)
Hiroki Nakahara
PDF
Verilog-HDL Tutorial (13)
Hiroki Nakahara
PDF
Verilog-HDL Tutorial (12)
Hiroki Nakahara
PDF
Verilog-HDL Tutorial (11)
Hiroki Nakahara
PDF
Verilog-HDL Tutorial (9)
Hiroki Nakahara
PDF
Verilog-HDL Tutorial (8)
Hiroki Nakahara
PDF
Verilog-HDL Tutorial (7)
Hiroki Nakahara
FCCM2020: High-Throughput Convolutional Neural Network on an FPGA by Customiz...
Hiroki Nakahara
ISCAS'18: A Deep Neural Network on the Nested RNS (NRNS) on an FPGA: Applied ...
Hiroki Nakahara
ISMVL2018: A Ternary Weight Binary Input Convolutional Neural Network
Hiroki Nakahara
FPGA2018: A Lightweight YOLOv2: A binarized CNN with a parallel support vecto...
Hiroki Nakahara
FPT17: An object detector based on multiscale sliding window search using a f...
Hiroki Nakahara
A Random Forest using a Multi-valued Decision Diagram on an FPGa
Hiroki Nakahara
Altera sdk for open cl アンケート集計結果(公開版)
Hiroki Nakahara
Naist2015 dec ver1
Hiroki Nakahara
FPL15 talk: Deep Convolutional Neural Network on FPGA
Hiroki Nakahara
私のファミコンのfpsは530000です。もちろんフルパワーで(以下略
Hiroki Nakahara
Verilog-HDL Tutorial (15) software
Hiroki Nakahara
Verilog-HDL Tutorial (15) hardware
Hiroki Nakahara
Verilog-HDL Tutorial (14)
Hiroki Nakahara
Verilog-HDL Tutorial (13)
Hiroki Nakahara
Verilog-HDL Tutorial (12)
Hiroki Nakahara
Verilog-HDL Tutorial (11)
Hiroki Nakahara
Verilog-HDL Tutorial (9)
Hiroki Nakahara
Verilog-HDL Tutorial (8)
Hiroki Nakahara
Verilog-HDL Tutorial (7)
Hiroki Nakahara
ROS User Group Meeting #28 マルチ深層学習とROS
1.
中原 啓貴 東京⼯業⼤学 マルチ深層学習タスクとROSによる ⾼機能なロボットを⽬指して
2.
⾃⼰紹介 • なかはら ひろき
(Hiroki Nakahara) https://github.com/HirokiNakahara/ • 速いコンピュータを作りたい • 多値論理: Ternary, RNS • 計算機アーキテクチャ: FPGA, ASIC • 深層学習 • ツールとか: GUINNESS (GUI based neural network synthesizer) 2
3.
GUINNESS ツールフロー .model Binarized CNN Weight Chainer to C++ Model to Text Binarized Weight .txt PL code .cpp PS code .cpp gcc HLS .elf .bit .pkl Label Data .txt CNN Spec. .py Image Data PS PL Exe. data Bit stream BRAM FPGA GUIによる 操作 ユーザの 学習⽤画像 GPU上で学習 FPGAベンダの システム設計ツールで ビットストリーム⽣成 https://github.com/HirokiNakahara/GUINNESS
4.
Deep Learning is Everywhere 4
5.
Applications • Robotics, autonomous driving, security, drones… 5
6.
Object Detection 6 Person J. Redmon and A. Farhadi, "YOLOv3: An Incremental Improvement," arXiv, 2018 Person Boat
7.
Semantic Segmentation 7E. Shelhamer, J. Long and T. Darrell, "Fully Convolutional Networks for Semantic Segmentation," IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol.39, No.4, 2017, pp. 640 ‐ 651.
8.
Pose Estimation 8 Z. Cao, T. Simon, S.‐E. Wei and Y. Sheikh, " Realtime Multi‐Person 2D Pose Estimation using Part Affinity Fields," CVPR, 2017.
9.
Depth Map Prediction 9 D. Eigen, C. Puhrsch and R. Fergus, "Depth Map Prediction from a Single Image using a Multi‐Scale Deep Network," arXiv:1406.2283 , 2014.
10.
Demo: Low‐end FPGA 10 Xilinx Inc. Zynq
UltraScale+ MPSoC (ZU3EG) 30FPS (YOLOv2)
11.
Demo: High‐end FPGA 11 Intel Corp. Arria
10 GX FPGA (10AX115N2F45E1SG), 166FPS (YOLOv2)
12.
Demo Segmentation (AlexNet‐based FCN), 50 FPS 12
13.
まじめな話 • 超⾼齢者社会に向けて • Home Support Robot (HSR) 13
14.
本⾳ • ロボットを作りたい︕ 14
15.
Convolutional Neural Network (CNN) • Convolutional + Fully connected + Pooling • State‐of‐the‐art
performance in an image recognition task • Widely applicable 15Source: https://www.mathworks.com/discovery/convolutional‐neural‐network.html
16.
Deep Learning Inference Device 16 Flexibility Power Performance Efficiency CPU (Raspberry Pi3) GPU (Jetson TX2) FPGA (UltraZed) ASIC (Movidius) • Flexibility: R&D costs for keeping on evolving algorithms • Power performance efficiency •
FPGA has flexibility&better performance
17.
Field Programmable Gate Array (FPGA) • Millions of Look‐Up Tables (LUTs) • Thousands of on‐chip memories and DSP blocks •
Programmable channels • Dedicated IP macros (PCIe,DDR,MPU) 17Source: Intel Corp. Arria10 FPGA Device Family Overview
18.
Improvements by Binarization 18 x1 w0 (Bias) fsgn(Y) Y z w1 x2 w2 xn wn ... x1 x2
Y ‐1 ‐1 1 ‐1 +1 ‐1 +1 ‐1 ‐1 +1 +1 1 x1 x2 Y 0 0 1 0 1 0 1 0 0 1 1 1 EXNORs → Many MACs Binary Precision → On‐chip Memory
19.
Near Memory Realization by Binarization E. Joel et al., “Tutorial on Hardware Architectures for Deep Neural Networks,” MICRO‐49, 2016. 19 On-chip Memory J. Dean, “Numbers everyone should know” Source: https://gist.github.com/2841832 • High bandwidth (Left) •
Less power consumption (Right)
20.
PYNQ + ⾼位合成 + ROS http://www.pynq.io/ • C++で記述, HLSでIPコア(ROSノード)化 •
Ubuntu 上のPythonでSW設計 →ROS Kinetic を利⽤ 20 ‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐ ‐‐‐‐‐‐‐ http://www.pynq.io/
21.
プロトタイプ 21 ホストPC (Ubuntu16.04+ROS Kinetic) FPGA (ZCU104 Board) ホストPCのカメラ アクチュエータ Roomba 約8万円 ミドルクラス FPGA搭載 (Zynq Ultra Scale+) Roomba以外の 電源(omnicharge) ホストPCとFPGAはEthernetで接続
22.
22 ⼈をストーカー 追跡する ロボット → 警備員 ロボット
23.
Multiple DL Tasks • Taskonomy [Zamir, CVPR2018 (best paper)] •
http://taskonomy.stanford.edu/ • 26種類のタスクを同時に学習・実⾏ • ロボットでやりたい︕ 23
24.
まとめ • FPGAを使うと⾼性能なDLをROSで扱える(といいな) • オンチップメモリ利⽤ •
Pynqフレームワーク • 設計難易度が⾼いのがネック →フレームワークを開発中 • マルチ深層学習タスク • 複数画像処理+⾳声処理も可能 24
Download