SlideShare a Scribd company logo
  	
Binarized Neural Networks	
Itay Hubara, Matthieu Courbariaux, Daniel Soudry,	
Ran El-Yaniv, Yoshua Bengio	
	
NIPS & ICDM 2016 輪読会	
紹介者:佐野正太郎	
株式会社リクルートコミュニケーションズ
(C)Recruit Communications Co., Ltd.	
Binarized Neural Networks	
モチベーション
•  ニューラルネットの省メモリ化
–  小数点精度は32bitも要らない場合が多い
–  組み込みシステムなどマシンパワーが低い場合の計算
提案手法:Binarized Neural Networks
•  重みとノード出力が全て二値化されたネットワーク
–  従来手法(BinaryConnect)では重みのみを二値化
•  バイナリオペレーションによる高速化
–  GPU計算で約7倍速(MNISTベンチマーク)
1
(C)Recruit Communications Co., Ltd.	
Binarized Neural Networks	
活性化関数 => 重み付き和の符号関数
計算をバイナリ化に合わせて変更
•  フォワード計算
•  バックプロパゲーション
•  バッチ正則化の高速化
•  AdaMaxの高速化
2
(C)Recruit Communications Co., Ltd.	
フォワード計算	
3
K層目	
バイナリ	
ベクトル	
二値化された	
重み行列を	
かける	
バッチ	
正則化	
K+1層目	
バイナリ	
ベクトル	
ベクトル	
各要素の	
二値化	
・・・	
 ・・・	
重み行列 Wk は連続値として保持	
フォワード計算時には二値化
(C)Recruit Communications Co., Ltd.	
XNORオペレーションの恩恵	
4
•  『活性化関数出力 x 重み』ごとにXNORをかけて足しこむ
•  XNORによるGPUカーネル => 32bit floatに比べ約5.3倍速
+1 -1 -1
-1
+1 -1 +1 -1
+1
(C)Recruit Communications Co., Ltd.	
バックプロパゲーション	
5
バッチ正則化	
逆伝播	
ロスに対する	
K+1層目の	
勾配ベクトル	
活性化関数への	
入力についての	
勾配ベクトル	
・・・	
 ・・・	
ロスに対する	
K層目の	
勾配ベクトル
(C)Recruit Communications Co., Ltd.	
バックプロパゲーション	
6
バッチ正則化	
逆伝播	
ロスに対する	
K+1層目の	
勾配ベクトル	
活性化関数への	
入力についての	
勾配ベクトル	
・・・	
 ・・・	
ロスに対する	
K層目の	
勾配ベクトル	
符号関数の勾配?
(C)Recruit Communications Co., Ltd.	
バックプロパゲーション	
Straight-through estimator [Hinton, 2012]
•  確率的な離散値を持つニューロンのバックプロパゲーション
•  決定的な符号関数の場合は下記のように近似
7
要素ごとの掛け算	
条件を満たす要素は1	
満たさない要素は0
(C)Recruit Communications Co., Ltd.	
バッチ正則化の高速化	
8
Batch Normalization	
Shift based	
Batch Normalization	
ミニバッチの平均	
入力の中心化	
ミニバッチの分散	
正規化	
スケール & シフト	
2の冪上への	
ラウンディング	
ビットシフト
(C)Recruit Communications Co., Ltd.	
AdaMaxの高速化	
Shift-based AdaMax [Kingma & Ba, 2014]
•  バッチ正則化と同様に乗算をシフト演算化
•  ハイパーパラメタの一部を2の冪乗に設定しておく	
 
9
(C)Recruit Communications Co., Ltd.	
実験:ベンチマーク評価	
10
	
 MNIST/SVHN/CIFAR-10でベースライン手法と比較…
(C)Recruit Communications Co., Ltd.	
実験:XNORカーネルによる高速化	
11
MNISTで	
7倍高速化	
	
 XNORカーネルで最適化した場合のフォワード計算速度…

More Related Content

PDF
(公開版)Reconf研2017GUINNESS
PDF
FPGAX2016 ドキュンなFPGA
PDF
2値ディープニューラルネットワークと組込み機器への応用: 開発中のツール紹介
PDF
DSF2018講演スライド
PDF
FPGAX2019
PDF
ROS User Group Meeting #28 マルチ深層学習とROS
PDF
Nested RNSを用いたディープニューラルネットワークのFPGA実装
PDF
2値化CNN on FPGAでGPUとガチンコバトル(公開版)
(公開版)Reconf研2017GUINNESS
FPGAX2016 ドキュンなFPGA
2値ディープニューラルネットワークと組込み機器への応用: 開発中のツール紹介
DSF2018講演スライド
FPGAX2019
ROS User Group Meeting #28 マルチ深層学習とROS
Nested RNSを用いたディープニューラルネットワークのFPGA実装
2値化CNN on FPGAでGPUとガチンコバトル(公開版)

What's hot (20)

PDF
高位合成でDeep learning
PDF
(公開版)FPGAエクストリームコンピューティング2017
PPTX
深層学習 第4章 大規模深層学習の実現技術
PPTX
Abstracts of FPGA2017 papers (Temporary Version)
PDF
Verilog-HDL Tutorial (1)
PPTX
LUT-Network ~本物のリアルタイムコンピューティングを目指して~
PDF
オープンソースコンパイラNNgenでつくるエッジ・ディープラーニングシステム
PDF
Tensor flow usergroup 2016 (公開版)
PDF
「ゼロから作るDeep learning」の畳み込みニューラルネットワークのハードウェア化
PDF
2015年度GPGPU実践プログラミング 第10回 行列計算(行列-行列積の高度な最適化)
PDF
ディープラーニング最新動向と技術情報
PDF
GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE)
PDF
自然言語処理に適した ニューラルネットのフレームワーク - - - DyNet - - -
PDF
2015年度GPGPU実践プログラミング 第7回 総和計算
PDF
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
PDF
モデルアーキテクチャ観点からのDeep Neural Network高速化
PDF
200625material naruse
PDF
DEEP LEARNING、トレーニング・インファレンスのGPUによる高速化
PPTX
LUT-Network Revision2
PDF
DAシンポジウム2019招待講演「深層学習モデルの高速なTraining/InferenceのためのHW/SW技術」 金子紘也hare
高位合成でDeep learning
(公開版)FPGAエクストリームコンピューティング2017
深層学習 第4章 大規模深層学習の実現技術
Abstracts of FPGA2017 papers (Temporary Version)
Verilog-HDL Tutorial (1)
LUT-Network ~本物のリアルタイムコンピューティングを目指して~
オープンソースコンパイラNNgenでつくるエッジ・ディープラーニングシステム
Tensor flow usergroup 2016 (公開版)
「ゼロから作るDeep learning」の畳み込みニューラルネットワークのハードウェア化
2015年度GPGPU実践プログラミング 第10回 行列計算(行列-行列積の高度な最適化)
ディープラーニング最新動向と技術情報
GPGPU Seminar (GPU Accelerated Libraries, 2 of 3, cuSPARSE)
自然言語処理に適した ニューラルネットのフレームワーク - - - DyNet - - -
2015年度GPGPU実践プログラミング 第7回 総和計算
GPGPU Seminar (GPU Accelerated Libraries, 3 of 3, Thrust)
モデルアーキテクチャ観点からのDeep Neural Network高速化
200625material naruse
DEEP LEARNING、トレーニング・インファレンスのGPUによる高速化
LUT-Network Revision2
DAシンポジウム2019招待講演「深層学習モデルの高速なTraining/InferenceのためのHW/SW技術」 金子紘也hare
Ad

Viewers also liked (7)

PDF
Bayesian Nonparametric Motor-skill Representations for Efficient Learning of ...
PDF
Dynamic filter networks
PDF
NIPS2016 Supervised Word Mover's Distance
PDF
NIPS Paper Reading, Data Programing
PPTX
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
PDF
再帰型ニューラルネット in 機械学習プロフェッショナルシリーズ輪読会
PDF
音声認識と深層学習
Bayesian Nonparametric Motor-skill Representations for Efficient Learning of ...
Dynamic filter networks
NIPS2016 Supervised Word Mover's Distance
NIPS Paper Reading, Data Programing
Fractality of Massive Graphs: Scalable Analysis with Sketch-Based Box-Coverin...
再帰型ニューラルネット in 機械学習プロフェッショナルシリーズ輪読会
音声認識と深層学習
Ad

Similar to Binarized Neural Networks (16)

PDF
バイナリニューラルネットとハードウェアの関係
PDF
ディープラーニング最近の発展とビジネス応用への課題
PDF
ハンズオン セッション 3: リカレント ニューラル ネットワーク入門
PDF
20180227_最先端のディープラーニング 研究開発を支えるGPU計算機基盤 「MN-1」のご紹介
PDF
NVIDIA ディープラーニング入門
PDF
エヌビディアが加速するディープラーニング ~進化するニューラルネットワークとその開発方法について~
PDF
無限ボルツマンマシンの学習
PDF
20171128分散深層学習とChainerMNについて
PDF
Deep learning実装の基礎と実践
PDF
Ncnn a universal and efficient neural network inference with vulkan
PDF
SBRA2018講演資料
PDF
MII conference177 nvidia
PDF
TensorFlow White Paperを読む
PPTX
RBMを応用した事前学習とDNN学習
PDF
Deep learning Libs @twm
PDF
Deep Learning Lab: DIMo & Chainer
バイナリニューラルネットとハードウェアの関係
ディープラーニング最近の発展とビジネス応用への課題
ハンズオン セッション 3: リカレント ニューラル ネットワーク入門
20180227_最先端のディープラーニング 研究開発を支えるGPU計算機基盤 「MN-1」のご紹介
NVIDIA ディープラーニング入門
エヌビディアが加速するディープラーニング ~進化するニューラルネットワークとその開発方法について~
無限ボルツマンマシンの学習
20171128分散深層学習とChainerMNについて
Deep learning実装の基礎と実践
Ncnn a universal and efficient neural network inference with vulkan
SBRA2018講演資料
MII conference177 nvidia
TensorFlow White Paperを読む
RBMを応用した事前学習とDNN学習
Deep learning Libs @twm
Deep Learning Lab: DIMo & Chainer

More from Shotaro Sano (6)

PDF
AutoML in NeurIPS 2018
PDF
PFDet: 2nd Place Solutions to Open Images Competition
PDF
Dropout Distillation
PDF
ディリクレ過程に基づく無限混合線形回帰モデル in 機械学習プロフェッショナルシリーズ輪読会
PDF
Microsoft Malware Classification Challenge 上位手法の紹介 (in Kaggle Study Meetup)
PDF
サポートベクトルデータ記述法による異常検知 in 機械学習プロフェッショナルシリーズ輪読会
AutoML in NeurIPS 2018
PFDet: 2nd Place Solutions to Open Images Competition
Dropout Distillation
ディリクレ過程に基づく無限混合線形回帰モデル in 機械学習プロフェッショナルシリーズ輪読会
Microsoft Malware Classification Challenge 上位手法の紹介 (in Kaggle Study Meetup)
サポートベクトルデータ記述法による異常検知 in 機械学習プロフェッショナルシリーズ輪読会

Recently uploaded (10)

PDF
Qlik TECH TALK セミナー:What's New In Qlik ~ 2025年7月リリース最新機能のご紹介
PDF
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
PDF
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
PDF
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
PDF
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
PDF
細胞培養用バイオリアクターおよび発酵槽市場規模の成長見通し:2031年には2823百万米ドルに到達へ
PDF
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
PDF
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
PDF
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
PDF
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
Qlik TECH TALK セミナー:What's New In Qlik ~ 2025年7月リリース最新機能のご紹介
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
細胞培養用バイオリアクターおよび発酵槽市場規模の成長見通し:2031年には2823百万米ドルに到達へ
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測

Binarized Neural Networks

  • 1.    Binarized Neural Networks Itay Hubara, Matthieu Courbariaux, Daniel Soudry, Ran El-Yaniv, Yoshua Bengio NIPS & ICDM 2016 輪読会 紹介者:佐野正太郎 株式会社リクルートコミュニケーションズ
  • 2. (C)Recruit Communications Co., Ltd. Binarized Neural Networks モチベーション •  ニューラルネットの省メモリ化 –  小数点精度は32bitも要らない場合が多い –  組み込みシステムなどマシンパワーが低い場合の計算 提案手法:Binarized Neural Networks •  重みとノード出力が全て二値化されたネットワーク –  従来手法(BinaryConnect)では重みのみを二値化 •  バイナリオペレーションによる高速化 –  GPU計算で約7倍速(MNISTベンチマーク) 1
  • 3. (C)Recruit Communications Co., Ltd. Binarized Neural Networks 活性化関数 => 重み付き和の符号関数 計算をバイナリ化に合わせて変更 •  フォワード計算 •  バックプロパゲーション •  バッチ正則化の高速化 •  AdaMaxの高速化 2
  • 4. (C)Recruit Communications Co., Ltd. フォワード計算 3 K層目 バイナリ ベクトル 二値化された 重み行列を かける バッチ 正則化 K+1層目 バイナリ ベクトル ベクトル 各要素の 二値化 ・・・ ・・・ 重み行列 Wk は連続値として保持 フォワード計算時には二値化
  • 5. (C)Recruit Communications Co., Ltd. XNORオペレーションの恩恵 4 •  『活性化関数出力 x 重み』ごとにXNORをかけて足しこむ •  XNORによるGPUカーネル => 32bit floatに比べ約5.3倍速 +1 -1 -1 -1 +1 -1 +1 -1 +1
  • 6. (C)Recruit Communications Co., Ltd. バックプロパゲーション 5 バッチ正則化 逆伝播 ロスに対する K+1層目の 勾配ベクトル 活性化関数への 入力についての 勾配ベクトル ・・・ ・・・ ロスに対する K層目の 勾配ベクトル
  • 7. (C)Recruit Communications Co., Ltd. バックプロパゲーション 6 バッチ正則化 逆伝播 ロスに対する K+1層目の 勾配ベクトル 活性化関数への 入力についての 勾配ベクトル ・・・ ・・・ ロスに対する K層目の 勾配ベクトル 符号関数の勾配?
  • 8. (C)Recruit Communications Co., Ltd. バックプロパゲーション Straight-through estimator [Hinton, 2012] •  確率的な離散値を持つニューロンのバックプロパゲーション •  決定的な符号関数の場合は下記のように近似 7 要素ごとの掛け算 条件を満たす要素は1 満たさない要素は0
  • 9. (C)Recruit Communications Co., Ltd. バッチ正則化の高速化 8 Batch Normalization Shift based Batch Normalization ミニバッチの平均 入力の中心化 ミニバッチの分散 正規化 スケール & シフト 2の冪上への ラウンディング ビットシフト
  • 10. (C)Recruit Communications Co., Ltd. AdaMaxの高速化 Shift-based AdaMax [Kingma & Ba, 2014] •  バッチ正則化と同様に乗算をシフト演算化 •  ハイパーパラメタの一部を2の冪乗に設定しておく 9
  • 11. (C)Recruit Communications Co., Ltd. 実験:ベンチマーク評価 10 MNIST/SVHN/CIFAR-10でベースライン手法と比較…
  • 12. (C)Recruit Communications Co., Ltd. 実験:XNORカーネルによる高速化 11 MNISTで 7倍高速化 XNORカーネルで最適化した場合のフォワード計算速度…