SlideShare a Scribd company logo
コンピュータアーキテクチャ研究の
最新動向
∼ISCA2015参加報告∼
高前田 伸也
奈良先端科学技術大学院大学 情報科学研究科
E-mail: shinya_at_is_naist_jp
2015年8月2日
FPGAX #7 Lightning Talk
自己紹介
奈良で計算機の
研究をしています
「Python+FPGA」
が最近のテーマ
最近のプロダクト
Veriloggen
PythonでHDLを
組み立てるLib
GitHubからどうぞ!
[github veriloggen]
FPGAX#7 Shinya T-Y, NAIST 2
実行
Verilog HDLPython
IEEE/ACM ISCA (International Conference on
Computer Architecture)
n  コンピュータアーキテクチャのトップ国際会議
l  今年は米国ポートランドでPLDIやHPDC等と同時開催 (FCRC)
l  MICRO, ASPLOS, HPCAを全部通すとグランドスラムらしい
n  今年の採択率: 19.0%(FPGA系よりもかなり難しい)
l  投稿数: 305
l  採択論文数: 58
n  10のチュートリアル・13のワークショップ
l  今後流行るテーマは本会議よりもワークショップに多い
n  FCRC全体で数千人の参加者・ISCA単体で1000名近い
l  企業展示がないCS系国際会議の中では結構大きいのでは?
l  日本からはISCAには10名強の参加(少ない・・・)
FPGAX#7 Shinya T-Y, NAIST 3
キーノート会場
FPGAX#7 Shinya T-Y, NAIST 4
ランチ会場
FPGAX#7 Shinya T-Y, NAIST 5
注目のワークショップ
n  ASBD: 5th WS on Architectures and Systems for Big data
l  ニアデータ処理 (NDP) の発表が多数
•  ビッグなデータは動かすだけで電力を馬鹿食いする
n  CAMEL: 1st WS on Computer Architecture for Machine
Learning
l  機械学習のためのアーキテクチャに関するWS
n  CARL: 4th WS on the Intersections of Computer
Architecture and Reconfigurable Logic
l  FPGAシステムに関するWS
•  今年はIntel, Convey, IBM, MSRの企業のプレイヤーによる発表
n  NeuroArch: 2nd WS on Neuromorphic Architectures
l  楽しみにしていたのにキャンセルされた・・・
FPGAX#7 Shinya T-Y, NAIST 6
CARL2015
FPGAX#7 Shinya T-Y, NAIST 7
CARL2015
n  メジャープレイヤーによる講演
l  Intel: Xeon+FPGA
•  詳しくは: http://qiita.com/kazunori279/items/3731e51c2987acb860ff
l  Convey/Micron: Memcached and Imagemagick
•  Automata processing: FPGAのLUTをもっと賢くした感じ
l  IBM: Text Analysis
•  Power+FPGA via CAPI
l  Microsoft: Machine learning
•  Catapult
FPGAX#7 Shinya T-Y, NAIST 8
本会議のテーマ(一部)(1)
n  データセンターアーキテクチャ
l  Machine learning as a service
l  リソース管理
n  並列アーキテクチャ
l  競合検出・一貫性管理
n  性能解析
l  ハードウェアトランザクショナルメモリの性能解析
n  GPUアーキテクチャ
l  Warp management
n  アクセラレータ
l  In-memory processing
l  データフローアーキテクチャ
FPGAX#7 Shinya T-Y, NAIST 9
本会議のテーマ(一部)(2)
n  プロセッサ(CPU)アーキテクチャ
l  コアアーキテクチャ:命令スケジューリング・投機実行
n  メモリシステム
l  仮想メモリ管理
l  DRAMキャッシュ
l  スクラッチパッドとキャッシュの共存
n  ディペンダブルアーキテクチャ
l  メモリ上のデータ保護
n  組み込みシステム
l  IPコアベース設計手法
l  低消費電力インターコネクト
FPGAX#7 Shinya T-Y, NAIST 10
プロセッサアーキテクチャ
n  シングルのコアアーキテクチャの研究が元気!
l  少し前はマルチコア・メニーコアばかりだった
•  マルチコアもメニーコアも良いコアを並べたものなので結局
コアアーキテクチャの改良に行き着く
n  LaZy Superscalar [Asilioglu+, ISCA'15]
l  演算結果が必要になるまで計算しないスーパースカラ
n  Branch Vanguard [McFarlin+, ISCA'15]
l  In-orderプロセッサで分岐命令を予測と解決に分解
コンパイラとの協調で高性能化(In-orderコアは電力効率高)
n  DynaSpAM [Liu+, ISCA'15]
l  OoOコアの命令スケジューリング結果を使って密結合データフ
ローアクセラレータに命令配置・効率的実行
FPGAX#7 Shinya T-Y, NAIST 11
DynaSpAM [Liu+, ISCA'15]
n  OoOコアの命令スケジューリング結果を使って密結合
データフローアクセラレータに命令配置・効率的実行
n  OoOコアの命令スケジューリング等に要する電力を削減
l  8-issue OoOと比較して1.42倍高速・23.9%消費電力を削減
FPGAX#7 Shinya T-Y, NAIST 12
ニア(メモリ・データ)プロセッシング
n  半導体プロセス微細化によって、演算に要する電力より
もデータの移動に要する消費電力が相対的に増加
n  ニアデータプロセッシング
l  SSDやメモリの近くで計算
n  インメモリプロセッシング
l  メモリの「中」で計算する
FPGAX#7 Shinya T-Y, NAIST 13
Off-chip Memory
(DRAM, etc.)
Memory Controller
NoC/LLC
L2 Cache
L1 Cache
Core
L0 Cache
NDP Core
一般的なコア
○キャッシュでの
 データ囲い込みで
 高性能・高電力効率
キャッシュミス時の
 レイテンシ大・消費電力大
NDPコア
○キャッシュミス時の
 レイテンシ小・省電力
キャッシュによる
 データ囲い込みは不向き
データ移動距離大
データ移動距離小
[1] M. Anders,et.al.”High-Performance Energy-Efficient NoC Fabrics:
Evolution and Future Challenges”, NOCS 2014
Tesseract [Ahn+, ISCA'15]
n  HMCの内部バンド幅が使えれば超高性能なのに・・・
l  →HMC中にコアを入れちゃえ
FPGAX#7 Shinya T-Y, NAIST 14
PIM-Enabled Instructions [Ahn+, ISCA'15]
n  プロセッシングインメモリのためのISA・アーキ
l  メモリ側で計算することで
性能と電力効率が改善する
n  もちろん
プログラミングが難しい
l  次はプログラミングモデル
がアツい!?
FPGAX#7 Shinya T-Y, NAIST 15
まとめ
n  ISCA2015に行ってきました!
l  データセンターからプロセッサアーキテクチャ、
メモリシステムまで計算機アーキテクチャは幅広い
l  FPGAへの注目は高いけどアーキテクチャはそれだけじゃない
l  一旦下火になったネタが復活することもある
•  プロセッサ(コア)アーキテクチャ
l  データの近くで計算するのは今後もしばらく流行
•  ニア・メモリ、ニア・ストレージ
•  ニア・インターフェース(ネットワーク)
•  イン・メモリ、イン・ストレージ
n  コンピュータアーキテクチャ楽しいです(^p^)
FPGAX#7 Shinya T-Y, NAIST 16

More Related Content

PDF
PyCoRAM: Python-Verilog高位合成とメモリ抽象化によるFPGAアクセラレータ向けIPコア開発フレームワーク (FPGAX #05)
PDF
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
PDF
Pythonによる高位設計フレームワークPyCoRAMでFPGAシステムを開発してみよう
PDF
PythonとVeriloggenを用いたRTL設計メタプログラミング
PDF
メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発
PDF
Pythonを用いた高水準ハードウェア設計環境の検討
PDF
PyCoRAMを用いたグラフ処理FPGAアクセラレータ
PDF
マルチパラダイム型高水準ハードウェア設計環境の検討
PyCoRAM: Python-Verilog高位合成とメモリ抽象化によるFPGAアクセラレータ向けIPコア開発フレームワーク (FPGAX #05)
PythonとPyCoRAMでお手軽にFPGAシステムを開発してみよう
Pythonによる高位設計フレームワークPyCoRAMでFPGAシステムを開発してみよう
PythonとVeriloggenを用いたRTL設計メタプログラミング
メモリ抽象化フレームワークPyCoRAMを用いたソフトプロセッサ混載FPGAアクセラレータの開発
Pythonを用いた高水準ハードウェア設計環境の検討
PyCoRAMを用いたグラフ処理FPGAアクセラレータ
マルチパラダイム型高水準ハードウェア設計環境の検討

What's hot (20)

PDF
Veriloggen: Pythonによるハードウェアメタプログラミング(第3回 高位合成友の会 @ドワンゴ)
PDF
Gpu vs fpga
PDF
PyCoRAM (高位合成友の会@ドワンゴ, 2015年1月16日)
PPTX
研究者のための Python による FPGA 入門
PDF
Zynq+PyCoRAM(+Debian)入門
PPT
20140310 fpgax
PPTX
FPGAって、何?
PDF
FPGAX6_hayashi
PDF
電波望遠鏡用の分光器をAltera SDK for OpenCL使ってサクッと作ってみた
PDF
Pynq祭り資料
PDF
ソフトウェア技術者はFPGAをどのように使うか
PDF
増え続ける情報に対応するためのFPGA基礎知識
PDF
PyCoRAMによるPythonを用いたポータブルなFPGAアクセラレータ開発 (チュートリアル@ESS2014)
PPT
FPGA
PDF
Verilog-HDL Tutorial (1)
PDF
FPGAのトレンドをまとめてみた
PPTX
高速シリアル通信を支える技術
PDF
FPGA・リコンフィギャラブルシステム研究の最新動向
PPTX
Myoshimi extreme
PDF
FPGA+SoC+Linux実践勉強会資料
Veriloggen: Pythonによるハードウェアメタプログラミング(第3回 高位合成友の会 @ドワンゴ)
Gpu vs fpga
PyCoRAM (高位合成友の会@ドワンゴ, 2015年1月16日)
研究者のための Python による FPGA 入門
Zynq+PyCoRAM(+Debian)入門
20140310 fpgax
FPGAって、何?
FPGAX6_hayashi
電波望遠鏡用の分光器をAltera SDK for OpenCL使ってサクッと作ってみた
Pynq祭り資料
ソフトウェア技術者はFPGAをどのように使うか
増え続ける情報に対応するためのFPGA基礎知識
PyCoRAMによるPythonを用いたポータブルなFPGAアクセラレータ開発 (チュートリアル@ESS2014)
FPGA
Verilog-HDL Tutorial (1)
FPGAのトレンドをまとめてみた
高速シリアル通信を支える技術
FPGA・リコンフィギャラブルシステム研究の最新動向
Myoshimi extreme
FPGA+SoC+Linux実践勉強会資料
Ad

Viewers also liked (7)

PPTX
TRACK E: Memristors: Not Just Memory/ Shahar Kvatinsky
PDF
助教が吼える! 各界の若手研究者大集合「ハードウェアはやわらかい」
PDF
Mapping Applications with Collectives over Sub-communicators on Torus Network...
PDF
A CGRA-based Approach for Accelerating Convolutional Neural Networks
PDF
An FPGA-based Scalable Simulation Accelerator for Tile Architectures @HEART2011
PPTX
Zynq + Vivado HLS入門
PDF
Debian Linux on Zynq (Xilinx ARM-SoC FPGA) Setup Flow (Vivado 2015.4)
TRACK E: Memristors: Not Just Memory/ Shahar Kvatinsky
助教が吼える! 各界の若手研究者大集合「ハードウェアはやわらかい」
Mapping Applications with Collectives over Sub-communicators on Torus Network...
A CGRA-based Approach for Accelerating Convolutional Neural Networks
An FPGA-based Scalable Simulation Accelerator for Tile Architectures @HEART2011
Zynq + Vivado HLS入門
Debian Linux on Zynq (Xilinx ARM-SoC FPGA) Setup Flow (Vivado 2015.4)
Ad

Similar to コンピュータアーキテクチャ研究の最新動向〜ISCA2015参加報告〜 @FPGAエクストリーム・コンピューティング 第7回 (#fpgax #7) (12)

PDF
2012-04-25 ASPLOS2012出張報告(公開版)
PDF
GTC Japan 2018 NVIDIA NEWS
PPTX
Abstracts of FPGA2017 papers (Temporary Version)
PDF
コンピュータビジョンの今を映す-CVPR 2017 速報より- (夏のトップカンファレンス論文読み会)
PDF
[論文紹介] 粗粒度スパースNNアクセラレータ Cambricon-S
PDF
IPDPS & HPDC 報告
PPTX
SIGGRAPH 2019 Report
PPTX
2016-11-30 BitVisor Summit 5 「BitVisorの現状と今後」(公開版)
PPTX
CloudNativeSecurityCon North America 2024 Overview
PDF
Domain Specific Architecture は今どこまで来ていて、これからどこに向かうか
PPT
Advnet2011 ruo ando
PDF
IETFにおける IoTソフトウェアアップデートに関する検討状況
2012-04-25 ASPLOS2012出張報告(公開版)
GTC Japan 2018 NVIDIA NEWS
Abstracts of FPGA2017 papers (Temporary Version)
コンピュータビジョンの今を映す-CVPR 2017 速報より- (夏のトップカンファレンス論文読み会)
[論文紹介] 粗粒度スパースNNアクセラレータ Cambricon-S
IPDPS & HPDC 報告
SIGGRAPH 2019 Report
2016-11-30 BitVisor Summit 5 「BitVisorの現状と今後」(公開版)
CloudNativeSecurityCon North America 2024 Overview
Domain Specific Architecture は今どこまで来ていて、これからどこに向かうか
Advnet2011 ruo ando
IETFにおける IoTソフトウェアアップデートに関する検討状況

More from Shinya Takamaeda-Y (13)

PDF
オープンソースコンパイラNNgenでつくるエッジ・ディープラーニングシステム
PDF
DNNのモデル特化ハードウェアを生成するオープンソースコンパイラNNgenのデモ
PDF
ディープニューラルネットワーク向け拡張可能な高位合成コンパイラの開発
PDF
Veriloggen.Stream: データフローからハードウェアを作る(2018年3月3日 高位合成友の会 第5回 @東京工業大学)
PDF
Veriloggen.Thread & Stream: 最高性能FPGAコンピューティングを 目指したミックスドパラダイム型高位合成 (FPGAX 201...
PDF
Pythonによるカスタム可能な高位設計技術 (Design Solution Forum 2016@新横浜)
PDF
ゆるふわコンピュータ (IPSJ-ONE2017)
PDF
A Framework for Efficient Rapid Prototyping by Virtually Enlarging FPGA Resou...
PDF
A High Performance Heterogeneous FPGA-based Accelerator with PyCoRAM (Runner ...
PDF
PyCoRAM: Yet Another Implementation of CoRAM Memory Architecture for Modern F...
PDF
むかし名言集bot作りました!
PDF
APGAS言語X10を用いたオンチップネットワークシミュレーションの並列化
PDF
Network Performance of Multifunction On-chip Router Architectures (IEICE-CPSY...
オープンソースコンパイラNNgenでつくるエッジ・ディープラーニングシステム
DNNのモデル特化ハードウェアを生成するオープンソースコンパイラNNgenのデモ
ディープニューラルネットワーク向け拡張可能な高位合成コンパイラの開発
Veriloggen.Stream: データフローからハードウェアを作る(2018年3月3日 高位合成友の会 第5回 @東京工業大学)
Veriloggen.Thread & Stream: 最高性能FPGAコンピューティングを 目指したミックスドパラダイム型高位合成 (FPGAX 201...
Pythonによるカスタム可能な高位設計技術 (Design Solution Forum 2016@新横浜)
ゆるふわコンピュータ (IPSJ-ONE2017)
A Framework for Efficient Rapid Prototyping by Virtually Enlarging FPGA Resou...
A High Performance Heterogeneous FPGA-based Accelerator with PyCoRAM (Runner ...
PyCoRAM: Yet Another Implementation of CoRAM Memory Architecture for Modern F...
むかし名言集bot作りました!
APGAS言語X10を用いたオンチップネットワークシミュレーションの並列化
Network Performance of Multifunction On-chip Router Architectures (IEICE-CPSY...

コンピュータアーキテクチャ研究の最新動向〜ISCA2015参加報告〜 @FPGAエクストリーム・コンピューティング 第7回 (#fpgax #7)