SlideShare a Scribd company logo
Prefetch and Cache in PLDI'02 Dynamic Hot Data Stream Prefetching... プロファイリングとHot Data Streamの解析に基づくダイナミックプリフェッチング手法の提案 Efficient Discovery of Regular Stride... Irregularなload命令のストライドパタンの発見 Static Load Classification for... load命令を20種に分類。Load-value predictionの利用をコンパイル時に決定する
読んだ人  みよし たけふみ 2010.06.30 CITED BY  40
概要 プリフェッチは限られた場所でしか有効ではない
ダイナミックプリフェッチングの提案 Temporal data reference profile
Extract hot data stream
With the added prefetch inst(no profiler, analyzer) Improvement 5-19% speedup
Overview
Data Refs. Profiling and Analysis Bursty Tracing Framework for Low-over-head Temporal Profiling Not only the freq., but also temporal relationships
eg.  cdeabcdeabfg と abcdefabcdeg Extensions for Online Optimization
Fast Hot Data Stream Detection
Bursty Tracing Framework [15]  for Low-overhead temporal profiling  2 つのバージョンを用意  nCheck と nInst で実行コードを選択 Vulcan でバイナリ変換してチェックコード等を挿入
Extensions for Online Optilization
Fast Hot Data Stream Detection(1) = to compress the profile and infer its hierarchical structure. [23]
Fast Hot Data Stream Detection(2) v.heat  =  v.length*v.frequency A.heat = wA.length*A.coldUses
Overhead of profiling and analysis
Dynamic Prefetching Generating Detection and Prefetching Code
Injecting Detection and Prefetching Code
Generating Detection and Prefetching Code Hot data stream  v  =  v1v2...v{v.length}  into a head  v.head  =  v1v2...vheadLen and a tail  v.tail  =  v{headLen+1}v{headLen+2}...v{v.length} .
 
Performance impact
 
読んだ人  みよし たけふみ 2010.06.30 CITED BY  18
概要 Irregular data referencesのプリフェッチは難しい
重要なIrregularなload命令はストライドアクセスパタンをもっている(ようだ)

More Related Content

PDF
Pldir 0630
PDF
GCPでStreamなデータパイプライン作った
PPT
Cache Optimization with Akamai
PPTX
Cache optimization
PPTX
Memory Hierarchy Design, Basics, Cache Optimization, Address Translation
PDF
perfを使ったpostgre sqlの解析(後編)
PDF
perfを使ったPostgreSQLの解析(前編)
PDF
プロファイラGuiを用いたコード分析 20160610
Pldir 0630
GCPでStreamなデータパイプライン作った
Cache Optimization with Akamai
Cache optimization
Memory Hierarchy Design, Basics, Cache Optimization, Address Translation
perfを使ったpostgre sqlの解析(後編)
perfを使ったPostgreSQLの解析(前編)
プロファイラGuiを用いたコード分析 20160610

More from Takefumi MIYOSHI (20)

PDF
ACRi_webinar_20220118_miyo
PDF
DAS_202109
PDF
ACRiルーム1年間の活動と 新たな取り組み
PDF
RISC-V introduction for SIG SDR in CQ 2019.07.29
PDF
Misc for edge_devices_with_fpga
PDF
Cq off 20190718
PDF
Synthesijer - HLS frineds 20190511
PDF
Reconf 201901
PDF
Hls friends 201803.key
PPTX
Abstracts of FPGA2017 papers (Temporary Version)
PDF
Hls friends 20161122.key
PDF
Synthesijer and Synthesijer.Scala in HLS-friends 201512
PDF
PDF
Microblaze loader
PDF
Reconf 201506
PDF
Synthesijer jjug 201504_01
PDF
Synthesijer zynq qs_20150316
PDF
Synthesijer fpgax 20150201
PDF
Synthesijer hls 20150116
ACRi_webinar_20220118_miyo
DAS_202109
ACRiルーム1年間の活動と 新たな取り組み
RISC-V introduction for SIG SDR in CQ 2019.07.29
Misc for edge_devices_with_fpga
Cq off 20190718
Synthesijer - HLS frineds 20190511
Reconf 201901
Hls friends 201803.key
Abstracts of FPGA2017 papers (Temporary Version)
Hls friends 20161122.key
Synthesijer and Synthesijer.Scala in HLS-friends 201512
Microblaze loader
Reconf 201506
Synthesijer jjug 201504_01
Synthesijer zynq qs_20150316
Synthesijer fpgax 20150201
Synthesijer hls 20150116
Ad

Dynamic Prefetching & Cache Optimizations