SlideShare a Scribd company logo
HPC Server 講習会
第3回 応用編
2013/11/06
デンソーアイティーラボラトリ 増谷
1.前回までの復習
前回の復習


第1回


HPC Serverとは





MicrosoftのHPC用プラットフォーム
Windows Server, Windows 7, Windows Azureを組み込め
る

基本概念




ジョブ、タスク、ノード

簡単な使い方


シリアルアプリケーション



パラメータスイープ



Matlabからの利用
前回の復習


第2回


さまざまなプログラミングパラダイムへの対応


MPI



Visual StudioでのMPIプログラミング





MPIの概念

MPIとGPGPU

HPC SOA


.NETからやるにはこの方がわかりやすい



WCFのサービスとしてワーカーをデプロイ
導入イメージ


ヘッドとワーカーに分かれる

Compute Node

Workstation Node

HPC Pack 2008 R2

HPC Pack 2008 R2

HPC Pack 2008 R2

Enterprise

Express

Workstation

Windows HPC Server

Windows 7

Head Node

Compute Node

Windows HPC Server 2008 R2

ヘッドノード

2003 / 2008 / 2008 R2

社内サーバ

クライアント
2.HPC Serverの変遷
HPCPackエディションの変遷


ほぼ半年に1度リリース



機能拡張とパッケージのスリム化が行われている

リリース時期
2010年7月
2010年12月
2011年6月
2011年11月
2012年6月
2012年12月
2013年8月
[NEW]

HPC Pack の名 社内呼称 バージョン番号
称
2008 R2 SP0
v3 RTM
3.0.2369.0
(RTM)
2008 R2 SP1
v3 SP1
3.1.3267.0
2008 R2 SP2
v3 SP2
3.2.3716.0
2008 R2 SP3
v3 SP3
3.3.3950.0
2008 R2 S4
v3 SP4
3.4.4169.0
2012
v4 RTM
4.0.3906.0
2012 SP1
v4 SP1
4.1.4174.0

Dryad 統合
完全無償化
ワンパッケージ化
What’ new in HPC Pack
2012


エディション構成



2012からは無償:Windows機の数だけノード数を増やせる





昔はヘッドノードとワークステーションノードが有償だっ
た(それほど高くは無いが)
HPC Packが1種類に:インストーラでノード種を切り替え
る

サポートOS





Server 2008,2008R2はサポートから外された
Windows 7はまだ対応

Azure 対応


Azureで提供されるVPN(WAVN)を活用可能に



VHDを自動マウント可能に:データの配布がシンプルに



Azure上にヘッドノードを設置可能に
さあどうぞ


Compute Intensiveなタスク(embarrassingly parallel)


簡単なバッチ処理を分散したいだけなら





小さめのデータ:転送が負担にならない
処理単位が大きい:分割をあまり工夫しなくてよい

HPC Serverと通常の共有ファイルシステムで十分




データの分配、最適化等を考えなくて良い

Data Intensiveなタスク


大量のデータを処理




データの配布を含めた配慮が必要な場合

MapReduce??


Amazonに行く?

:

ちょっと待った!
HPC Serverでも
MapReduce
HPCSERVERでHADOOPを使いたい
Hadoopとは
Azure上のHadoopエコシス
テム


Azure上でHadoopを活用する方法
は複数ある



ストレージ




テーブル (NoSQL、Key-Value スト
ア)、SQL データベース、BLOB など

VMによるLinux環境





ほぼネイティブな環境
OSライセンスの心配なし

HDInsight


より大規模な運用



ほぼターンキーソリューション



ノードの管理などが容易
HDInsight


Microsoft の Hadoop環境



純粋なHadoop:Javaベース





MSが開発したHadoopのポーティング
Windows AzureとオンプレミスWindows Serverの
双方に対応

スケジュール


2013/10/28 から正式版リリース
HDinsightの構成
特徴


使い慣れたツール





PowerPivotやPower ViewなどのBIツールに統合されている
SQL Serverとの連携

機敏性




大規模運用




セキュリティ確保

リッチな開発者エクスペリエンス




数分で展開可能

Java/.NET LINQ to HIVE

オンプレミス版の存在


ステージング環境として



廉価な常時運用環境として



Windows 7用 HDInsightのインストール:


http://www.ne.jp/asahi/hishidama/home/tech/apache/hadoop/hdinsight_pre
view.html
HDInsightのフロントエンド


Azure



PowerPivot



Power View



PowerShell




シェルスクリプトから利用

開発環境


Java



.NET
HDInsight のコスト


ヘッドノード




計算ノード




1時間当たり36.54~42.36円、

18.27~21.60円

自前で IaaS 上に Hadoop クラスターをデプロイ
するには数日から数週間を要するが、Windows
Azure に Hadoop クラスターをデプロイするこ
とによって、所要時間を数分に短縮できる。また、
作業の終わったクラスターは、シャットダウンす
ることでコストセーブできるという。
http://japan.internet.com/busnews/20131029/6.html

2013年11月30日まではキャンペーン料金





ヘッドノードが1時間当たり18.27~21.60円、
計算ノードが同9.14~10.80円

半年または1年の契約を結ぶことで、20~32%の割引を受けられる。
MSのMapReduceタイプの
フレームワーク変遷
2008
HPC Pack

2009

2010

2011

2008R
2

2008

2008R
2 SP1

2008R
2 SP2

2012
2008R
2 SP4

2008R
2 SP3

C

R

B
2
LINQ to HPC

2012
SP1

P

Hive ODBC Driver

Dryad

B
1

A

Project
Daytona

統合

C

HDInsight
Azure

C

HDInsight
Server

C

MS Blog記事などより収集
Community Preview

2012

統合

Hadoop
Connector

C

2013

P

Public Preview

R

Release

A

Alpha

B

Beta

P

R
P
HDInsight


過去のMSの分散コンピューティングプラットフォー
ムとの関連


SQL Server Connector for Hadoop ; Scoop ベースの
コネクタ


HDInsightへ統合



Daytona : MSRのMapReduce環境:?



Dryad : パイプラインを指定しない自動的な構成?HPC
to Linq
HDInsight実践
使ってみよう
HDInsightクラスタの準備1


HDInsghtで”Create”
HDInsightクラスタの準備2


クラスタ名とノード数アカウントを指定する
HDInsightクラスタの準備3


クラスタができた
ダッシュボード


クラスタの管理
コンパネ


複数のアクセス方法がある
Hadoopノードに
RemoteDesktop
Jobの作成
Monitoring
HDInsightまとめ


完全なHadoop環境





Javaベース
MS独自の実装はない(.NET用のAPIで利用可能)

さまざまなアクセス


BIツール



シェル



プログラミング環境
Hadoopの開発
HDINSIGHTでの開発
Javaだけか?
.NET MapReduce
LINQ to HIVE
.NET MapReduce 準備


以下の3つをNuGetから取る



Microsoft Linq to Hive





Microsoft .NET Map Reduce API For Hadoop
Microsoft .NET API For Hadoop WebClient

Usingする


using Microsoft.Hadoop.WebHDFS.Adapters;



using Microsoft.Hadoop.WebHDFS;



using Microsoft.Hadoop.Hive;
.NETでHDFS
.NETでMapReduce

LogMapper

Job登録

実行
LogReducer
Linq to HIVEの詳細

Actorの受賞カウント
ActorIdでジョイン
Actorの受賞カウントを平均

集計するだ
けならこれ
で終わり
.NET Hadoopの利点


Visual Studioで開発可能



Linq to HIVEにて、MapperやReducerを書かなくて
も簡単な処理が可能

More Related Content

PPTX
Windows HPC Server 講習会 第1回 導入編 1/2
PPTX
Windows HPC Server 講習会 第2回 開発編
PDF
20130601わんくま「序hpcクラスターを作ろう!まずはオンプレで」公開用
PPTX
Matlab distributed computing serverの使い方
PDF
破「Windows azureでhpc 」わんくま大阪2013年12月
PDF
Kubernetes meetup-tokyo-13-customizing-kubernetes-for-ml-cluster
PDF
[GTCJ2018]CuPy -NumPy互換GPUライブラリによるPythonでの高速計算- PFN奥田遼介
PDF
[GTCJ2018] Optimizing Deep Learning with Chainer PFN得居誠也
Windows HPC Server 講習会 第1回 導入編 1/2
Windows HPC Server 講習会 第2回 開発編
20130601わんくま「序hpcクラスターを作ろう!まずはオンプレで」公開用
Matlab distributed computing serverの使い方
破「Windows azureでhpc 」わんくま大阪2013年12月
Kubernetes meetup-tokyo-13-customizing-kubernetes-for-ml-cluster
[GTCJ2018]CuPy -NumPy互換GPUライブラリによるPythonでの高速計算- PFN奥田遼介
[GTCJ2018] Optimizing Deep Learning with Chainer PFN得居誠也

What's hot (19)

PDF
C#, C/CLI と CUDAによる画像処理ことはじめ
PPTX
Seastar:高スループットなサーバアプリケーションの為の新しいフレームワーク
PDF
1076: CUDAデバッグ・プロファイリング入門
PPTX
Cld017 nh シリーズリリース
PDF
Cld017 nh シリーズリリース
PPTX
分散ストレージ技術Cephの最新情報
PPTX
HPE Superdome X 製品技術説明会(その2)
PDF
Maxwell と Java CUDAプログラミング
PPTX
Seastar in 歌舞伎座.tech#8「C++初心者会」
PDF
1070: CUDA プログラミング入門
PDF
仮想化環境におけるパケットフォワーディング
PDF
Apache Mesosってなに
PPTX
これからのOpenShiftの話をしよう
PDF
CephとGluster次期バージョンでの新機能
PDF
Ceph Loves OpenStack: Why and How
PDF
最近のJuju/MAAS について
PPTX
PDF
Dockerの利用事例
PDF
CUDAプログラミング入門
C#, C/CLI と CUDAによる画像処理ことはじめ
Seastar:高スループットなサーバアプリケーションの為の新しいフレームワーク
1076: CUDAデバッグ・プロファイリング入門
Cld017 nh シリーズリリース
Cld017 nh シリーズリリース
分散ストレージ技術Cephの最新情報
HPE Superdome X 製品技術説明会(その2)
Maxwell と Java CUDAプログラミング
Seastar in 歌舞伎座.tech#8「C++初心者会」
1070: CUDA プログラミング入門
仮想化環境におけるパケットフォワーディング
Apache Mesosってなに
これからのOpenShiftの話をしよう
CephとGluster次期バージョンでの新機能
Ceph Loves OpenStack: Why and How
最近のJuju/MAAS について
Dockerの利用事例
CUDAプログラミング入門
Ad

Viewers also liked (20)

PDF
Deep Learning Chapter12
PDF
Stochastic Process Overview (hypothesis)
PDF
On the eigenstructure of dft matrices(in japanese only)
PDF
Variational Kalman Filter
PDF
マーク付き点過程
PDF
Holonomic Gradient Descent
PPTX
Go-ICP: グローバル最適(Globally optimal) なICPの解説
PPTX
FLAT CAM: Replacing Lenses with Masks and Computationの解説
PDF
Extreme Learning Machine
PDF
Halide, Darkroom - 並列化のためのソフトウェア・研究
PDF
論文紹介:Practical bayesian optimization of machine learning algorithms(nips2012)
PPTX
確率ロボティクス第13回
PPTX
Vanishing Component Analysisの試作(補足)
PDF
Windows Store アプリをuniversal にして申請する手順
PPTX
Sigir2013 retrieval models-and_ranking_i_pub
PPT
Information extraction 1
PPT
Notes on the low rank matrix approximation of kernel
PDF
Gitのすすめ
PDF
DSIRNLP06 Nested Pitman-Yor Language Model
PPTX
KeyGraph Analysis on NIPS2013 Papers
Deep Learning Chapter12
Stochastic Process Overview (hypothesis)
On the eigenstructure of dft matrices(in japanese only)
Variational Kalman Filter
マーク付き点過程
Holonomic Gradient Descent
Go-ICP: グローバル最適(Globally optimal) なICPの解説
FLAT CAM: Replacing Lenses with Masks and Computationの解説
Extreme Learning Machine
Halide, Darkroom - 並列化のためのソフトウェア・研究
論文紹介:Practical bayesian optimization of machine learning algorithms(nips2012)
確率ロボティクス第13回
Vanishing Component Analysisの試作(補足)
Windows Store アプリをuniversal にして申請する手順
Sigir2013 retrieval models-and_ranking_i_pub
Information extraction 1
Notes on the low rank matrix approximation of kernel
Gitのすすめ
DSIRNLP06 Nested Pitman-Yor Language Model
KeyGraph Analysis on NIPS2013 Papers
Ad

Similar to Hpc server講習会第3回応用編 (7)

PDF
「Windows Azureで HPC 」 for JAZUG 2013年9月
PDF
[Azure Antenna] クラウドで HPC ~ HPC on Azure ~
PDF
Hyperledger Fabric のプラットフォームおよびインフラ運用
PDF
AWS Black Belt Online Seminar 2016 HPC分野でのAWS活用
PDF
第21回「Windows Server 2012 DeepDive!! Hyper-V と VDI を徹底解説」(2012/10/18 on しすなま!)...
PDF
[Interact 2018] 別視点からのハイパーコンバージドインフラ ~ ソフトウェアによる華麗な “ものづくり“ の世界
PDF
INF-016_比べて納得! Windows Server 2016 Hyper-V の新機能すべて見せます!
「Windows Azureで HPC 」 for JAZUG 2013年9月
[Azure Antenna] クラウドで HPC ~ HPC on Azure ~
Hyperledger Fabric のプラットフォームおよびインフラ運用
AWS Black Belt Online Seminar 2016 HPC分野でのAWS活用
第21回「Windows Server 2012 DeepDive!! Hyper-V と VDI を徹底解説」(2012/10/18 on しすなま!)...
[Interact 2018] 別視点からのハイパーコンバージドインフラ ~ ソフトウェアによる華麗な “ものづくり“ の世界
INF-016_比べて納得! Windows Server 2016 Hyper-V の新機能すべて見せます!

More from Osamu Masutani (20)

PDF
Azure AI Conference Report
PDF
Decode2018 report
PDF
TOWARD A BETTER IPA EXPERIENCE FOR A CONNECTED VEHICLE BY MEANS OF USAGE PRED...
PPTX
Power BI勉強会 #6 Power BI で地理的分析とこまでできる?
PDF
コネクテッドカーの胎動と交通サイバーフィジカルシステム
PPTX
R tools for Vsual Studio
PPTX
Taxi Fare Deep Dive
PPTX
Power BI チュートリアル 導入・初級編
PPTX
A Sensing Coverage Analysis of a Route Control Method for Vehicular Crowd Sen...
PPTX
Traffic simulation based on space syntax
PPTX
C++ AMPを使ってみよう
PPT
A Multiple Pairs Shortest Path Algorithm 解説
PPTX
Clustering of time series subsequences is meaningless 解説
PPT
Autopoiesis 2
PPT
Autopoiesis 1
PPT
UIMAウマー
PPTX
Toward a resilient prediction system for non-uniform traffic data
PDF
BEIRA: A geo-semantic clustering method for area summary
PDF
BEIRA -鳥瞰型情報検索アプリケーション
PDF
An event detection method using floating car data
Azure AI Conference Report
Decode2018 report
TOWARD A BETTER IPA EXPERIENCE FOR A CONNECTED VEHICLE BY MEANS OF USAGE PRED...
Power BI勉強会 #6 Power BI で地理的分析とこまでできる?
コネクテッドカーの胎動と交通サイバーフィジカルシステム
R tools for Vsual Studio
Taxi Fare Deep Dive
Power BI チュートリアル 導入・初級編
A Sensing Coverage Analysis of a Route Control Method for Vehicular Crowd Sen...
Traffic simulation based on space syntax
C++ AMPを使ってみよう
A Multiple Pairs Shortest Path Algorithm 解説
Clustering of time series subsequences is meaningless 解説
Autopoiesis 2
Autopoiesis 1
UIMAウマー
Toward a resilient prediction system for non-uniform traffic data
BEIRA: A geo-semantic clustering method for area summary
BEIRA -鳥瞰型情報検索アプリケーション
An event detection method using floating car data

Hpc server講習会第3回応用編