SlideShare a Scribd company logo
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Specialist Solutions Architect, HPC
Daisuke Miyamoto
2020/07/16
HPC on AWS 2020 Summer
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
自己紹介
❏ 名前
宮本 大輔 (みやもと だいすけ)
❏ 所属
アマゾン ウェブ サービス ジャパン 株式会社
技術統括本部
Specialist Solutions Architect, HPC
❏ 好きな AWS サービス
❖ AWS ParallelCluster
❖ Amazon FSx for Lustre
❖ AWS Snowball シリーズ
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
本日の概要
• HPC on AWS の特徴・利点
• HPC on AWS の各サービスとアップデート
• 事例紹介
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
HPC on AWS の特徴・利点
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
これまでの HPC クラスタの課題
• サーバ台数が限られており、需要が増加する時期には長大なキュー待ち時
間が発生する
• 同じ環境を複数メンバーで共有するため、アプリケーションによってはリ
ソースが無駄になることも
• サーバ台数が多く、ハードウェアの保守・管理が煩雑
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Corporate
Data Center
Elastic Data
Center
AWSなら、必要な時に必要なだけ利用可能
従来のクラスタ
構成は固定
ジョブが
無ければ
無駄発生
ジョブが無い時は
最小限のノード
AWS
M
スケーラブルなリソースによりジョブ実行待ちの無いHPC環境を実現
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Corporate
Data Center
Elastic Data
Center
AWSなら、必要な時に必要なだけ利用可能
従来のクラスタ
構成は固定
ジョブが
無ければ
無駄発生
AWS
M
必要に応じて
必要な台数で
クラスタを構成
スケーラブルなリソースによりジョブ実行待ちの無いHPC環境を実現
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Corporate
Data Center
Elastic Data
Center
AWSなら、必要な時に必要なだけ利用可能
従来のクラスタ
構成は固定
ジョブが
無ければ
無駄発生
処理が終了すると
インスタンスを終了
課金停止 AWS
M
スケーラブルなリソースによりジョブ実行待ちの無いHPC環境を実現
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
スケーラビリティの活用による計算時間短縮
1日1週間
サーバ台数サーバ台数
従来は手持ちの限られたリソースで、逐次処理していたジョブも
AWSなら必要な台数、インスタンスを起動して、一斉処理
しかも費用は「時間×台数」なのでどちらも同じ
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
ユーザやタスク単位で専用のクラスタを構築できるため
要件や規模に合わせて、最適構成のクラスタを作成可能
• CPUコア/メモリ
• ストレージ
• アクセラレータ
• ネットワーク
• インストールするソフトウェア
One size does not fit all!
アプリケーションに合わせた構成のクラスタを構築可能
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
・ハードウェア保守
・ネットワーク管理/保守
・電源管理
・空調管理
・設置場所の費用/運用
計算機の規模が大きくなればなるほど
大変に、、、
計算機管理の手間を抑える
競争優位につながらない物理的管理は全てAWSにお任せ
他社と差別化可能な部分に集中
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
自社オフィス
環境
社内サーバルーム or
データセンター環境
sshアクセス
ログイン
ノード
計算ノード
ライセンス
サーバ
NFSサーバ
Internet VPN
or
専用線
従来のHPC環境
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
自社オフィス環境
SSH/SCP
ログイン
ノード
計算ノード
ライセンス
サーバ
ストレージサーバ
(EFS/FSx for Lustre)
Internet
VPN / 専用線
AWS クラウド環境
AWSでも基本的なシステム構成は同じ
Auto-Scale
需要に応じて伸縮する計算環境・マネージドサービスの活用
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
自社オフィス環境
SSH/SCP
ログイン
ノード
計算ノード
ストレージサーバ
Internet
VPN / 専用線
AWS クラウド環境
AWSでは、1人1クラスタなどより柔軟性の高い構成も可能
Auto-Scale
計算ノードは自動でスケールするため、複数クラスタを作成しても維持コストが低い
Auto-Scale
ログイン
ノード
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
データドリブンなHPC環境とデータ活用
S3のデータレイク化により大規模シミュレーション結果を機械学習環境で活
用
HPC Environment
Lambda
Users
Amazon SageMaker
Amazon Athena
AI/ML
DataAnalytics
AWS Batch
入力データ 出力データ
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
まとめ: HPC on AWS の特徴・利点
• クラウドのスケーラビリティを活用し、
必要な時に必要な量の必要なタイプの計算リソースを利用することが可能
• HPC の基本となる構成はオンプレミス環境と同様
• 用途に応じて、個人専用のクラスタや、データドリブンな計算ワークフ
ローなど多種多様な HPC 環境を構築する事が可能
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
HPC 関連サービスと各種アップデート
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
AWS における HPC 関連サービス
多様な HPC ワークロードに対応するための数多くのサービス
コンピュート
Amazon EC2
Enhanced Networking
Placement Group
ネットワーク
Elastic FabricAdapter
可視化
Amazon AppStream 2.0
NICE-DCV
スポットインスタンスの活
用で大幅なコスト減も可能
NVIDIATeslaV100
搭載
EC2インスタンスの基盤上の
配置を制御してネットワーク
を高速化
フルマネージドのア
プリケーションスト
リーミングサービス
管理自動化
AWS ParallelCluster
AWS Batch
AWS上に HPC クラスタを構築
AWS BatchやSGEに対応
スケーラブルなバッチコ
ンピューティングジョブ
をフルマネージドで管理
用途に応じて多様なイ
ンスタンスを利用可能
な仮想サーバサービス
SR-IOVによるCPU負荷が低く
パフォーマンスの高いネット
ワーク仮想化
libfabric 対応のアダプタにより
MPI 利用のアプリケーション
等を高速化
XilinxVirtex
UltraScale+ 搭載
100 Gbps の
ネットワーク帯域
GPUアクセラレーションに対
応し、インタラクティブなア
プリケーションに適したデス
クトップ仮想化
ストレージ
FSx for Lustre
S3連携可能な高速な分散
ストレージをフルマネー
ジドで提供
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
仮想サーバサービス Amazon EC2 (Elastic Compute Cloud)
• 必要なときに必要な計算リソースを確保可能な仮想サーバサービス
• 数分で起動し、秒単位の従量課金(一部タイプについては1時間単位)
• ワークロードに応じて様々なインスタンスタイプを選択可能
• インスタンスを停止するだけでマシンスペック変更が可能
M5
汎用
コンピューティング
最適化
ストレージ・IO
最適化
GPU ・FPGA
アクセラレーテッド
メモリ最適化
X1 F1
P3
G4
T3
D2
I3 H1
R5
C5
インスタンスタイプ一覧と分類
Z1d
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
EC2 購入オプション
オンデマンドインスタンス
長期コミット無し、使用分への支払い(秒
単位/時間単位)。Amazon EC2の定価
スパイクするようなワーク
ロード
リザーブドインスタンス
(Savings Plans)
1年/3年の長期コミットをする代わり
に大幅なディスカウント価格
一定の負荷の見通しがある
ワークロード
スポットインスタンス
Amazon EC2の空きキャパシティを
活用し、最大90%値引き。中断が発
生することがある
中断に強く、かつ様々なイ
ンスタンスタイプを活用で
きるワークロード
HPC 等では特にスポットインスタンスを活用することで
コストパフォーマンスの良い計算が可能
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Amazon EC2 で選択できる高性能CPUの選択肢
アプリケーションとワークロードに応じて
最適なコンピューティング環境を選択
Intel Xeon processor
(x86_64 arch)
最大3.9GHz駆動
Cascade Lake
or Skylake 搭載
C5インスタンス
AMD EPYC processor
(x86_64 arch)
最大3.3GHz駆動
Romeコア搭載
C5aインスタンス
AWS Graviton Processor
(64-bit Arm arch)
64bit Arm Neoverse N1ベース
Graviton2 CPU搭載
C6gインスタンス
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
AMD CPU 搭載インスタンス Update
T3a、M5a、R5aのインスタンスファミリーに加え、
第二世代 EPYC Roma プロセッサを搭載した C5a が利用可能に
Roma 搭載 C5a インスタンスファミリー
• 同系統のIntel CPU 採用インスタンスに比べ約 10 % 安価
• 最大 96 vCPUs 搭載
• NVMe ストレージ搭載タイプ及び Metal タイプも今後登場予定
https://aws.amazon.com/jp/blogs/news/new-amazon-ec2-c5a-instances-powered-by-2nd-gen-amd-epyc-processors/
© 2020, Amazon Web Services, Inc. or its Affiliates.
AWS Graviton2 (Arm Neoverse N1)搭載インスタンスロー
ンチ
汎用
4GB DRAM/vCPU
M6g
コンピューティング最適化
2GB DRAM/vCPU
C6g
メモリ最適化
8GB DRAM/vCPU
R6g
NVMe SSDをサポートするバリエーションも今後提供予定 (M6gd, C6gd, R6gd)
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
C6g による OpenFOAM Benchmarks
• 222M cell Motorbike モデルを用いて評価
• 計算性能としては、EFAを搭載したC5nが最も高い
• シミュレーションあたりのコストでは、C6g が最も安価
https://aws.amazon.com/blogs/compute/c6g-openfoam-better-price-performance/
https://gitlab.com/arm-hpc/packages/-/wikis/packages/openfoam
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Arm 公式 Blog での HPC 利用例
• Evaluation of the NEMO Ocean Model on Arm Neoverse-based AWS
Graviton2
• https://community.arm.com/developer/tools-software/hpc/b/hpc-
blog/posts/evaluation-of-the-nemo-ocean-model-on-aws-graviton2
• Demonstration of low mach-number CFD modeling with Nalu on AWS
Graviton2 M6g instances
• https://community.arm.com/developer/tools-software/hpc/b/hpc-
blog/posts/low-mach-number-cfd-modeling-with-nalu-on-graviton2-
aws-m6g
• Seismic Modeling with Arm Neoverse N1 and AWS Graviton2
• https://community.arm.com/developer/tools-software/hpc/b/hpc-
blog/posts/seismic-modeling-with-arm-neoverse-n1-and-aws-
graviton2
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
NVIDIA
V100 GPU搭載 P3
T4 GPU搭載 G4
Xilinx
UltraScale+ FPGA
F1インスタンス
AWS
Inferentia
Inf1インスタンス
EC2で選択できるアクセラレータ搭載インスタンス
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
NVIDIA GPU 搭載インスタンス
32 GB版Tesla V100を搭載した P3dn に加え、T4 GPU を搭載した
G4dn が利用可能
2020年6月に発表された A100 GPU 搭載 インスタンスもローンチ予
定・プレビュー受付中
https://aws.amazon.com/jp/blogs/news/aws-to-offer-nvidia-a100-tensor-core-gpu-based-amazon-ec2-instances/
T4 GPU 搭載 G4dn インスタンスファミリー
• 高い推論性能とコストパフォーマンスを提供する T4 GPU搭載
• レイトレーシング向けRTコア搭載
• Elastic Fabric Adapter に対応した metal タイプも 6月5日にローンチ
https://aws.amazon.com/jp/about-aws/whats-new/2020/06/announcing-general-availability-
amazon-ec2-g4dn-bare-metal-instances/
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Amazon EC2インスタンス ネットワーク
EC2ネットワーク帯域は次々拡張され、現在は最大 100 Gbps
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
EC2の高性能ネットワーク技術
• 拡張ネットワーキング
• SR-IOVに対応し、仮想化オーバーヘッドを低減することで低レイテンシ
での通信が可能
• Cluster Placement Group
• インスタンス間の通信を最適化することで広帯域、低レイテンシ、高
PPS (packets per seconds) での通信を実現
• Elastic Fabric Adapter
• HPC向けに、MPI (Message Passing Interface) やNCCL (NVIDIA
Collective Communications Library) などの libfabric 対応のアプリケー
ションでの通信をより低レイテンシ化
http://docs.aws.amazon.com/ja_jp/AWSEC2/latest/UserGuide/enhanced-networking.html
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Elastic Fabric Adapter
Userspace
Kernel
Without EFA With EFA
MPIを使用するアプリケーションで低レイテンシでのノード間通信を実現
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
EFA によるアプリケーションパフォーマンス向上
MPIに特化した低レイテンシネットワークアダプタのElastic Fabric Adapter の登場
により、CFDを中心に様々なアプリケーションでのスケール性能が向上
MetacompCFD++、LSTC LS-DYNA、ANSYS Fluent、SiemensStar-CCM+、OpenFOAMでのベンチマーク結果:
https://d1.awsstatic.com/events/reinvent/2019/REPEAT_2_Using_Elastic_Fabric_Adapter_to_scale_HPC_workloads_on_AWS_CMP408-R2.pdf
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Amazon FSx for Lustre
高速な分散ファイルシステムをフルマネージドで提供
S3 と連携し、階層型ストレージとしても利用可能
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
FSx for Lustre: Updates
これまでの SCRATCH_1 に加えて、より高いバースト性能を持った
SCRATCH_2 や
永続領域として利用可能な PERSISTENT(性能に応じた3種類)が登場
PERSISTENT については、スナップショットの保存・復元にも対応プロビジョン1 TBあ
たりのベースライン
スループット
プロビジョン1 TBあ
たりのバーストス
ループット
1 GB あたりの月額料
料金
(us-east-1)
SCRATCH_1 200 MB/s 350 MB/s 0.14 USD
SCRATCH_2 200 MB/s 1300 MB/s 0.14 USD
PERSISTENT-50 50 MB/s 1300 MB/s 0.14 USD
PERSISTENT-100 100 MB/s 1300 MB/s 0.19 USD
PERSISTENT-200 200 MB/s 1300 MB/s 0.29 USD
https://aws.amazon.com/jp/blogs/news/amazon-fsx-for-lustre-persistent-storage/
https://aws.amazon.com/about-aws/whats-new/2020/06/amazon-fsx-lustre-provides-highly-durable-file-system-backups/
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
ジョブ投入に応じて自動でスケールするクラスタを
AWS 上に構築可能な AWS 公式のオープンソースソフトウェア
AWS ParallelCluster の特徴
• 既存のHPC向けジョブスケジューラと Auto-Scaling
を連携した環境を作成
SGE / Torque / Slurm に対応
• 少しのコマンド操作でクラスタ作成可能
• MPI/NCCL 環境がセットアップ済みで、すぐに利用
可能
• 使用するOSやネットワーク環境、ストレージ構成な
どを柔軟にカスタマイズ可能
• オープンソースソースのプロジェクトであり、誰で
もソースコードを入手可能
https://github.com/aws/aws-parallelcluster
AWS ParallelCluster とは
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
AWS ParallelCluster の利用イメージ
まずは自分のPC等に ParallelCluster ソフトウェアをインストール
config ファイルを記述し、pcluster create コマンドを実行することで、
ジョブ投入に応じて Auto-Scale するクラスタ環境が自動的に作成される
36
AWS Cloud
Users
Cluster
Master Auto-Scale
ComputeAWS CloudFormation
Scale-Out / Scale-in
ジョブスケジューラ
(SGE/Torque/Slurm)
$ pcluster create <NAME>
[aws]
aws_region_name = ap-northeast-1
[cluster slurm1]
master_instance_type = c5.large
compute_instance_type = c5.4xlarge
max_queue_size = 10
initial_queue_size = 0
scheduler = slurm
cluster_type = spot
config ファイル
/shared
NFS mount
/home
/shared
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
AWS Batch とは
• AWS Batch がインスタンスの起動や停止を
行うため、スケジューラや計算ノードなど
の 管理が不要
• ジョブは Docker コンテナイメージ を元に
作成し、自動でスケールするコンピュー
ティング環境で実行する
• コンピューティング環境ではインスタンス
タイプや vCPU 数、スポットインスタンス
利用有無などを任意に指定可能
大規模バッチ処理のため環境をフルマネージドで提供
コンテナイメージを用意するだけでスケーラブルな大規模バッチ処理環境が得られる
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
AWS ParallelCluster と AWS Batch の使い分け
AWS ParallelCluster
• SGE/Torque/Slurm 等の利用者に馴染みのある
ジョブスケジューラを利用可能
• 単一のジョブが大量の CPU core を使用する
密結合ワークロードに向いている
• Pros: 既存の HPC クラスタからの移行が容易
• Cons: 単一のAZ、単一のインスタンスタイプ
での利用となるため、可用性確保には工夫が
必要
AWS Batch
• フルマネージドの独自ジョブスケジューラ
• 少数の CPU core を使用するジョブを大量に実
行する疎結合・High Throughput Computing ワー
クロードに向いている
• Pros: フルマネージドサービスでありコンテナさ
え用意すれば計算基盤の管理は不要
• Pros: 複数 AZ や複数インスタンスタイプの利用
が可能であり、可用性を確保しやすい
• Cons: コンテナ化やスケジューラ対応が必要
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
1分程度でジョブが完了するワークロードの場合
• AWS Lambda / AWS Step Functions
• S3 Batch
機械学習用途でモデル作成やエンドポイントへのデプロイまで同一の
インターフェイスで行いたい場合
• Amazon SageMaker
MapReduce で処理が簡単に記述できる場合
• Amazon EMR
その他、関連サービスとの使い分け
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
AWS ParallelCluster: Updates 1
AWS アーキテクチャアイコンに AWS ParallelCluster が追加
AWS ParallelCluster
https://aws.amazon.com/jp/architecture/icons/
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
AWS ParallelCluster: Updates 2
NICE-DCV との統合によるリモート可視化
• ブラウザからも利用可能なリモートデスクトッ
プアプリケーションである NICE-DCV が
Master Nodeで起動可能になり、可視化などの
処理が容易に(右図)
ジョブスケジューラログ等の CloudWatch Logs
への配信
• 各インスタンス内のシステムログや、
SGE/Torque/Slurm のログを CloudWatch Logs
に配信する機能
• 配信されるログの例:
/var/log/cfn-init.log (System) /var/log/messages (System)
/var/log/slurmctld.log (Slurm) /opt/sge/default/default/spool/qmaster/messages (SGE)
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
AWS ParallelCluster: Update 3
将来的な SGE、Torque のサポート終了のアナウンス
• SGE、Torqueについて、現在メンテナンスがされておらず、セキュリティ
面での懸念が残ることから、将来的に ParallelCluster では SGE、Torqueを
サポートしないことを発表
• Slurm への移行ガイドも合わせて公開
https://github.com/aws/aws-parallelcluster/wiki/Deprecation-of-SGE-and-Torque-in-ParallelCluster
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
AWS Batch: Updates
Allocation Strategy
AWS Batch で、複数のインスタンスタイプを選択した際に実際にどのインス
タンスが起動されるかを決定する戦略
• Best Fit: 要求 vCPU/Memory に応じて最も価格の安いインスタンスタイプを選択
(デフォルト設定だが、今後は推奨されない)
• Best Fit Progressive: Best Fitと同様に最も価格の安いインスタンスタイプを選択す
るが、何らかの理由で起動できない場合は別のインスタンスタイプを選択する
• Spot Capacity Optimized: 中断される可能性の低いインスタンスタイプを選択する
Graviton2 搭載インスタンス M6g/C6g/R6g 対応
• 利用にはArmに対応したDocker Imageが必要
https://docs.aws.amazon.com/ja_jp/batch/latest/userguide/allocation-strategies.html
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
AWS Solutions: Scale-out Computing on AWS
ユーザー管理やコスト管理など複数人でクラスタを使用する際のリファレンス
デザインとして、AWS Solutions: Scale-out Computing on AWS が公開
https://aws.amazon.com/jp/solutions/scale-out-computing-on-aws/
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Scale-out Computing on AWS に含まれる内容
• Web フロントエンド
• NICE-DCV 用ジョブ作成による可視化、Pre/Post 処理
• LDAPによるユーザー管理
• ジョブスケジューラからAWSのリソースを指定する方
法
• AWS Budget とジョブスケジューラを組み合わせた予
算管理
• Amazon Elasticsearch Service を使ったコスト可視化
• Amazon SES連携によるジョブのメール通知
Scale-out Computing on AWS をそのまま使用することも可能だが
実装のアイディア・サンプルコードとして用いることで
要件に応じたクラスタ環境のリファレンスデザインとして利用可能
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
より詳しく知りたい方に
Black Belt Online Seminar
• Amazon Elastic Compute Cloud (EC2)
https://www.slideshare.net/AmazonWebServicesJapan/20190305-aws-black-belt-online-seminar-amazon-ec2
• Amazon EC2 スポットインスタンス
https://www.slideshare.net/AmazonWebServicesJapan/20190306-aws-black-belt-online-seminar-amazon-ec2
• Amazon EC2 Deep Dive: AWS Graviton2 Arm CPU 搭載インスタンス
https://www.slideshare.net/AmazonWebServicesJapan/20200707-aws-black-belt-online-seminar-amazon-ec2-
deep-dive-aws-graviton2-arm-cpu
• Amazon Elastic Block Store (EBS)
https://www.slideshare.net/AmazonWebServicesJapan/20190320-aws-black-belt-online-seminar-amazon-ebs
• Amazon FSx for Lustre
https://www.slideshare.net/AmazonWebServicesJapan/20190319-aws-black-belt-online-seminar-amazon-fsx-for-
lustre
• AWS Batch
https://www.slideshare.net/AmazonWebServicesJapan/20190911-aws-black-belt-online-seminar-aws-batch
• AWS ParallelCluster ではじめるクラウドHPC
https://www.slideshare.net/AmazonWebServicesJapan/20200408-aws-black-belt-online-seminar-aws-
parallelcluster-hpc
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
HPC on AWS 事例
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Life Sciences
多様な分野で利用が広がる HPC on AWS
Financial Services
Design & Engineering
AutonomousVehicles
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Formula 1 様:空力シミュレーション
• F1レーシングカーの空力シミュレーション
(CFD)プロジェクトをAWS上で完了させ、
2021年のF1レースシーズンで使用するレーシ
ングカーの設計を完了
• CFDプロジェクトでは、5億5000万セルを超
える大規模モデルをAWS上の1150を超える
CPUコアを使用してシミュレーションを実行
• 従来のシステムと比較して平均70%(60時間の
計算を18時間に)時間短縮を実現
• EC2のHPCに最適化されたC5nインスタンス
を使用して、6ヶ月間プロジェクトを実施
• このシミュレーションプロジェクトによって、
スリップストリームによるダウンフォースの
損失を50%から15%に低減した車の設計に成
功https://press.aboutamazon.com/news-releases/news-release-details/formula-1-works-aws-develop-next-generation-race-car
次世代レースカー開発の為の空力シミュレーションをAWS上で実行
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
• 250万強におよぶパラメータスタ
ディを最大100万vCPU以上同時
利用して処理
• 従来であれば20日掛かる処理を
約8時間で全てのタスクを終える
ことに成功
• スポットインスタンスを活用す
ることでコストを最適化、100万
vCPUを1時間あたり$17,164
(1vCPUあたり$0.017)で利用
Western Digital 様:大規模パラメータスタディ
次世代ハードディスクのドライブヘッドシミュレーションをクラウド上で実行
https://aws.amazon.com/jp/blogs/news/western-digital-hdd-simulation-at-cloud-scale-2-5-million-hpc-tasks-40k-ec2-spot-instances/
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
東京リージョン
化合物とタンパク質における薬物ドッキング、
スクリーニングシミュレーション
• 数千コアを時間課金で利用
• 50TBのRawデータをSnowballにてセキュアに転送
• クラスタ構築はAWS提供の CfnClusterで迅速に展開
• アプリケーションにmyPresto(※)を利用
Spot Instance
Researchers
AWS Direct
Connect
Master
server Auto Scalling group
Compute Fleet
AWS
Snowball
S3
On-premise
エーザイ様:創薬研究での活用
51
http://www.jbic.or.jp/enterprise/result/001.html
https://aws.amazon.com/jp/solutions/case-studies/eisai/
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
塩野義製薬株式会社様 分子動力学計算環境
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
Mobileye 様:自動運転シミュレーション
大規模な自動運転のシミュレーション環境をAWS Batchを用いて構成
最大同時 500,000 CPUコアを利用して、1時間あたり70年分のコンピュー
ティングを実行、99 % のリソースで スポットインスタンスを利用
https://d1.awsstatic.com/events/reinvent/2019/Navigating_the_winding_road_toward_driverless_mobility_AUT307.pdf
https://aws.amazon.com/blogs/aws/capacity-optimized-spot-instance-allocation-in-action-at-mobileye-and-skyscanner/
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
金融業界における各種規制対応
FRTBなど各種規制に対応するために定期的な計算需要の増加が発生
• TIBCO GridServer 、IBM Spectrum Symphony、Microsoft HPC Pack と
いった計算環境を AWS 上に構築
https://aws.amazon.com/blogs/apn/scheduling-on-the-aws-cloud-with-ibm-spectrum-lsf-and-ibm-spectrum-symphony/
https://aws.amazon.com/jp/blogs/news/creating-a-1-3-million-vcpu-grid-on-aws-using-ec2-spot-instances-and-tibco-gridserver/
https://github.com/aws-samples/aws-cfn-windows-hpc-template
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
AWS Summit Online 開催
https://aws.amazon.com/jp/summits/2020/
• セッション内容は近日公開予定
• HPC 関連のお客様事例についても、
製造、金融、ライフサイエンス、製薬、気象等様々な分野からご登壇頂く予定
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
クラウド HPC のはじめ方
AWS ParallelCluster を使用してクラスタを作成し、オートスケールす
る計算環境を体験することが重要
• その上で、アプリケーション特性に応じて、インスタンスタイプの
選択や、EFA、FSx for Lustreの活用について検討
• コンテナ化が容易であれば、AWS Batchも検討
AWS ParallelCluster ユーザーガイド Hello World:
https://docs.aws.amazon.com/ja_jp/parallelcluster/latest/ug/tutorials_01_hello_world.html
AWS HPC Workshop (English):
https://hpcworkshops.com/
Black Belt Online Seminar: AWS ParallelCluster
https://www.slideshare.net/AmazonWebServicesJapan/20200408-aws-black-belt-online-
seminar-aws-parallelcluster-hpc
© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
まとめ
• クラウドのスケーラビリティを活用し、
必要な時に必要な量の必要なタイプの計算リソースを確保することが可能
• 多種多様な HPC 関連サービスとアップデート
• 製造、製薬、自動運転、金融など
様々な業種業界での活用事例についてもご紹介
クラウド HPC をはじめてみませんか?

More Related Content

PPTX
JAWS-UG HPC #17 - HPC on AWS @ 2019
PPTX
Containers + EC2 Spot: AWS Batch による大規模バッチ処理でのスポットインスタンス活用
PPTX
スケーラブルな Deep Leaning フレームワーク "Apache MXNet” を AWS で学ぶ
PDF
Re invent 2017 データベースサービス総復習!
PDF
20170705 blackbelt AWS Lambda
PDF
20180220 AWS Black Belt Online Seminar - Amazon Container Services
PDF
AWS Black Belt Online Seminar 2017 初心者向け クラウドコンピューティング はじめの一歩
PDF
AWS Black Belt Online Seminar 2017 Amazon Athena
JAWS-UG HPC #17 - HPC on AWS @ 2019
Containers + EC2 Spot: AWS Batch による大規模バッチ処理でのスポットインスタンス活用
スケーラブルな Deep Leaning フレームワーク "Apache MXNet” を AWS で学ぶ
Re invent 2017 データベースサービス総復習!
20170705 blackbelt AWS Lambda
20180220 AWS Black Belt Online Seminar - Amazon Container Services
AWS Black Belt Online Seminar 2017 初心者向け クラウドコンピューティング はじめの一歩
AWS Black Belt Online Seminar 2017 Amazon Athena

What's hot (20)

PDF
20210127 AWS Black Belt Online Seminar Amazon Redshift 運用管理
PDF
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL
PDF
AWSデータベースアップデート2017
PDF
AWS Black Belt Online Seminar 2018 Amazon WorkSpaces
PDF
AWSで実現するバックアップとディザスタリカバリ
PDF
20180704(20190520 Renewed) AWS Black Belt Online Seminar Amazon Elastic File ...
PDF
スタートアップでのAWS(Amazon Web Services)活用事例
PDF
Reinvent2017 recap-overview-pdf
PDF
20170418 aws black-belt-architecture_pattern_of_serverless
PDF
AWS Black Belt Online Seminar 2017 Amazon S3
PDF
データレイクを基盤としたAWS上での機械学習サービス構築
PPTX
AWS Batch Fargate対応は何をもたらすか
PDF
クラウド上のデータ活用デザインパターン
PDF
2017年2月~4月のAWSサービスアップデートまとめ
PDF
2017年1月のAWSサービスアップデートまとめ
PDF
AWS Black Belt Online Seminar 2017 Auto Scaling
PDF
AWS サービスアップデートまとめ re:Invent 2017 直前編
KEY
Aws説明資料
PDF
AWS Black Belt Online Seminar AWS re:Invent 2016で発表された新サービス・新機能の紹介 パート3
PDF
AWSサービスアップデートまとめ (re:Invent 2016とその前後)
20210127 AWS Black Belt Online Seminar Amazon Redshift 運用管理
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL
AWSデータベースアップデート2017
AWS Black Belt Online Seminar 2018 Amazon WorkSpaces
AWSで実現するバックアップとディザスタリカバリ
20180704(20190520 Renewed) AWS Black Belt Online Seminar Amazon Elastic File ...
スタートアップでのAWS(Amazon Web Services)活用事例
Reinvent2017 recap-overview-pdf
20170418 aws black-belt-architecture_pattern_of_serverless
AWS Black Belt Online Seminar 2017 Amazon S3
データレイクを基盤としたAWS上での機械学習サービス構築
AWS Batch Fargate対応は何をもたらすか
クラウド上のデータ活用デザインパターン
2017年2月~4月のAWSサービスアップデートまとめ
2017年1月のAWSサービスアップデートまとめ
AWS Black Belt Online Seminar 2017 Auto Scaling
AWS サービスアップデートまとめ re:Invent 2017 直前編
Aws説明資料
AWS Black Belt Online Seminar AWS re:Invent 2016で発表された新サービス・新機能の紹介 パート3
AWSサービスアップデートまとめ (re:Invent 2016とその前後)
Ad

Similar to HPC on AWS 2020 Summer (20)

PDF
Amazon EC2 HPCインスタンス - AWSマイスターシリーズ
PDF
20190305_AWS-Blackbelt-EC2.pdf
PDF
[AWSマイスターシリーズ] Amazon Elastic Compute Cloud HPC編
PDF
AWS Black Belt Online Seminar 2016 HPC分野でのAWS活用
PDF
AWS Black Belt Online Seminar Amazon EC2
PDF
AWS Black Belt Online Seminar 2017 Amazon EC2
PPTX
いまさら聞けない Amazon EC2
PPTX
20161125 awsサービスアップデート
PDF
20130326 aws meister-reloaded-windows
PPTX
Amazon RDS for PostgreSQL ( JPUG 2014夏セミナー) #jpug
PDF
Amazon Web Servicesのご紹介 - 東北クラウド実践カンファレンス2011
PDF
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
PDF
2015/04/01 AWS Blackbelt EC2
PDF
JAWS-UGお遍路_20230916.pdf
PDF
業務アプリをクラウド化する5つのステップ ~Amazon Web Services活用の勘所~
PDF
SAPでクラウドはじめてみませんか? AWS and Azure
PDF
Modernizing Big Data Workload Using Amazon EMR & AWS Glue
PPTX
20170803 bigdataevent
PPTX
AWSとGPUインスタンスのご紹介
PDF
AWS Black Belt Techシリーズ Amazon Elastic Compute Cloud (Amazon EC2)
Amazon EC2 HPCインスタンス - AWSマイスターシリーズ
20190305_AWS-Blackbelt-EC2.pdf
[AWSマイスターシリーズ] Amazon Elastic Compute Cloud HPC編
AWS Black Belt Online Seminar 2016 HPC分野でのAWS活用
AWS Black Belt Online Seminar Amazon EC2
AWS Black Belt Online Seminar 2017 Amazon EC2
いまさら聞けない Amazon EC2
20161125 awsサービスアップデート
20130326 aws meister-reloaded-windows
Amazon RDS for PostgreSQL ( JPUG 2014夏セミナー) #jpug
Amazon Web Servicesのご紹介 - 東北クラウド実践カンファレンス2011
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
2015/04/01 AWS Blackbelt EC2
JAWS-UGお遍路_20230916.pdf
業務アプリをクラウド化する5つのステップ ~Amazon Web Services活用の勘所~
SAPでクラウドはじめてみませんか? AWS and Azure
Modernizing Big Data Workload Using Amazon EMR & AWS Glue
20170803 bigdataevent
AWSとGPUインスタンスのご紹介
AWS Black Belt Techシリーズ Amazon Elastic Compute Cloud (Amazon EC2)
Ad

HPC on AWS 2020 Summer

  • 1. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Specialist Solutions Architect, HPC Daisuke Miyamoto 2020/07/16 HPC on AWS 2020 Summer
  • 2. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. 自己紹介 ❏ 名前 宮本 大輔 (みやもと だいすけ) ❏ 所属 アマゾン ウェブ サービス ジャパン 株式会社 技術統括本部 Specialist Solutions Architect, HPC ❏ 好きな AWS サービス ❖ AWS ParallelCluster ❖ Amazon FSx for Lustre ❖ AWS Snowball シリーズ
  • 3. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. 本日の概要 • HPC on AWS の特徴・利点 • HPC on AWS の各サービスとアップデート • 事例紹介
  • 4. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. HPC on AWS の特徴・利点
  • 5. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. これまでの HPC クラスタの課題 • サーバ台数が限られており、需要が増加する時期には長大なキュー待ち時 間が発生する • 同じ環境を複数メンバーで共有するため、アプリケーションによってはリ ソースが無駄になることも • サーバ台数が多く、ハードウェアの保守・管理が煩雑
  • 6. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Corporate Data Center Elastic Data Center AWSなら、必要な時に必要なだけ利用可能 従来のクラスタ 構成は固定 ジョブが 無ければ 無駄発生 ジョブが無い時は 最小限のノード AWS M スケーラブルなリソースによりジョブ実行待ちの無いHPC環境を実現
  • 7. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Corporate Data Center Elastic Data Center AWSなら、必要な時に必要なだけ利用可能 従来のクラスタ 構成は固定 ジョブが 無ければ 無駄発生 AWS M 必要に応じて 必要な台数で クラスタを構成 スケーラブルなリソースによりジョブ実行待ちの無いHPC環境を実現
  • 8. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. © 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved. Corporate Data Center Elastic Data Center AWSなら、必要な時に必要なだけ利用可能 従来のクラスタ 構成は固定 ジョブが 無ければ 無駄発生 処理が終了すると インスタンスを終了 課金停止 AWS M スケーラブルなリソースによりジョブ実行待ちの無いHPC環境を実現
  • 9. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. スケーラビリティの活用による計算時間短縮 1日1週間 サーバ台数サーバ台数 従来は手持ちの限られたリソースで、逐次処理していたジョブも AWSなら必要な台数、インスタンスを起動して、一斉処理 しかも費用は「時間×台数」なのでどちらも同じ
  • 10. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. ユーザやタスク単位で専用のクラスタを構築できるため 要件や規模に合わせて、最適構成のクラスタを作成可能 • CPUコア/メモリ • ストレージ • アクセラレータ • ネットワーク • インストールするソフトウェア One size does not fit all! アプリケーションに合わせた構成のクラスタを構築可能
  • 11. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. ・ハードウェア保守 ・ネットワーク管理/保守 ・電源管理 ・空調管理 ・設置場所の費用/運用 計算機の規模が大きくなればなるほど 大変に、、、 計算機管理の手間を抑える 競争優位につながらない物理的管理は全てAWSにお任せ 他社と差別化可能な部分に集中
  • 12. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. 自社オフィス 環境 社内サーバルーム or データセンター環境 sshアクセス ログイン ノード 計算ノード ライセンス サーバ NFSサーバ Internet VPN or 専用線 従来のHPC環境
  • 13. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. 自社オフィス環境 SSH/SCP ログイン ノード 計算ノード ライセンス サーバ ストレージサーバ (EFS/FSx for Lustre) Internet VPN / 専用線 AWS クラウド環境 AWSでも基本的なシステム構成は同じ Auto-Scale 需要に応じて伸縮する計算環境・マネージドサービスの活用
  • 14. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. 自社オフィス環境 SSH/SCP ログイン ノード 計算ノード ストレージサーバ Internet VPN / 専用線 AWS クラウド環境 AWSでは、1人1クラスタなどより柔軟性の高い構成も可能 Auto-Scale 計算ノードは自動でスケールするため、複数クラスタを作成しても維持コストが低い Auto-Scale ログイン ノード
  • 15. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. データドリブンなHPC環境とデータ活用 S3のデータレイク化により大規模シミュレーション結果を機械学習環境で活 用 HPC Environment Lambda Users Amazon SageMaker Amazon Athena AI/ML DataAnalytics AWS Batch 入力データ 出力データ
  • 16. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. まとめ: HPC on AWS の特徴・利点 • クラウドのスケーラビリティを活用し、 必要な時に必要な量の必要なタイプの計算リソースを利用することが可能 • HPC の基本となる構成はオンプレミス環境と同様 • 用途に応じて、個人専用のクラスタや、データドリブンな計算ワークフ ローなど多種多様な HPC 環境を構築する事が可能
  • 17. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. HPC 関連サービスと各種アップデート
  • 18. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. AWS における HPC 関連サービス 多様な HPC ワークロードに対応するための数多くのサービス コンピュート Amazon EC2 Enhanced Networking Placement Group ネットワーク Elastic FabricAdapter 可視化 Amazon AppStream 2.0 NICE-DCV スポットインスタンスの活 用で大幅なコスト減も可能 NVIDIATeslaV100 搭載 EC2インスタンスの基盤上の 配置を制御してネットワーク を高速化 フルマネージドのア プリケーションスト リーミングサービス 管理自動化 AWS ParallelCluster AWS Batch AWS上に HPC クラスタを構築 AWS BatchやSGEに対応 スケーラブルなバッチコ ンピューティングジョブ をフルマネージドで管理 用途に応じて多様なイ ンスタンスを利用可能 な仮想サーバサービス SR-IOVによるCPU負荷が低く パフォーマンスの高いネット ワーク仮想化 libfabric 対応のアダプタにより MPI 利用のアプリケーション 等を高速化 XilinxVirtex UltraScale+ 搭載 100 Gbps の ネットワーク帯域 GPUアクセラレーションに対 応し、インタラクティブなア プリケーションに適したデス クトップ仮想化 ストレージ FSx for Lustre S3連携可能な高速な分散 ストレージをフルマネー ジドで提供
  • 19. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. 仮想サーバサービス Amazon EC2 (Elastic Compute Cloud) • 必要なときに必要な計算リソースを確保可能な仮想サーバサービス • 数分で起動し、秒単位の従量課金(一部タイプについては1時間単位) • ワークロードに応じて様々なインスタンスタイプを選択可能 • インスタンスを停止するだけでマシンスペック変更が可能 M5 汎用 コンピューティング 最適化 ストレージ・IO 最適化 GPU ・FPGA アクセラレーテッド メモリ最適化 X1 F1 P3 G4 T3 D2 I3 H1 R5 C5 インスタンスタイプ一覧と分類 Z1d
  • 20. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. EC2 購入オプション オンデマンドインスタンス 長期コミット無し、使用分への支払い(秒 単位/時間単位)。Amazon EC2の定価 スパイクするようなワーク ロード リザーブドインスタンス (Savings Plans) 1年/3年の長期コミットをする代わり に大幅なディスカウント価格 一定の負荷の見通しがある ワークロード スポットインスタンス Amazon EC2の空きキャパシティを 活用し、最大90%値引き。中断が発 生することがある 中断に強く、かつ様々なイ ンスタンスタイプを活用で きるワークロード HPC 等では特にスポットインスタンスを活用することで コストパフォーマンスの良い計算が可能
  • 21. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Amazon EC2 で選択できる高性能CPUの選択肢 アプリケーションとワークロードに応じて 最適なコンピューティング環境を選択 Intel Xeon processor (x86_64 arch) 最大3.9GHz駆動 Cascade Lake or Skylake 搭載 C5インスタンス AMD EPYC processor (x86_64 arch) 最大3.3GHz駆動 Romeコア搭載 C5aインスタンス AWS Graviton Processor (64-bit Arm arch) 64bit Arm Neoverse N1ベース Graviton2 CPU搭載 C6gインスタンス
  • 22. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. AMD CPU 搭載インスタンス Update T3a、M5a、R5aのインスタンスファミリーに加え、 第二世代 EPYC Roma プロセッサを搭載した C5a が利用可能に Roma 搭載 C5a インスタンスファミリー • 同系統のIntel CPU 採用インスタンスに比べ約 10 % 安価 • 最大 96 vCPUs 搭載 • NVMe ストレージ搭載タイプ及び Metal タイプも今後登場予定 https://aws.amazon.com/jp/blogs/news/new-amazon-ec2-c5a-instances-powered-by-2nd-gen-amd-epyc-processors/
  • 23. © 2020, Amazon Web Services, Inc. or its Affiliates. AWS Graviton2 (Arm Neoverse N1)搭載インスタンスロー ンチ 汎用 4GB DRAM/vCPU M6g コンピューティング最適化 2GB DRAM/vCPU C6g メモリ最適化 8GB DRAM/vCPU R6g NVMe SSDをサポートするバリエーションも今後提供予定 (M6gd, C6gd, R6gd)
  • 24. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. C6g による OpenFOAM Benchmarks • 222M cell Motorbike モデルを用いて評価 • 計算性能としては、EFAを搭載したC5nが最も高い • シミュレーションあたりのコストでは、C6g が最も安価 https://aws.amazon.com/blogs/compute/c6g-openfoam-better-price-performance/ https://gitlab.com/arm-hpc/packages/-/wikis/packages/openfoam
  • 25. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Arm 公式 Blog での HPC 利用例 • Evaluation of the NEMO Ocean Model on Arm Neoverse-based AWS Graviton2 • https://community.arm.com/developer/tools-software/hpc/b/hpc- blog/posts/evaluation-of-the-nemo-ocean-model-on-aws-graviton2 • Demonstration of low mach-number CFD modeling with Nalu on AWS Graviton2 M6g instances • https://community.arm.com/developer/tools-software/hpc/b/hpc- blog/posts/low-mach-number-cfd-modeling-with-nalu-on-graviton2- aws-m6g • Seismic Modeling with Arm Neoverse N1 and AWS Graviton2 • https://community.arm.com/developer/tools-software/hpc/b/hpc- blog/posts/seismic-modeling-with-arm-neoverse-n1-and-aws- graviton2
  • 26. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. NVIDIA V100 GPU搭載 P3 T4 GPU搭載 G4 Xilinx UltraScale+ FPGA F1インスタンス AWS Inferentia Inf1インスタンス EC2で選択できるアクセラレータ搭載インスタンス
  • 27. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. NVIDIA GPU 搭載インスタンス 32 GB版Tesla V100を搭載した P3dn に加え、T4 GPU を搭載した G4dn が利用可能 2020年6月に発表された A100 GPU 搭載 インスタンスもローンチ予 定・プレビュー受付中 https://aws.amazon.com/jp/blogs/news/aws-to-offer-nvidia-a100-tensor-core-gpu-based-amazon-ec2-instances/ T4 GPU 搭載 G4dn インスタンスファミリー • 高い推論性能とコストパフォーマンスを提供する T4 GPU搭載 • レイトレーシング向けRTコア搭載 • Elastic Fabric Adapter に対応した metal タイプも 6月5日にローンチ https://aws.amazon.com/jp/about-aws/whats-new/2020/06/announcing-general-availability- amazon-ec2-g4dn-bare-metal-instances/
  • 28. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Amazon EC2インスタンス ネットワーク EC2ネットワーク帯域は次々拡張され、現在は最大 100 Gbps
  • 29. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. EC2の高性能ネットワーク技術 • 拡張ネットワーキング • SR-IOVに対応し、仮想化オーバーヘッドを低減することで低レイテンシ での通信が可能 • Cluster Placement Group • インスタンス間の通信を最適化することで広帯域、低レイテンシ、高 PPS (packets per seconds) での通信を実現 • Elastic Fabric Adapter • HPC向けに、MPI (Message Passing Interface) やNCCL (NVIDIA Collective Communications Library) などの libfabric 対応のアプリケー ションでの通信をより低レイテンシ化 http://docs.aws.amazon.com/ja_jp/AWSEC2/latest/UserGuide/enhanced-networking.html
  • 30. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Elastic Fabric Adapter Userspace Kernel Without EFA With EFA MPIを使用するアプリケーションで低レイテンシでのノード間通信を実現
  • 31. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. EFA によるアプリケーションパフォーマンス向上 MPIに特化した低レイテンシネットワークアダプタのElastic Fabric Adapter の登場 により、CFDを中心に様々なアプリケーションでのスケール性能が向上 MetacompCFD++、LSTC LS-DYNA、ANSYS Fluent、SiemensStar-CCM+、OpenFOAMでのベンチマーク結果: https://d1.awsstatic.com/events/reinvent/2019/REPEAT_2_Using_Elastic_Fabric_Adapter_to_scale_HPC_workloads_on_AWS_CMP408-R2.pdf
  • 32. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Amazon FSx for Lustre 高速な分散ファイルシステムをフルマネージドで提供 S3 と連携し、階層型ストレージとしても利用可能
  • 33. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. FSx for Lustre: Updates これまでの SCRATCH_1 に加えて、より高いバースト性能を持った SCRATCH_2 や 永続領域として利用可能な PERSISTENT(性能に応じた3種類)が登場 PERSISTENT については、スナップショットの保存・復元にも対応プロビジョン1 TBあ たりのベースライン スループット プロビジョン1 TBあ たりのバーストス ループット 1 GB あたりの月額料 料金 (us-east-1) SCRATCH_1 200 MB/s 350 MB/s 0.14 USD SCRATCH_2 200 MB/s 1300 MB/s 0.14 USD PERSISTENT-50 50 MB/s 1300 MB/s 0.14 USD PERSISTENT-100 100 MB/s 1300 MB/s 0.19 USD PERSISTENT-200 200 MB/s 1300 MB/s 0.29 USD https://aws.amazon.com/jp/blogs/news/amazon-fsx-for-lustre-persistent-storage/ https://aws.amazon.com/about-aws/whats-new/2020/06/amazon-fsx-lustre-provides-highly-durable-file-system-backups/
  • 34. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. ジョブ投入に応じて自動でスケールするクラスタを AWS 上に構築可能な AWS 公式のオープンソースソフトウェア AWS ParallelCluster の特徴 • 既存のHPC向けジョブスケジューラと Auto-Scaling を連携した環境を作成 SGE / Torque / Slurm に対応 • 少しのコマンド操作でクラスタ作成可能 • MPI/NCCL 環境がセットアップ済みで、すぐに利用 可能 • 使用するOSやネットワーク環境、ストレージ構成な どを柔軟にカスタマイズ可能 • オープンソースソースのプロジェクトであり、誰で もソースコードを入手可能 https://github.com/aws/aws-parallelcluster AWS ParallelCluster とは
  • 35. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. AWS ParallelCluster の利用イメージ まずは自分のPC等に ParallelCluster ソフトウェアをインストール config ファイルを記述し、pcluster create コマンドを実行することで、 ジョブ投入に応じて Auto-Scale するクラスタ環境が自動的に作成される 36 AWS Cloud Users Cluster Master Auto-Scale ComputeAWS CloudFormation Scale-Out / Scale-in ジョブスケジューラ (SGE/Torque/Slurm) $ pcluster create <NAME> [aws] aws_region_name = ap-northeast-1 [cluster slurm1] master_instance_type = c5.large compute_instance_type = c5.4xlarge max_queue_size = 10 initial_queue_size = 0 scheduler = slurm cluster_type = spot config ファイル /shared NFS mount /home /shared
  • 36. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. AWS Batch とは • AWS Batch がインスタンスの起動や停止を 行うため、スケジューラや計算ノードなど の 管理が不要 • ジョブは Docker コンテナイメージ を元に 作成し、自動でスケールするコンピュー ティング環境で実行する • コンピューティング環境ではインスタンス タイプや vCPU 数、スポットインスタンス 利用有無などを任意に指定可能 大規模バッチ処理のため環境をフルマネージドで提供 コンテナイメージを用意するだけでスケーラブルな大規模バッチ処理環境が得られる
  • 37. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. AWS ParallelCluster と AWS Batch の使い分け AWS ParallelCluster • SGE/Torque/Slurm 等の利用者に馴染みのある ジョブスケジューラを利用可能 • 単一のジョブが大量の CPU core を使用する 密結合ワークロードに向いている • Pros: 既存の HPC クラスタからの移行が容易 • Cons: 単一のAZ、単一のインスタンスタイプ での利用となるため、可用性確保には工夫が 必要 AWS Batch • フルマネージドの独自ジョブスケジューラ • 少数の CPU core を使用するジョブを大量に実 行する疎結合・High Throughput Computing ワー クロードに向いている • Pros: フルマネージドサービスでありコンテナさ え用意すれば計算基盤の管理は不要 • Pros: 複数 AZ や複数インスタンスタイプの利用 が可能であり、可用性を確保しやすい • Cons: コンテナ化やスケジューラ対応が必要
  • 38. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. 1分程度でジョブが完了するワークロードの場合 • AWS Lambda / AWS Step Functions • S3 Batch 機械学習用途でモデル作成やエンドポイントへのデプロイまで同一の インターフェイスで行いたい場合 • Amazon SageMaker MapReduce で処理が簡単に記述できる場合 • Amazon EMR その他、関連サービスとの使い分け
  • 39. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. AWS ParallelCluster: Updates 1 AWS アーキテクチャアイコンに AWS ParallelCluster が追加 AWS ParallelCluster https://aws.amazon.com/jp/architecture/icons/
  • 40. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. AWS ParallelCluster: Updates 2 NICE-DCV との統合によるリモート可視化 • ブラウザからも利用可能なリモートデスクトッ プアプリケーションである NICE-DCV が Master Nodeで起動可能になり、可視化などの 処理が容易に(右図) ジョブスケジューラログ等の CloudWatch Logs への配信 • 各インスタンス内のシステムログや、 SGE/Torque/Slurm のログを CloudWatch Logs に配信する機能 • 配信されるログの例: /var/log/cfn-init.log (System) /var/log/messages (System) /var/log/slurmctld.log (Slurm) /opt/sge/default/default/spool/qmaster/messages (SGE)
  • 41. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. AWS ParallelCluster: Update 3 将来的な SGE、Torque のサポート終了のアナウンス • SGE、Torqueについて、現在メンテナンスがされておらず、セキュリティ 面での懸念が残ることから、将来的に ParallelCluster では SGE、Torqueを サポートしないことを発表 • Slurm への移行ガイドも合わせて公開 https://github.com/aws/aws-parallelcluster/wiki/Deprecation-of-SGE-and-Torque-in-ParallelCluster
  • 42. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. AWS Batch: Updates Allocation Strategy AWS Batch で、複数のインスタンスタイプを選択した際に実際にどのインス タンスが起動されるかを決定する戦略 • Best Fit: 要求 vCPU/Memory に応じて最も価格の安いインスタンスタイプを選択 (デフォルト設定だが、今後は推奨されない) • Best Fit Progressive: Best Fitと同様に最も価格の安いインスタンスタイプを選択す るが、何らかの理由で起動できない場合は別のインスタンスタイプを選択する • Spot Capacity Optimized: 中断される可能性の低いインスタンスタイプを選択する Graviton2 搭載インスタンス M6g/C6g/R6g 対応 • 利用にはArmに対応したDocker Imageが必要 https://docs.aws.amazon.com/ja_jp/batch/latest/userguide/allocation-strategies.html
  • 43. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. AWS Solutions: Scale-out Computing on AWS ユーザー管理やコスト管理など複数人でクラスタを使用する際のリファレンス デザインとして、AWS Solutions: Scale-out Computing on AWS が公開 https://aws.amazon.com/jp/solutions/scale-out-computing-on-aws/
  • 44. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Scale-out Computing on AWS に含まれる内容 • Web フロントエンド • NICE-DCV 用ジョブ作成による可視化、Pre/Post 処理 • LDAPによるユーザー管理 • ジョブスケジューラからAWSのリソースを指定する方 法 • AWS Budget とジョブスケジューラを組み合わせた予 算管理 • Amazon Elasticsearch Service を使ったコスト可視化 • Amazon SES連携によるジョブのメール通知 Scale-out Computing on AWS をそのまま使用することも可能だが 実装のアイディア・サンプルコードとして用いることで 要件に応じたクラスタ環境のリファレンスデザインとして利用可能
  • 45. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. より詳しく知りたい方に Black Belt Online Seminar • Amazon Elastic Compute Cloud (EC2) https://www.slideshare.net/AmazonWebServicesJapan/20190305-aws-black-belt-online-seminar-amazon-ec2 • Amazon EC2 スポットインスタンス https://www.slideshare.net/AmazonWebServicesJapan/20190306-aws-black-belt-online-seminar-amazon-ec2 • Amazon EC2 Deep Dive: AWS Graviton2 Arm CPU 搭載インスタンス https://www.slideshare.net/AmazonWebServicesJapan/20200707-aws-black-belt-online-seminar-amazon-ec2- deep-dive-aws-graviton2-arm-cpu • Amazon Elastic Block Store (EBS) https://www.slideshare.net/AmazonWebServicesJapan/20190320-aws-black-belt-online-seminar-amazon-ebs • Amazon FSx for Lustre https://www.slideshare.net/AmazonWebServicesJapan/20190319-aws-black-belt-online-seminar-amazon-fsx-for- lustre • AWS Batch https://www.slideshare.net/AmazonWebServicesJapan/20190911-aws-black-belt-online-seminar-aws-batch • AWS ParallelCluster ではじめるクラウドHPC https://www.slideshare.net/AmazonWebServicesJapan/20200408-aws-black-belt-online-seminar-aws- parallelcluster-hpc
  • 46. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved.© 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. HPC on AWS 事例
  • 47. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Life Sciences 多様な分野で利用が広がる HPC on AWS Financial Services Design & Engineering AutonomousVehicles
  • 48. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Formula 1 様:空力シミュレーション • F1レーシングカーの空力シミュレーション (CFD)プロジェクトをAWS上で完了させ、 2021年のF1レースシーズンで使用するレーシ ングカーの設計を完了 • CFDプロジェクトでは、5億5000万セルを超 える大規模モデルをAWS上の1150を超える CPUコアを使用してシミュレーションを実行 • 従来のシステムと比較して平均70%(60時間の 計算を18時間に)時間短縮を実現 • EC2のHPCに最適化されたC5nインスタンス を使用して、6ヶ月間プロジェクトを実施 • このシミュレーションプロジェクトによって、 スリップストリームによるダウンフォースの 損失を50%から15%に低減した車の設計に成 功https://press.aboutamazon.com/news-releases/news-release-details/formula-1-works-aws-develop-next-generation-race-car 次世代レースカー開発の為の空力シミュレーションをAWS上で実行
  • 49. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. • 250万強におよぶパラメータスタ ディを最大100万vCPU以上同時 利用して処理 • 従来であれば20日掛かる処理を 約8時間で全てのタスクを終える ことに成功 • スポットインスタンスを活用す ることでコストを最適化、100万 vCPUを1時間あたり$17,164 (1vCPUあたり$0.017)で利用 Western Digital 様:大規模パラメータスタディ 次世代ハードディスクのドライブヘッドシミュレーションをクラウド上で実行 https://aws.amazon.com/jp/blogs/news/western-digital-hdd-simulation-at-cloud-scale-2-5-million-hpc-tasks-40k-ec2-spot-instances/
  • 50. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. 東京リージョン 化合物とタンパク質における薬物ドッキング、 スクリーニングシミュレーション • 数千コアを時間課金で利用 • 50TBのRawデータをSnowballにてセキュアに転送 • クラスタ構築はAWS提供の CfnClusterで迅速に展開 • アプリケーションにmyPresto(※)を利用 Spot Instance Researchers AWS Direct Connect Master server Auto Scalling group Compute Fleet AWS Snowball S3 On-premise エーザイ様:創薬研究での活用 51 http://www.jbic.or.jp/enterprise/result/001.html https://aws.amazon.com/jp/solutions/case-studies/eisai/
  • 51. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. 塩野義製薬株式会社様 分子動力学計算環境
  • 52. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. Mobileye 様:自動運転シミュレーション 大規模な自動運転のシミュレーション環境をAWS Batchを用いて構成 最大同時 500,000 CPUコアを利用して、1時間あたり70年分のコンピュー ティングを実行、99 % のリソースで スポットインスタンスを利用 https://d1.awsstatic.com/events/reinvent/2019/Navigating_the_winding_road_toward_driverless_mobility_AUT307.pdf https://aws.amazon.com/blogs/aws/capacity-optimized-spot-instance-allocation-in-action-at-mobileye-and-skyscanner/
  • 53. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. 金融業界における各種規制対応 FRTBなど各種規制に対応するために定期的な計算需要の増加が発生 • TIBCO GridServer 、IBM Spectrum Symphony、Microsoft HPC Pack と いった計算環境を AWS 上に構築 https://aws.amazon.com/blogs/apn/scheduling-on-the-aws-cloud-with-ibm-spectrum-lsf-and-ibm-spectrum-symphony/ https://aws.amazon.com/jp/blogs/news/creating-a-1-3-million-vcpu-grid-on-aws-using-ec2-spot-instances-and-tibco-gridserver/ https://github.com/aws-samples/aws-cfn-windows-hpc-template
  • 54. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. AWS Summit Online 開催 https://aws.amazon.com/jp/summits/2020/ • セッション内容は近日公開予定 • HPC 関連のお客様事例についても、 製造、金融、ライフサイエンス、製薬、気象等様々な分野からご登壇頂く予定
  • 55. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. クラウド HPC のはじめ方 AWS ParallelCluster を使用してクラスタを作成し、オートスケールす る計算環境を体験することが重要 • その上で、アプリケーション特性に応じて、インスタンスタイプの 選択や、EFA、FSx for Lustreの活用について検討 • コンテナ化が容易であれば、AWS Batchも検討 AWS ParallelCluster ユーザーガイド Hello World: https://docs.aws.amazon.com/ja_jp/parallelcluster/latest/ug/tutorials_01_hello_world.html AWS HPC Workshop (English): https://hpcworkshops.com/ Black Belt Online Seminar: AWS ParallelCluster https://www.slideshare.net/AmazonWebServicesJapan/20200408-aws-black-belt-online- seminar-aws-parallelcluster-hpc
  • 56. © 2020, Amazon Web Services, Inc. or its Affiliates. All rights reserved. まとめ • クラウドのスケーラビリティを活用し、 必要な時に必要な量の必要なタイプの計算リソースを確保することが可能 • 多種多様な HPC 関連サービスとアップデート • 製造、製薬、自動運転、金融など 様々な業種業界での活用事例についてもご紹介 クラウド HPC をはじめてみませんか?

Editor's Notes

  • #11: With the elasticity and scalability of AWS, customers can easily deploy multiple customers to meet the needs of their users, with the additional capability to match cluster architectures to jobs, such as memory optimized instances for large memory jobs or storage optimized instances for heavy IO jobs.
  • #19: AWS provides a wide breadth of services supporting compute-intensive workloads [Quickly walk through them] EFA network interface for compute instances AWSでは、クラウド上でこのようなコンピュートインテンシブワークロードを実現するために、様々なサービスを提供しています。 こちらに一例を示していますが、EC2を主軸に、 最近では
  • #21: スポットインスタンスのご説明に入る前に、まずEC2の購入オプションについて整理したいと思います。EC2の購入には3通りの方法があり、オンデマンドインスタンス、リザーブドインスタンス、スポットインスタンスがあります。 オンデマンドインスタンスは長期コミットなし、使ったぶんだけ秒単位にお支払いいただくタイプの購入方法です。こちらが定価の価格とお考えください。負荷が読めず、スパイクするようなワークロードに特に向いています。 リザーブドインスタンスは1年、あるいは3年の稼働時間を長期コミットしていただく代わりに、最大75%の割引でご提供するものです。一定の負荷が見込めるようなワークロードがある場合にお勧めです。 スポットインスタンスはAmazon EC2サービスの空きキャパシティ、つまり未使用のインスタンスを活用しており、空きキャパシティがある限り最大90%の割引でご提供するものです。ただし後ほどご説明しますが、Amazon EC2は稼働中のスポットインスタンスを中断する場合があります。このような特徴があることから、割引率が最大限である一方、柔軟かつステートレスなワークロードに適した購入オプションであると言うことができます。 ここで強調しておきたいのは、どの購入オプションを選択した場合も、EC2インスタンスとしての性能には何ら違いがないという点です。言い換えれば、AWSでは購入オプションによってEC2在庫の機材を使い分ける、ということはしておりません。
  • #22: 1/ We offer the choice of processor and architecture to build the applications you need with the flexibility in choice that you want. We believe that by providing greater choice, customers can choose the right compute to power their application and workload. 2/ We have had a rich and long-term partnership with Intel and the Skylake processor have been essential to powering our most powerful instances. We have also been release the latest generation Intel instance with the second general Xeon Scalable processors from Intel with our core workloads most recently, our largest C5 instances 3/ A year ago, we announced our support for the AMD EPYC processor. We have 5 instances across 15 regions and we have seen very positive reception for these new instances for those who want to benefit from lower costs when you do not need the full compute power of an instance. And we have given our commitment to deliver the latest generation Rome architecture for higher performance. 3/Lastly 4/ Last year here at re-Invent, we announced that AWS has released a new processor, the Graviton processor, based on Arm-architectures. W
  • #25: 初代Graviton搭載インスタンスはA1インスタンスとしてリリースされていた。 Graviton2では他のEC2インスタンスと同じ命名規則で汎用M、コンピュートC、メモリ最適化R と世代表記にGravitonの”g”がついたネーミング それぞれローカルNVMe SSDを搭載したインスタンス(x6gd)も用意 M6gは2020/5/11にGA (As of May 11) C6g: End-May, R6g: Mid-Jun, The D platforms (m6gd, r6gd and c6gd) are targeting to Jun-End. 6 instance types powered by Graviton2 processors into our popular C, M, R instance families with 2GB, 4GB, 8G DRAM/vCPU respectively And the option for instance storage on each M6g is in preview now, and the other instances will be coming soon
  • #28: NVIDIA GPU=グラフィックス処理のほか、MLの学習処理など高速処理 Xilinx FPGA=再構成可能な半導体素子で時には動画エンコーダー、時にはゲノム解析用などさまざまなアクセラレーターに変化して使う AWS Inferencia=機械学習の推論処理を高速化するアクセラレータ AWS上で従量課金で利用できるので、トライアルしやすい
  • #32: Parallel tightly-coupled computing applications are typically based on MPI. Here is a notional diagram of how mpi applications work today on AWS. This is the “before” chart, without EFA. MPI is a standardized message passing interface. There are a variety of versions of MPI, such as Open MPI and Intel MPI. These two we will be talking about later in the webinar.   MPI is the networking library used by the application to provide point to point communication between the different cores on which an application is running. MPI is the bottom of the user portion of the stack and it talks to the kernel tcp/ip stack. Which is at the top of the kernel stack. The kernel stack then talks to the ENA network driver which communicates with the hardware.  
  • #49: All sorts of HPC workloads are run on AWS, each optimized architecturally for performance and minimum cost. We run life sciences workloads such as genomics and neuroscience, support for financial services, oil and gas, weather and climate simulation, Electronic design automation, many, many design and engineering cases, we run all of the major CFD flow solvers, structural tools, media and entertainment, molecular dynamics, autonomous vehicles. And, we have lots of machine learning services.
  • #50: F1事例=先日Amazonからプレスリリースされた事例 いままでもF1 insightというレース中の車のセンサーデータを使って分析、車のコンディションをテレビに表示 ここまでの事例を見て言えること 設計/R&Dの“超機密情報”もクラウドにUploadし始めている スマートプロダクトだけでなく生産工程に関してもクラウドによるIoT化が進み始めている データドリブンの第一歩を歩み始めた状況、もっとIntelligentな世界を目指している
  • #51: Spotインスタンス=AWSの余剰リソースを時価で安く提供する仕組みがある。CPUのスペックは問わず安いサーバーをかき集めて大規模処理を実現している
  • #52: エーザイ様ではmyPrestというアプリケーションを利用した化合物とタンパク質のドッキングシミュレーションを行う創薬HPC基盤として、AWSを利用されていますが、クラウド上のコンピューティングリソースを利用されている事例となっています。 以上のようにすでに様々な形で様々なお客様にご利用いただいております。