SlideShare a Scribd company logo
2
Most read
10
Most read
12
Most read
PG-Strom v5リリース記念
GPUを活用したビッグデータ分析基
盤を構築しよう
ヘテロDB株式会社
日本仮想化技術株式会社
宮原 徹(日本仮想化技術株式会社)
自己紹介
• 本名:宮原 徹
• 1972年1月 神奈川県生まれ
• 1994年3月 中央大学法学部法律学科卒業
• 1994年4月 日本オラクル株式会社入社
– PCサーバ向けRDBMS製品マーケティングに従事
– Linux版Oracle8の日本市場向け出荷に貢献
• 2000年3月 株式会社デジタルデザイン 東京支社長および株
式会社アクアリウムコンピューター 代表取締役社長に就任
– 2000年6月 (株)デジタルデザイン、ナスダック・ジャパン上場(4764)
• 2001年1月 株式会社びぎねっと 設立
• 2006年12月 日本仮想化技術株式会社 設立
• 2008年10月 IPA「日本OSS貢献者賞」受賞
• 2009年10月 日中韓OSSアワード 「特別貢献賞」受賞
2
日本仮想化技術株式会社 概要
• 社名:日本仮想化技術株式会社
– 英語名:VirtualTech Japan Inc.
– 略称:日本仮想化技術/VTJ
• 設立:2006年12月
• 資本金:3,000万円
• 売上高:1億8100万円(2022年7月期)
• 本社:東京都渋谷区渋谷1-8-1
• 取締役:宮原 徹(代表取締役社長兼CEO)
• 伊藤 宏通(取締役CTO)
• スタッフ:11名(うち8名が仮想化技術専門エンジニアです)
• URL:http://VirtualTech.jp/
• 仮想化技術に関する研究および開発
– 仮想化技術に関する各種調査
– 仮想化技術を導入したシステムの構築・運用サポート
– 5G活用のためのインフラ・サービス研究開発
– DevOps支援サービスの提供
– GPUを活用した超高速データ分析基盤「爆速DB」の提供
ベンダーニュートラルな
独立系仮想化技術の
エキスパート集団
3
Think ITで本内容を連載開始
4
https://thinkit.co.jp/series/11210
GPU活用による高速化
〜PG-STROMの仕組み〜
5
PG-Stromの高速化手法
• PG-StromはPostgreSQLを拡張・高速化
– GPUによる超並列処理
– GPUDirect Storageによるデータ高速読込
– Apache Arrowによるデータ読込の最適化
• 通常は遅くなる処理を高速化
– インデックスが効かないフルスキャン検索
– ビッグデータの集計処理
– 位置情報データの検索処理
GPUによる超並列処理
• CPUとGPUのコア数に大きな違い
– 現在のサーバー用CPUがプロセッサあたり最
大96コアから128コア
– 現在のエンタープライズ用GPUが約5000コア
– CPUのトレンドがNPU搭載に向かいつつある
• データの検索処理や集計処理を並列化
– より多くのコアで超並列処理
– 単純な処理ほど並列化に向いている
• 計算機は条件分岐などの複雑な処理が苦手
GPUDirect Storageによる高速読込
• NVMe接続されたストレージからGPUのメモリ
に対して直接データを読み込む技術
– メインメモリ経由でGPUメモリに読み込むより高速
• PCIe 4.0 x4接続のSSDを4台接続して
256Gbpsの帯域幅を確保
– バイト換算で32GB/秒 ※理論値
• NVMe-oF(NVMe over Fabrics)により、外部
ストレージから高速なEthernet経由で直接読
み込みも可能
– 100GbEでバイト換算で約12GB/秒 ※理論値
※理論値は概算値であり、プロトコルオーバーヘッドなどで実速度は低下します
GPUDirect Storage
• データをメインメモリ経由ではなく直接GPU
メモリに読み込み
9
データ
GPUメモリ GPUコア
メインメモリ CPU
Apache Arrowによる読込の最適化
• Apache Arrow形式はカラム(列)指向のデー
タフォーマット
– インメモリデータベースに向いている
• あらかじめ集計などを行う列を抽出してデー
タファイル化
– 読込量を減らして高速処理
• 更新はできないので検索処理のみに使用
– OLTP系DBならテーブルからArrow形式に変換
• Fluentdの出力をArrow形式で保存
– IoTなどのシステム
GPUキャッシュ
• GPUメモリ上にデータをキャッシュ
– ストレージからの読込不要に
– GPUメモリに乗りきるデータサイズに有効
• Tesla A100で80GBのGPUメモリ
• メインメモリでOLTP処理されているテーブ
ルデータを差分同期可能
PostGIS関数のGPU対応
• 地理空間情報を扱うPostGIS関数をGPU対応
– 対応している関数は一部の関数のみ
• PostGISでは点や線分、区画(ポリゴン)などを
ジオメトリ型として扱う
– 例:緯度経度からジオメトリ型(点)に変換できる
• 関数の例
– st_contains():ジオメトリa(ポリゴン等)にジオメトリ
b(点など)が包含されるかを判定
– st_distance():ジオメトリ間の距離を返す
• GiSTインデックス利用で更に高速化可能
現在の開発状況
• 新版バージョンVer5系が正式リリース
– 内部アーキテクチャの改善
– DPU(NICなどのプロセッサ)対応
13
https://github.com/heterodb/pg-strom
OSS版とサブスクリプションの違い
• OSS版とサブスクリプション購入には以下
の違いがあります
機能 OSS版 サブスクリプション
GPU数 1基のみ 複数可能
GPUDirect Storage 1台のみ※ 複数台
GiSTインデックス結合 × ○
HyperLogLog × ○
技術サポート × メール
アップデートのサポート × ○
※GeForceでは動きません
OSS版PG-Strom導入
• OSS版PG-StromはCUDA対応GPUがあれ
ば動作可能
– GPUDirect StorageはNVIDIAのデータセン
ター用GPUが必要
• 対応LinuxディストリビューションはCUDA
がサポートされているもの
– インストールのしやすさからRHEL系推奨
• インストールガイドを提供
爆速DB
• 「爆速DB」はPG-Stromをベースに導入から運
用までをワンストップでサポートするデータ分
析基盤ソリューションです
• 推奨ハードウェア構成をベースにしたハード
ウェアアプライアンスを提供しています
– サブスクリプションのみ購入も可能
• 仮想マシンやコンテナでの動作もサポートし
ます
• GPUが扱える各種クラウドサービスにも対応
します
– mdx、さくらの高火力サーバーなど
活用ユースケース
• 大容量ログの解析に
– Webサービス等のアクセスログ
– 通信ログ
– IoTのセンサー等のログ
• 位置情報分析
– 移動体通信デバイスの位置情報分析
お問い合わせ先
メールにて
sales@VirtualTech.jp
評価したい等々、
お気軽にお問い合わせください
18
ありがとうございました
19

More Related Content

PPTX
2024/03/01 爆速!DBチューニング超入門 〜DB性能の基礎とGPU活用による高速化〜
PDF
20191115-PGconf.Japan
PDF
SSDとGPUがPostgreSQLを加速する【OSC.Enterprise】
PPTX
爆速!DBチューニング超入門 〜DB性能の基礎とGPU活用による高速化〜
PPTX
爆速!DBチューニング超入門 〜DB性能の基礎とPG-Stromによる高速化〜 OSC2024 Online/Fall版
PDF
20221116_DBTS_PGStrom_History
PDF
(JP) GPGPUがPostgreSQLを加速する
PDF
20210731_OSC_Kyoto_PGStrom3.0
2024/03/01 爆速!DBチューニング超入門 〜DB性能の基礎とGPU活用による高速化〜
20191115-PGconf.Japan
SSDとGPUがPostgreSQLを加速する【OSC.Enterprise】
爆速!DBチューニング超入門 〜DB性能の基礎とGPU活用による高速化〜
爆速!DBチューニング超入門 〜DB性能の基礎とPG-Stromによる高速化〜 OSC2024 Online/Fall版
20221116_DBTS_PGStrom_History
(JP) GPGPUがPostgreSQLを加速する
20210731_OSC_Kyoto_PGStrom3.0

Similar to 爆速DB「PG-Strom」について 『PG-Strom v5リリース記念 GPUを活用したビッグデータ分析基盤を構築しよう」』 (20)

PDF
GPUとSSDがPostgreSQLを加速する~クエリ処理スループット10GB/sへの挑戦~ [DB Tech Showcase Tokyo/2017]
PDF
20180914 GTCJ INCEPTION HeteroDB
PPTX
DBチューニング超入門
PPTX
DBチューニング超入門
PDF
20171220_hbstudy80_pgstrom
PDF
20170329_BigData基盤研究会#7
PDF
20180217 FPGA Extreme Computing #10
PPTX
DB性能の基礎 DB性能高速化入門 〜基礎から列指向、GPU活用まで〜 宮原 徹
PDF
20170310_InDatabaseAnalytics_#1
PDF
PL/CUDA - Fusion of HPC Grade Power with In-Database Analytics
PDF
20190314 PGStrom Arrow_Fdw
PDF
20191211_Apache_Arrow_Meetup_Tokyo
PDF
pgconfasia2016 lt ssd2gpu
PDF
20190925_DBTS_PGStrom
PPTX
爆速!DBチューニング超入門 〜DB性能の基礎とPG-Stromによる高速化〜 2025/2/21
PDF
20190516_DLC10_PGStrom
PDF
An Intelligent Storage?
PDF
PL/CUDA - GPU Accelerated In-Database Analytics
PDF
20180920_DBTS_PGStrom_JP
PDF
20200828_OSCKyoto_Online
GPUとSSDがPostgreSQLを加速する~クエリ処理スループット10GB/sへの挑戦~ [DB Tech Showcase Tokyo/2017]
20180914 GTCJ INCEPTION HeteroDB
DBチューニング超入門
DBチューニング超入門
20171220_hbstudy80_pgstrom
20170329_BigData基盤研究会#7
20180217 FPGA Extreme Computing #10
DB性能の基礎 DB性能高速化入門 〜基礎から列指向、GPU活用まで〜 宮原 徹
20170310_InDatabaseAnalytics_#1
PL/CUDA - Fusion of HPC Grade Power with In-Database Analytics
20190314 PGStrom Arrow_Fdw
20191211_Apache_Arrow_Meetup_Tokyo
pgconfasia2016 lt ssd2gpu
20190925_DBTS_PGStrom
爆速!DBチューニング超入門 〜DB性能の基礎とPG-Stromによる高速化〜 2025/2/21
20190516_DLC10_PGStrom
An Intelligent Storage?
PL/CUDA - GPU Accelerated In-Database Analytics
20180920_DBTS_PGStrom_JP
20200828_OSCKyoto_Online
Ad

More from VirtualTech Japan Inc./Begi.net Inc. (20)

PPTX
今さら聞けない人のためのDevOps超入門 2025/2/20 OSC2025 Tokyp/Spring
PPTX
Linuxサーバー構築学習のポイントと環境構築 ~『Linuxサーバー構築標準教科書』の執筆者が超解説!~
PPTX
OSC2023福岡LT「希望の船に乗って」みやはら とおる(@tmiyahar)
PPTX
今さら聞けない人のためのSSH超入門
PPTX
OSCのこれまでを振り返るとしたらこんな感じ?
PPTX
今さら聞けない人のためのDevOps超入門
PPTX
今さら聞けない人のためのDevOps超入門 ODC2023編
PPTX
今さら聞けない人のためのDevOps超入門
PPTX
今さら聞けない人のためのDevOps超入門
PPTX
今さら聞けない人のためのDevOps超入門
PPTX
MIRACLE LINUX 9にAnsibleをインストールした話
PPTX
今さら聞けない人のためのDevOps超入門
PPTX
最近のOSCと今後について
PPTX
今さら聞けない人のためのDevOps超入門
PPTX
オープンソースカンファレンスへの参加のススメ
PPTX
今さら聞けない人のためのDevOps超入門
PPTX
今さら聞けない人のためのDevOps超入門
PPTX
MIRACLE LINUX 8をVirtualBoxに入れる時のいくつかのコツ
PPTX
今さら聞けない人のためのDevOps超入門
PPTX
いまさら聞けないDockerコンテナ超入門
今さら聞けない人のためのDevOps超入門 2025/2/20 OSC2025 Tokyp/Spring
Linuxサーバー構築学習のポイントと環境構築 ~『Linuxサーバー構築標準教科書』の執筆者が超解説!~
OSC2023福岡LT「希望の船に乗って」みやはら とおる(@tmiyahar)
今さら聞けない人のためのSSH超入門
OSCのこれまでを振り返るとしたらこんな感じ?
今さら聞けない人のためのDevOps超入門
今さら聞けない人のためのDevOps超入門 ODC2023編
今さら聞けない人のためのDevOps超入門
今さら聞けない人のためのDevOps超入門
今さら聞けない人のためのDevOps超入門
MIRACLE LINUX 9にAnsibleをインストールした話
今さら聞けない人のためのDevOps超入門
最近のOSCと今後について
今さら聞けない人のためのDevOps超入門
オープンソースカンファレンスへの参加のススメ
今さら聞けない人のためのDevOps超入門
今さら聞けない人のためのDevOps超入門
MIRACLE LINUX 8をVirtualBoxに入れる時のいくつかのコツ
今さら聞けない人のためのDevOps超入門
いまさら聞けないDockerコンテナ超入門
Ad

爆速DB「PG-Strom」について 『PG-Strom v5リリース記念 GPUを活用したビッグデータ分析基盤を構築しよう」』