Submit Search
[C31]世界最速カラムナーDBは本物だ! by Daisuke Hirama
2 likes
1,918 views
Insight Technology, Inc.
1 of 23
Download now
Downloaded 21 times
1
2
3
4
5
Most read
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
More Related Content
PDF
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
Insight Technology, Inc.
PPTX
[db tech showcase Tokyo 2017] B26: レデータの仮想化と自動化がもたらす開発効率アップとは?by 株式会社インサイトテクノ...
Insight Technology, Inc.
PDF
今こそクラウドへ!データの移行、連携、統合のコツ
株式会社クライム
PDF
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
Insight Technology, Inc.
PDF
[db tech showcase OSS 2017] A22: NoSQL:誰のための、何のためのデータベース?その将来は?by Aerospike, ...
Insight Technology, Inc.
PDF
Pivotal Greenplumで実現する次世代データ分析基盤のご紹介
Masayuki Matsushita
PDF
[DI06] 並列分散処理の考え方とオープンソース分散処理系の動向
de:code 2017
PDF
Developers.IO 2019 Effective Datalake
Satoru Ishikawa
D22 目覚めよDBエンジニア 〜世界最速カラムナーデータベースは本物だ!〜 by Koji Shinkubo
Insight Technology, Inc.
[db tech showcase Tokyo 2017] B26: レデータの仮想化と自動化がもたらす開発効率アップとは?by 株式会社インサイトテクノ...
Insight Technology, Inc.
今こそクラウドへ!データの移行、連携、統合のコツ
株式会社クライム
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
Insight Technology, Inc.
[db tech showcase OSS 2017] A22: NoSQL:誰のための、何のためのデータベース?その将来は?by Aerospike, ...
Insight Technology, Inc.
Pivotal Greenplumで実現する次世代データ分析基盤のご紹介
Masayuki Matsushita
[DI06] 並列分散処理の考え方とオープンソース分散処理系の動向
de:code 2017
Developers.IO 2019 Effective Datalake
Satoru Ishikawa
What's hot
(20)
PDF
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
Insight Technology, Inc.
PDF
Apache Kuduを使った分析システムの裏側
Cloudera Japan
PDF
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
Insight Technology, Inc.
PDF
HBase Across the World #LINE_DM
Cloudera Japan
PDF
[data analytics showcase] B16: Live Demo! データ分析基盤を支えるデータレプリケーション技術とデータワークロード分...
Insight Technology, Inc.
PPTX
Yahoo! JAPANのOracle構成-2017年版
Makoto Sato
PDF
Apache Impalaパフォーマンスチューニング #dbts2018
Cloudera Japan
PDF
[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...
Insight Technology, Inc.
PPTX
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Cloudera Japan
PDF
20170622_MySQL最新情報 ~MySQL 8.0 開発状況、MySQL InnoDB Cluster、などのご紹介~ by 日本オラクル株式会社...
Insight Technology, Inc.
PDF
オラクルのHadoopソリューションご紹介
オラクルエンジニア通信
PDF
[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓
Insight Technology, Inc.
PDF
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
MapR Technologies Japan
PDF
[de:code 2017] 並列分散処理の考え方とオープンソース分散処理系の動向
Naoki (Neo) SATO
PDF
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
Insight Technology, Inc.
PDF
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
Insight Technology, Inc.
PDF
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
Insight Technology, Inc.
PDF
先行事例から学ぶ IoT / ビッグデータの始め方
Cloudera Japan
PPTX
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
Tetsutaro Watanabe
PDF
(LT)Spark and Cassandra
datastaxjp
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
Insight Technology, Inc.
Apache Kuduを使った分析システムの裏側
Cloudera Japan
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
Insight Technology, Inc.
HBase Across the World #LINE_DM
Cloudera Japan
[data analytics showcase] B16: Live Demo! データ分析基盤を支えるデータレプリケーション技術とデータワークロード分...
Insight Technology, Inc.
Yahoo! JAPANのOracle構成-2017年版
Makoto Sato
Apache Impalaパフォーマンスチューニング #dbts2018
Cloudera Japan
[db tech showcase Tokyo 2015] D32:HPの全方位インメモリDB化に向けた取り組みとSAP HANAインメモリDB の効果を...
Insight Technology, Inc.
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Cloudera Japan
20170622_MySQL最新情報 ~MySQL 8.0 開発状況、MySQL InnoDB Cluster、などのご紹介~ by 日本オラクル株式会社...
Insight Technology, Inc.
オラクルのHadoopソリューションご紹介
オラクルエンジニア通信
[db tech showcase Tokyo 2015] E27: Neo4jグラフデータベース by クリエーションライン株式会社 李昌桓
Insight Technology, Inc.
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
MapR Technologies Japan
[de:code 2017] 並列分散処理の考え方とオープンソース分散処理系の動向
Naoki (Neo) SATO
[db tech showcase Tokyo 2015] B36:Hitachi Advanced Data Binder 実践SQLチューニング方法 ...
Insight Technology, Inc.
[db tech showcase Tokyo 2015] D13:PCIeフラッシュで、高可用性高性能データベースシステム?! by 株式会社HGSTジ...
Insight Technology, Inc.
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
Insight Technology, Inc.
先行事例から学ぶ IoT / ビッグデータの始め方
Cloudera Japan
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
Tetsutaro Watanabe
(LT)Spark and Cassandra
datastaxjp
Ad
Similar to [C31]世界最速カラムナーDBは本物だ! by Daisuke Hirama
(20)
PPTX
しばちょう先生が語る!オラクルデータベースの進化の歴史と最新技術動向#3
オラクルエンジニア通信
PDF
[db tech showcase Sapporo 2015] A12:DBAが知っておくべき最新テクノロジー: フラッシュ, ストレージ, クラウド b...
Insight Technology, Inc.
PDF
ヤフーを支えるフラッシュストレージ
Yahoo!デベロッパーネットワーク
PDF
インフラ野郎AzureチームProX
Toru Makabe
PDF
[INSIGHT OUT 2011] A12 ひとつのデータベース技術では生き残れない part1 カラムナーデータベース(Shinkubo)
Insight Technology, Inc.
PDF
[db tech showcase Tokyo 2018] #dbts2018 #D15 『5年連続!第三者機関の評価で(圧倒的)最強のピュアストレージが...
Insight Technology, Inc.
PDF
Azure Stack 受け入れ準備_20180630
Hiroshi Matsumoto
PDF
Scale flux roi&performance_acri
直久 住川
PDF
LTO/オートローダー/仮想テープライブラリの基礎知識
MKT International Inc.
PPTX
サポート エンジニアが語る、Microsoft Azure を支えるインフラの秘密
ShuheiUda
PDF
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
Amazon Web Services Japan
PDF
db tech showcase_2014_A14_Actian Vectorで得られる、BIにおける真のパフォーマンスとは
Koji Shinkubo
PDF
Snr005 レノボだから実現
Tech Summit 2016
PDF
PGXのレスポンスとリソース消費
Tatsumi Akinori
PDF
[db tech showcase Sapporo 2015] B14:データベース環境における検証結果から理解する失敗しないフラッシュ活用法 第二章 b...
Insight Technology, Inc.
PDF
DBTS2015 Tokyo DBAが知っておくべき最新テクノロジー
Masaya Ishikawa
PDF
20140315 jawsdays i2 instance io performance
Matsumoto Hiroki
PDF
[INSIGHT OUT 2011] c25 Super RACへの道 infinibandを使ったクラスターテクノロジー紹介
Insight Technology, Inc.
PDF
Oracle Database / Exadata Cloud 技術情報(Oracle Cloudウェビナーシリーズ: 2020年7月9日)
オラクルエンジニア通信
PDF
[Modern Cloud Day Tokyo 2019] Oracle Cloud (PaaS/IaaS)入門:事例を聞いて使ってみたくなったら ~サー...
オラクルエンジニア通信
しばちょう先生が語る!オラクルデータベースの進化の歴史と最新技術動向#3
オラクルエンジニア通信
[db tech showcase Sapporo 2015] A12:DBAが知っておくべき最新テクノロジー: フラッシュ, ストレージ, クラウド b...
Insight Technology, Inc.
ヤフーを支えるフラッシュストレージ
Yahoo!デベロッパーネットワーク
インフラ野郎AzureチームProX
Toru Makabe
[INSIGHT OUT 2011] A12 ひとつのデータベース技術では生き残れない part1 カラムナーデータベース(Shinkubo)
Insight Technology, Inc.
[db tech showcase Tokyo 2018] #dbts2018 #D15 『5年連続!第三者機関の評価で(圧倒的)最強のピュアストレージが...
Insight Technology, Inc.
Azure Stack 受け入れ準備_20180630
Hiroshi Matsumoto
Scale flux roi&performance_acri
直久 住川
LTO/オートローダー/仮想テープライブラリの基礎知識
MKT International Inc.
サポート エンジニアが語る、Microsoft Azure を支えるインフラの秘密
ShuheiUda
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
Amazon Web Services Japan
db tech showcase_2014_A14_Actian Vectorで得られる、BIにおける真のパフォーマンスとは
Koji Shinkubo
Snr005 レノボだから実現
Tech Summit 2016
PGXのレスポンスとリソース消費
Tatsumi Akinori
[db tech showcase Sapporo 2015] B14:データベース環境における検証結果から理解する失敗しないフラッシュ活用法 第二章 b...
Insight Technology, Inc.
DBTS2015 Tokyo DBAが知っておくべき最新テクノロジー
Masaya Ishikawa
20140315 jawsdays i2 instance io performance
Matsumoto Hiroki
[INSIGHT OUT 2011] c25 Super RACへの道 infinibandを使ったクラスターテクノロジー紹介
Insight Technology, Inc.
Oracle Database / Exadata Cloud 技術情報(Oracle Cloudウェビナーシリーズ: 2020年7月9日)
オラクルエンジニア通信
[Modern Cloud Day Tokyo 2019] Oracle Cloud (PaaS/IaaS)入門:事例を聞いて使ってみたくなったら ~サー...
オラクルエンジニア通信
Ad
More from Insight Technology, Inc.
(20)
PDF
グラフデータベースは如何に自然言語を理解するか?
Insight Technology, Inc.
PDF
Docker and the Oracle Database
Insight Technology, Inc.
PDF
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Insight Technology, Inc.
PDF
事例を通じて機械学習とは何かを説明する
Insight Technology, Inc.
PDF
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
Insight Technology, Inc.
PDF
MBAAで覚えるDBREの大事なおしごと
Insight Technology, Inc.
PDF
グラフデータベースは如何に自然言語を理解するか?
Insight Technology, Inc.
PDF
DBREから始めるデータベースプラットフォーム
Insight Technology, Inc.
PDF
SQL Server エンジニアのためのコンテナ入門
Insight Technology, Inc.
PDF
Lunch & Learn, AWS NoSQL Services
Insight Technology, Inc.
PDF
db tech showcase2019オープニングセッション @ 森田 俊哉
Insight Technology, Inc.
PDF
db tech showcase2019 オープニングセッション @ 石川 雅也
Insight Technology, Inc.
PDF
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
Insight Technology, Inc.
PPTX
難しいアプリケーション移行、手軽に試してみませんか?
Insight Technology, Inc.
PPTX
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Insight Technology, Inc.
PPTX
そのデータベース、クラウドで使ってみませんか?
Insight Technology, Inc.
PPTX
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
Insight Technology, Inc.
PDF
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
Insight Technology, Inc.
PPTX
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Insight Technology, Inc.
PPTX
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
Insight Technology, Inc.
グラフデータベースは如何に自然言語を理解するか?
Insight Technology, Inc.
Docker and the Oracle Database
Insight Technology, Inc.
Great performance at scale~次期PostgreSQL12のパーティショニング性能の実力に迫る~
Insight Technology, Inc.
事例を通じて機械学習とは何かを説明する
Insight Technology, Inc.
仮想通貨ウォレットアプリで理解するデータストアとしてのブロックチェーン
Insight Technology, Inc.
MBAAで覚えるDBREの大事なおしごと
Insight Technology, Inc.
グラフデータベースは如何に自然言語を理解するか?
Insight Technology, Inc.
DBREから始めるデータベースプラットフォーム
Insight Technology, Inc.
SQL Server エンジニアのためのコンテナ入門
Insight Technology, Inc.
Lunch & Learn, AWS NoSQL Services
Insight Technology, Inc.
db tech showcase2019オープニングセッション @ 森田 俊哉
Insight Technology, Inc.
db tech showcase2019 オープニングセッション @ 石川 雅也
Insight Technology, Inc.
db tech showcase2019 オープニングセッション @ マイナー・アレン・パーカー
Insight Technology, Inc.
難しいアプリケーション移行、手軽に試してみませんか?
Insight Technology, Inc.
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Insight Technology, Inc.
そのデータベース、クラウドで使ってみませんか?
Insight Technology, Inc.
コモディティサーバー3台で作る高速処理 “ハイパー・コンバージド・データベース・インフラストラクチャー(HCDI)” システム『Insight Qube』...
Insight Technology, Inc.
複数DBのバックアップ・切り戻し運用手順が異なって大変?!運用性の大幅改善、その先に。。
Insight Technology, Inc.
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Insight Technology, Inc.
レガシーに埋もれたデータをリアルタイムでクラウドへ [ATTUNITY & インサイトテクノロジー IoT / Big Data フォーラム 2018]
Insight Technology, Inc.
[C31]世界最速カラムナーDBは本物だ! by Daisuke Hirama
1.
世界最速 カラムナーDBは本物だ! ParAccel SMP (Vectorwise) 平間
大輔 Insight Technology, Inc. Copyright © 2013 Insight Technology, Inc. All Rights Reserved.
2.
世界最速? Copyright © 2013
Insight Technology, Inc. All Rights Reserved.
3.
世界最速! TPC-H ベンチマークのトップ 8(Non-Clustered
1TB ) 2013/7/11時点 Vectorwise 3 May 2011 Vectorwise 6 Jan 2012 400,000 Performance (QphH@1TB) 300,000 Oracle 200,000 Oracle Sybase IQ 15 Dec 2010 3 Jun 2011 Microsoft 5 Apr 2011 26 Apr 2010 Microsoft 30 Aug 2011 Oracle 26 Sep 2011 32 cores 1 TB RAM 32 cores 0.75 TB RAM 64 cores 0.5TB RAM 80 cores 2TB RAM 32 cores 0.5TB RAM 64 cores 0.5TB RAM 32 cores 0.5TB RAM 80 cores 2TB RAM 140,181 164,747 173,961 436,788 445,529 209,533 219,887 201,487 $12.15 US 100,000 $6.85 US $1.37 US $0.88 US $0.75 US $9.53 US $1.86 US $4.60 US 0 Price/Performance US$/QphH@1TB Source: www.tpc.org / Jul 11, 2013 TPC, TPC Benchmark, TPC-H, QppH, QthH and QphH are trademarks of the Transaction Processing Performance Council (TPC) Copyright © 2013 Insight Technology, Inc. All Rights Reserved.
4.
ParAccel SMP (Vectorwise)のイノベーション •
カラム指向データベース • 圧縮 • 効率的なブロックI/O Millions DISK 150-250 RAM CHIP 2-20 Time / Cycles to Process • Queryの並列処理 40-400MB 2-3GB 10GB • CPUの最適化 (オンチップコンピューティング) Data Processed Copyright © 2013 Insight Technology, Inc. All Rights Reserved.
5.
カラム指向データベースのメリット • 列指向とは? • メリットは? (シーケンシャルな)アクセス効率 + データ圧縮
= 分析基盤に向いている Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date •1ブロックには様々なタ イプのデータが格納され ているので圧縮効率を 上げにくい •1ブロックには同様のタ イプのデータが格納され ているので圧縮効率を 上げやすい Copyright © 2013 Insight Technology, Inc. All Rights Reserved.
6.
カラム指向データベースのデメリット • デメリットは? 一般的に (ランダムな)アクセスが非効率 + データ圧縮
= OLTP基盤に向いていない Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date Prod ID Prod Name Date •更新時に圧縮・展開 •のオーバーヘッドが •大きい(*1) Copyright © 2013 Insight Technology, Inc. All Rights Reserved.
7.
自動的な圧縮と解凍 • 複数のアルゴリズムを使ってカラム毎に圧縮 – 最適なものをParAccel
SMPが自動的に使用 • 解凍はベクトル処理 – CPUキャッシュ中でデータ処理 I/Oスループット を最大化 CPUキャッシュ中に 解凍し格納 カラム カラム キャッシュ バッファ 管理 解凍 Disk RAM CPU RAMへの書き込み・ 読み込みを削減 Copyright © 2013 Insight Technology, Inc. All Rights Reserved.
8.
CPUキャッシュ内で処理 • CPUキャッシュのアクセスは、RAMより 非常に高速 • すべてのベクトルがCPUキャッシュ内に 収まるように問合せの実行プランを作成 Millions HDD DISK 10-15ms 40-100MB 40-100MB 0.1-1ms 200-500MB 150-200ns
2-3GB RAM 150-200ns 2-3GB Cache 2-20ns 10GB RAM 150-250 CPU キャッシュ サイズ 4MB 8 – 12MB Xeon E7-88XX 2-3GB 512KB/1-2MB Xeon 33X0 40-500MB Xeon Xeon 50X0 CHIP 2-20 Time / Cycles to Process 転送スピード 転送スピード (毎秒) (毎秒) SSD RAM DISK (HDD/SSD) アクセス アクセスタ タイム イム 24 – 30MB 10GB Data Processed Copyright © 2013 Insight Technology, Inc. All Rights Reserved.
9.
ベクトル処理とキャッシュ最適化 SIMD (Single Instruction
Multiple Data) 1 2 3 4 5 6 7 8 x x x x x x x x 1 2 3 4 5 6 7 8 = = = = = = = = 1 4 9 16 25 36 49 64 . . . n x n = n2 1 2 3 4 5 6 7 8 x x x x x x x x . . . nx 1 1 2 4 3 9 4 16 5 25 6 = 36 7 49 8 64 . . . n n2 SSE(ストリーミング SIMD 拡張命令) 16個の128bitのレジスタ (Intel Sandy Bridgeは256bit) *32bit float * 4 *16bit integer * 8 *8bit byte/char * 16 etc. *加減算、積除算、比較、最大最小など *文字列の処理でSSE4.2が効果大 (GROUP BYやLIKEなど) SSE2はPentium 4, AMD64以降 SSE3は後期Pentium 4, 後期Athlon64以降 SSE4は後期Core2以降 Copyright © 2013 Insight Technology, Inc. All Rights Reserved.
10.
ロードを含めた性能比較 環境 Redhat Enterprise Linux 6.3
64bit Intel Xeon L5640 2.27GHz(6core) * 2 48GB SAS HDD * 2 (RAID1) いろいろ Copyright © 2013 Insight Technology, Inc. All Rights Reserved.
11.
ロードを含めた性能比較 TPC-H(dbgen) 10GBをロード時のパフォーマンス(秒) –
インデックスなし PostgreSQL 8.4 MySQL 5.1 商用RDBMS X Vectorwise 3.0 customer (234MB/1.5M rows) lineitem (7416MB/60M rows) nation (0MB/25 rows) orders (1668MB/15M rows) part (232MB/2.0M rows) partsupp (1149MB/8.0M rows) region (0MB/5 rows) supplier (14MB/0.1M rows) Total (10GB/86.6M rows) Actual DB Size (10GB/86.6M rows) Copyright © 2013 Insight Technology, Inc. All Rights Reserved. 某カラムナー DB(1) 某カラムナー DB(2)
12.
ロードを含めた性能比較 データロード性能 (秒) (GB) 1400 18 16 1200 14 1000 12 800 10 600 8 6 400 4 200 2 0 0 PostgreSQL 8.4 MySQL 5.1 商用RDBMS X データサイズ(GB) Vectorwise 3.0 ロード時間(秒) Copyright © 2013
Insight Technology, Inc. All Rights Reserved. 某カラムナー DB(1) 某カラムナー DB(2)
13.
ロードを含めた性能比較 TPC-H(qgen) 10GBに対するQuery時のパフォーマンス(秒) -
キャッシュなし PostgreSQL 8.4 MySQL 5.1 商用RDBMS X Vectorwise 3.0 Query1 Query3 MySQLはインデッ クスなしでは返って こないので、 Primary Keyの み付与 Query4 Query6 Query7 Query8 Query9 Query10 Query11 Query12 Query13 Query14 Query16 Query18 Query19 Query20 Query21 Query22 Total Copyright © 2013 Insight Technology, Inc. All Rights Reserved. 某カラムナー DB(1) 某カラムナー DB(2)
14.
DEMO 世界中のツイート(*1)の1% を抽出 (2012/4/23 - 2012/4/25) 1000万件のツイートデータ から世界のツイート数の国別 ランキングを出してみると? ツイートの語句解析(MeCabに よる形態素解析) 99% データベースにロード 1% デモのためデータを5倍に増幅 -
ツイートデータで1000万件 (10GB) - 解析後語句データで260万件 tweets demo tweets 1000万件のツイートデータ から世界のツイートの時間帯 別ツイート数の推移を見てみ ると? (100MB) データロードは各データベースベ ンダーが用意するローダーを使用 Copyright © 2013 Insight Technology, Inc. All Rights Reserved. 1000万件のツイートデータ と260万件の解析後の語句 データから日本でホット だったキーワードを探って みると?
15.
DEMO DBMS X ParAccel SMP Redhat
Enterprise Linux 5.7 64bit Redhat Enterprise Linux 5.7 64bit Intel Xeon X5672 3.20GHz * 2 Intel Xeon E5645 2.40GHz * 4 48GB 48GB SATA SSD * 6 (RAID10) SATA 1K rpm HDD * 18 (RAID50) Vectorwise 2.5.1 DBMS X Copyright © 2013 Insight Technology, Inc. All Rights Reserved.
16.
DEMO Copyright © 2013
Insight Technology, Inc. All Rights Reserved.
17.
ParAccel SMP (Vectorwise)の歴史 ~‘08 x100 ‘08 ‘10 ’11 ’13 ParAccel
SMP Copyright © 2013 Insight Technology, Inc. All Rights Reserved.
18.
Ingresとの内部構造比較 & SQL Parser SQL Parser Ingres
Rewriter Ingres Rewriter Modify Ingres Optimizer Ingres Optimizer Heavy Modify X Compiler Ingres Storage & Executor Classic Ingres Storage & Executor Copyright © 2013 Insight Technology, Inc. All Rights Reserved. Vectorwise Rewriter Vectorwise Executor Compressed PAX/DSM Add
19.
とある導入事例 某RDBMS 某BIツール 某RDBMS 某BIツール 目標:チャートの表示時間を現行の1/4に! Copyright © 2013
Insight Technology, Inc. All Rights Reserved.
20.
速くなる、はずが… チャート名 現行 導入後 (修正前) 186 秒 74 秒 メーカー 77
秒 66 秒 メーカー_規格詳細 11 秒 128 秒 メーカー_品目詳細 16 秒 156 秒 129 秒 66 秒 品目_詳細 28 秒 204 秒 製品カテゴリ 51 秒 7秒 製品カテゴリ(抜粋) 11 秒 4秒 製品カテゴリ(抜粋)_詳細 47 秒 8秒 165 秒 22 秒 製品カテゴリ(抜粋)_全店舗一覧(スクロールなし) 88 秒 12 秒 製品カテゴリ_詳細 62 秒 9秒 製品カテゴリ_全店舗一覧 248 秒 23 秒 製品カテゴリ_全店舗一覧(スクロールなし) 127 秒 16 秒 60 秒 15分以上 トップ 品目 製品カテゴリ(抜粋)_全店舗一覧 顧客 *チャート名は、顧客との守秘義務の為、一部変更しております Copyright © 2013 Insight Technology, Inc. All Rights Reserved.
21.
すんなり導入、とはいきませんが… • 動作のクセを見抜け! – ビューの有無や結合の仕方による速度の違い •
「サポートしている=快適に動く」とは限らない – BIツールが吐く「非効率なSQL」を制御せよ • 運用に関する情報は? – バックアップは?リカバリは? – Ingresとの共通点多し Copyright © 2013 Insight Technology, Inc. All Rights Reserved.
22.
乗り越えれば、世界最速が待っている チャート名 現行 導入後 (修正前) 導入後 (修正後) 短縮率 186 秒 74 秒 14
秒 92.46 % メーカー 77 秒 66 秒 19 秒 75.32 % メーカー_規格詳細 11 秒 128 秒 2秒 82.35 % メーカー_品目詳細 16 秒 156 秒 3秒 81.25 % 129 秒 66 秒 35 秒 72.87 % 品目_詳細 28 秒 204 秒 5秒 82.14 % 製品カテゴリ 51 秒 7秒 7秒 86.27 % 製品カテゴリ(抜粋) 11 秒 4秒 4秒 62.50 % 製品カテゴリ(抜粋)_詳細 47 秒 8秒 8秒 83.10 % 165 秒 22 秒 22 秒 86.64 % 製品カテゴリ(抜粋)_全店舗一覧(スクロールなし) 88 秒 12 秒 12 秒 86.31 % 製品カテゴリ_詳細 62 秒 9秒 9秒 85.41 % 製品カテゴリ_全店舗一覧 248 秒 23 秒 23 秒 90.71 % 製品カテゴリ_全店舗一覧(スクロールなし) 127 秒 16 秒 16 秒 87.40 % 60 秒 15分以上 12 秒 80.00 % トップ 品目 製品カテゴリ(抜粋)_全店舗一覧 顧客 *チャート名は、顧客との守秘義務の為、一部変更しております Copyright © 2013 Insight Technology, Inc. All Rights Reserved.
23.
•無断転載を禁ず •この文書はあくまでも参考資料であり、掲載されている情報は予告なしに変更されることがあります。 •株式会社インサイトテクノロジーは本書の内容に関していかなる保証もしません。また、本書の内容に関連したいかなる 損害についても責任を負いかねます。 •本書で使用している製品やサービス名の名称は、各社の商標または登録商標です。
Download