Upload
Download free for 30 days
Login
Submit Search
AWS Redshift Analyzeの必要性とvacuumの落とし穴
9 likes
7,550 views
Moto Fukao
2014.11.26 JAWS-UG Tokyo アンチパターン祭りLT
Technology
Read more
1 of 30
Download now
Downloaded 18 times
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Most read
22
23
24
25
26
27
28
29
30
Most read
More Related Content
PPTX
AWSで作る分析基盤
Yu Otsubo
PPT
Amazon Redshift ベンチマーク Hadoop + Hiveと比較
FlyData Inc.
PDF
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
Amazon Web Services Japan
PDF
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
Ryoma Nagata
PDF
ビックデータ最適解とAWSにおける新しい武器
Akihiro Kuwano
PDF
Azure Synapse Analytics 専用SQL Poolベストプラクティス
Microsoft
PDF
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
Ryoma Nagata
PDF
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
hamaken
AWSで作る分析基盤
Yu Otsubo
Amazon Redshift ベンチマーク Hadoop + Hiveと比較
FlyData Inc.
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
Amazon Web Services Japan
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
Ryoma Nagata
ビックデータ最適解とAWSにおける新しい武器
Akihiro Kuwano
Azure Synapse Analytics 専用SQL Poolベストプラクティス
Microsoft
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
Ryoma Nagata
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
hamaken
What's hot
(20)
PDF
AWS Black Belt Online Seminar AWSで実現するDisaster Recovery
Amazon Web Services Japan
PDF
Snowflake Architecture and Performance
Mineaki Motohashi
PPTX
Glue DataBrewでデータをクリーニング、加工してみよう
takeshi suto
PDF
AWS Black Belt Online Seminar 2017 AWS WAF
Amazon Web Services Japan
PDF
AWS Black Belt - AWS Glue
Amazon Web Services Japan
PDF
20210127 AWS Black Belt Online Seminar Amazon Redshift 運用管理
Amazon Web Services Japan
PDF
20190205 AWS Black Belt Online Seminar 公共機関によるAWSの利活用
Amazon Web Services Japan
PDF
AWS Black Belt Online Seminar 2017 Amazon ElastiCache
Amazon Web Services Japan
PDF
20190806 AWS Black Belt Online Seminar AWS Glue
Amazon Web Services Japan
PDF
DMBOKをベースにしたデータマネジメント
Kent Ishizawa
PDF
20180704 AWS Black Belt Online Seminar Amazon Elastic File System (Amazon EFS...
Amazon Web Services Japan
PDF
AWS Black Belt online seminar 2017 Snowball
Amazon Web Services Japan
PDF
Google Cloud ベストプラクティス:Google BigQuery 編 - 01 : BigQuery とは?
Google Cloud Platform - Japan
PDF
20180221 AWS Black Belt Online Seminar AWS Lambda@Edge
Amazon Web Services Japan
PDF
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
Amazon Web Services Japan
PDF
AWS Black Belt Online Seminar Amazon Redshift
Amazon Web Services Japan
PDF
CircleCI vs. CodePipeline
HonMarkHunt
PDF
Amazon Redshiftによるリアルタイム分析サービスの構築
Minero Aoki
PDF
なぜ「マイクロサービス“化”」が必要なのか
Yusuke Suzuki
PDF
Sql server よく聞く設定とその効果
Masayuki Ozawa
AWS Black Belt Online Seminar AWSで実現するDisaster Recovery
Amazon Web Services Japan
Snowflake Architecture and Performance
Mineaki Motohashi
Glue DataBrewでデータをクリーニング、加工してみよう
takeshi suto
AWS Black Belt Online Seminar 2017 AWS WAF
Amazon Web Services Japan
AWS Black Belt - AWS Glue
Amazon Web Services Japan
20210127 AWS Black Belt Online Seminar Amazon Redshift 運用管理
Amazon Web Services Japan
20190205 AWS Black Belt Online Seminar 公共機関によるAWSの利活用
Amazon Web Services Japan
AWS Black Belt Online Seminar 2017 Amazon ElastiCache
Amazon Web Services Japan
20190806 AWS Black Belt Online Seminar AWS Glue
Amazon Web Services Japan
DMBOKをベースにしたデータマネジメント
Kent Ishizawa
20180704 AWS Black Belt Online Seminar Amazon Elastic File System (Amazon EFS...
Amazon Web Services Japan
AWS Black Belt online seminar 2017 Snowball
Amazon Web Services Japan
Google Cloud ベストプラクティス:Google BigQuery 編 - 01 : BigQuery とは?
Google Cloud Platform - Japan
20180221 AWS Black Belt Online Seminar AWS Lambda@Edge
Amazon Web Services Japan
20210127 今日から始めるイベントドリブンアーキテクチャ AWS Expert Online #13
Amazon Web Services Japan
AWS Black Belt Online Seminar Amazon Redshift
Amazon Web Services Japan
CircleCI vs. CodePipeline
HonMarkHunt
Amazon Redshiftによるリアルタイム分析サービスの構築
Minero Aoki
なぜ「マイクロサービス“化”」が必要なのか
Yusuke Suzuki
Sql server よく聞く設定とその効果
Masayuki Ozawa
Ad
Similar to AWS Redshift Analyzeの必要性とvacuumの落とし穴
(20)
PDF
[AWS Start-up ゼミ] よくある課題を一気に解説!〜御社の技術レベルがアップする 2017 夏期講習〜
Amazon Web Services Japan
PPTX
20141126 jaws-antipattern
Yasuhiro Araki, Ph.D
PPTX
初心者向け負荷軽減のはなし
Oonishi Takaaki
PDF
AWSのデータベースサービス全体像
Amazon Web Services Japan
PDF
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
Hideo Takagi
PDF
Dat004 開発者に捧ぐ「sql server_2016_
Tech Summit 2016
PDF
エンターテイメント業界におけるAWS活用事例
Amazon Web Services Japan
PDF
Developers.IO 2019 Effective Datalake
Satoru Ishikawa
PDF
SQL Azure のシームレスな管理
junichi anno
PDF
Awsビギナー向け資料 ec2 20111124
satoshi
PPTX
SIGMOD 2022Amazon Redshift Re-invented を読んで
Yohei Azekatsu
PDF
Hadoopによるリクルートでの技術調査とその活用
Chiaki Hatanaka
PDF
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Shinpei Ohtani
PDF
AWS Black Belt Online Seminar Amazon Aurora
Amazon Web Services Japan
PDF
Chugoku db 17th-postgresql-9.6
Toshi Harada
PDF
Webサービス向け、クラウドデザインパターン:アンチパターン紹介
Yasuhiro Araki, Ph.D
PPTX
20170510aws blackbeltrds-170510101017
anzhong70
PDF
AWS Black Belt Online Seminar 2016 Amazon EC2 Container Service
Amazon Web Services Japan
PDF
お金をかけないDBチューニング
Kazuya Sato
PDF
[Japan Tech summit 2017] DAL 003
Microsoft Tech Summit 2017
[AWS Start-up ゼミ] よくある課題を一気に解説!〜御社の技術レベルがアップする 2017 夏期講習〜
Amazon Web Services Japan
20141126 jaws-antipattern
Yasuhiro Araki, Ph.D
初心者向け負荷軽減のはなし
Oonishi Takaaki
AWSのデータベースサービス全体像
Amazon Web Services Japan
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
Hideo Takagi
Dat004 開発者に捧ぐ「sql server_2016_
Tech Summit 2016
エンターテイメント業界におけるAWS活用事例
Amazon Web Services Japan
Developers.IO 2019 Effective Datalake
Satoru Ishikawa
SQL Azure のシームレスな管理
junichi anno
Awsビギナー向け資料 ec2 20111124
satoshi
SIGMOD 2022Amazon Redshift Re-invented を読んで
Yohei Azekatsu
Hadoopによるリクルートでの技術調査とその活用
Chiaki Hatanaka
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
Shinpei Ohtani
AWS Black Belt Online Seminar Amazon Aurora
Amazon Web Services Japan
Chugoku db 17th-postgresql-9.6
Toshi Harada
Webサービス向け、クラウドデザインパターン:アンチパターン紹介
Yasuhiro Araki, Ph.D
20170510aws blackbeltrds-170510101017
anzhong70
AWS Black Belt Online Seminar 2016 Amazon EC2 Container Service
Amazon Web Services Japan
お金をかけないDBチューニング
Kazuya Sato
[Japan Tech summit 2017] DAL 003
Microsoft Tech Summit 2017
Ad
AWS Redshift Analyzeの必要性とvacuumの落とし穴
1.
Amazon Redshift ANALYZEの必要性
& VACUUMの落とし穴
2.
• 深尾 もとのぶ(フリーランス) •
AWS歴:9ヶ月(2014年3月~) • 得意分野:シェルスクリプト • 好きなAWS:Redshift
3.
ビッグデータをSQLで 簡単かつ高速に処理できるDB
4.
S3 Redshift S3
psqlコマンドサマリー 広告配信の集計システム MySQL AP Relay バッチサーバ
5.
Web広告の集計 • 表示回数,
クリック, 予算 • データ量:5,000件/秒以上 • 集計間隔:1分 • 集計所要時間:10秒
6.
事例1 A N
A LY Z E を実行していない
7.
ANALYZEとは? ANALYZE クエリプランナーで使用するテーブル統計を更新します。
分布状況やサイズによって SQLのクエリプランを最適化
8.
A N A
LY Z E を実行しないと 何が起きたの?
9.
集計処理を軽くしたはずが 逆に極端に重くなった
10.
総データ量 集計所要時間 利用データ量
11.
TIMESTAMP (SORTKEY) UID
10/31 23:55 abc 10/31 23:56 def 10/31 23:57 ghi 10/31 23:58 jkl 10/31 23:59 mno 11/1 0:00 pqr 11/1 0:01 stu 11/1 0:02 vwx 11/1 0:03 yz SELECT UID FROM <TABLE> WHERE <SORTKEY> >= ’11/1 0:00’ 10/31以前のデータを スキップしてI/Oを削減
12.
軽くなるはずが・・・ クエリの実行時間が30 倍
40秒1200秒 クエリ実行中の ストレージ使用率2倍 メモリの大量消費?
13.
原因 ANALYZEを実行しておらず テーブル統計が実際と乖離
テーブル統計が更新されるのは ANALYZE
14.
psql (8.4.20, server
8.0.2) WARNING: psql version 8.4, server version 8.0. Some psql features might not work. SSL connection (cipher: ECDHE-RSA-AES256-SHA, bits: 256) Type "help" for help. dmt01=> dmt01=> dmt01=> ANALYZE; テーブル統計を更新
15.
クエリの所要時間 40 秒
秒 1200 10 秒 初期状態 対象絞り込み ANALYZE後
16.
教訓 定期的にA N
A LY Z E で テーブル統計を更新する
17.
事例2 D E
L E T E 後のV A C U U M
18.
VACUUMとは? VACUUM 行のスペースの再利用や行の再ソートを行います。
•データ削除後の解放 •SORTKEYによるソート (差分ソートと全ソート)
19.
ソートは2種類 •通常は差分ソート •
DELETE後は全ソート
20.
通常は差分ソート 古い新しい ソート済み
VACUUM実行 ソート済み 未ソート 未ソート VACUUM実行 ソート済み 追加 追加
21.
DELETE後は全ソート 古い新しい ソート済み
DELETE実行 ソート対象 VACUUM実行 削除 未解放 解放+全ソート 解放済ソート済み
22.
その結果、 DELETE後に残ったのデータの 7
ソートに 時間
23.
DELETE後の全ソートを 避けることはできない DELETE
ONLYやSORT ONLYを使えば 解放とソートを区別することはできるが 差分ソートと全ソートを 区別して実行することはできない。
24.
どうやって古いデータを 削除するの?
25.
時系列テーブルの DROPまたはTRUNCATE
26.
時系列テーブルとは? 時系列テーブルの使用 データの保存期間が固定されている場合、時系列テーブルの順序でデータを整理することを
お勧めします。各テーブルは同じであっても、異なる時間範囲のデータが含まれるようにします。 該当するテーブルで DROP TABLE を実行することで古いデータを簡単に削除できます。大規模な DELETE を実行するよりもはるかに高速であり、その後、VACUUM を実行して領域を再利用する 必要がありません。UNION ALL ビューを作成し、データが異なるテーブルに保存されているとい う事実を隠すことができます。古いデータを削除するとき、UNION ALL ビューを微調整し、ドロ ップしたテーブルを削除します。同様に、新しい期間を新しいテーブルにロードするとき、新しい テーブルをこのビューに追加します。
27.
時系列テーブルとは? UNION ALL
ビュー 1月2月3月4月 5月6月7月 9月10月11月 8月 12月
28.
教訓 定期的に古いデータを 削除するなら時系列テーブル
30.
Let’s try Redshift
Thank you for your attention.
Download