SlideShare a Scribd company logo
Googleが作ったDWH
BigQuery
宮田 和三郎
2017/08/31
2
自己紹介
2
宮田 和三郎
嘉穂無線ホールディングス:データ活用エンジニア
カホエンタープライズ:CTO
ソフトハウス→外資ベンダー→現職
3
BigQueryとは?
3
BigQuery は Google が提供するフルマネージドのエ
ンタープライズ向けアナリティクス データ ウェアハウス
です。
https://cloud.google.com/bigquery/?hl=ja
4
そもそもDWH(データウェアハウス)とは?
4
データウェアハウスとは、直訳すれば「データの倉庫」
である。 利用者により定義範囲は異なるが、一般に時
系列に整理された大量の統合業務データ、もしくはそ
の管理システムを指す。
https://ja.wikipedia.org/wiki/データウェアハウス
主な製品(オンプレ)
■ Exadata(Oracle)
■ PureData(IBM)
■ HANA(SAP)
■ Teradata(Teradata)
主な製品(クラウド)
■ Redshift(AWS)
■ Azure SQL Data
Warehouse(Microsoft)
■ Snowflake(Snowflake)
■ BigQuery(GCP)
5
用途
5
×不得意
■ 業務システム(OLTP)のバックエンド
■ webのバックエンド
■ ゲームのバックエンド
〇得意
■ ログ解析(アクセス、エラー、操作・・)
■ 大量データのバッチ処理
■ 分析(Window関数、UDF)
6
とにかく速い!
■ 億を超えるレコード数でも数秒で処理
1TBのデータを1秒でフルスキャンにするには5,000台のディスクが必要
なぜBigQueryはこんなインチキ臭いほどに高速なのか。BigQueryは、Cloudera Impara等のいまどき
の大規模並列(Massively Parallel Processing/MPP)クエリエンジンや過去のデータウェアハウスマシ
ンと同じくカラム型のデータ分析専用データベースである。しかし、他の多くのカラム型DBとBigQuery
との間には量子的飛躍が存在する。それは、並列度のオーダーだ。BigQueryでは、ひとつひとつのク
エリを実行するたびに数百台〜数千台のマシンが同時並列に検索を実行している(←ケタ間違えてい
ません)。文字通り、massivellyな並列処理だ。その上、インデックスは一切作らず、すべてディスクの
フルスキャン(テーブルスキャン)で処理する。
引用:http://qiita.com/kazunori279/items/10ac0066ac9b0b5aaaf3
7
とにかく楽!
■ 物理設計不要
☐ サイジング(CPU,メモリ,Disk)
☐ データ格納方法(分散+ソート)
☐ インデックス不要(パフォチュー不要)
■ フルマネージメント
☐ AnalyzeやVacuum系の処理不要
☐ さようならハードウェア障害!
☐ さようならディスク領域不足!
8
とにかく安い!
■ 料金体系は使っただけの従量課金
操作 コスト メモ
ストレージ GB あたり
$0.02/月
毎月 10 GB まで無料。詳細はストレージの料金体系をご覧ください。
長期保存 GB あたり
$0.01/月
長期保存の料金をご覧ください。
ストリーミング イン
サート
GB あたり
$0.05
ストレージの料金体系をご覧ください。
クエリ TB あたり $5 毎月 1 TB まで無料。詳細はオンデマンドの料金体系をご覧ください。 多くの容量をご使用のお客
様は定額料金もご利用いただけます。
データの読み込み 無料 BigQuery へのデータの読み込みをご覧ください。
データのコピー 無料 テーブルのコピーをご覧ください。
データのエクスポート 無料 BigQuery からのデータのエクスポートをご覧ください。
メタデータ オペレー
ション
無料 list、get、patch、update、delete の呼び出し。
17年08月現在
9
注意
■ SQLが2種類存在(Legacy or Standard)
→Standard(SQL:2011準拠)がオススメ
■ コストの見積が難しい。
→定額料金あるが、手が届かない。
→変な使い方をしない限り、まず問題ない
■ どんなクエリでも秒単位ではかかる。
→用途を間違えない。
■ パフォーマンスチューニング不可
→諦める。そもそも速い
■ DML(UPDATE/DELETE)実行回数制限あり
→設計で回避
1010
無料お試し!
1.無料トライアル枠あります
$300 の無料クレジットで、あらゆる GCP プロダクトをお試し
いただけます(最大12か月)。
https://cloud.google.com/free/?hl=ja
2.BigQuery無料枠あります
ストレージ:10GB/月、クエリ:1TB/月
https://cloud.google.com/bigquery/pricing?hl=ja
3.お試しデータあります
サンプルデータ:wikipedia全記事改定履歴など
一般公開データ:ニューヨーク市内のタクシー移動など
https://cloud.google.com/bigquery/sample-tables
https://cloud.google.com/bigquery/public-data/?hl=ja
11
ご清聴ありがとうございました
無料で遊べます。とりあえず遊んでみよう!

More Related Content

PDF
トレジャーデータとtableau実現する自動レポーティング
PDF
クラウドを活用した自由自在なデータ分析
PDF
これで怖くない!?大規模環境で体験するDB負荷対策~垂直から水平の彼方へ~
PPTX
dots. ビッグデータオールスターズ: Azure 畠山
PDF
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
PDF
データ分析基盤について
PDF
オープンデータ基盤としてのWindows Azure
PDF
ビッグデータ分析基盤を支えるOSSたち
トレジャーデータとtableau実現する自動レポーティング
クラウドを活用した自由自在なデータ分析
これで怖くない!?大規模環境で体験するDB負荷対策~垂直から水平の彼方へ~
dots. ビッグデータオールスターズ: Azure 畠山
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
データ分析基盤について
オープンデータ基盤としてのWindows Azure
ビッグデータ分析基盤を支えるOSSたち

What's hot (20)

PDF
Alteryxの紹介とデモ
PPTX
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
PDF
データ分析を支える技術 DWH再入門
PPTX
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
PDF
Tableau Desktop データ準備の新機能: ユニオン、ピボット、データインタープリタ、など
PPTX
データウェアハウス・BI の再構築から見る情報系基盤の再構築ポイント
PDF
Tableauが魅せる Data Visualization の世界
PDF
Gtfsデータリポジトリ紹介 iodd発表資料
PDF
Google Cloud ベストプラクティス:Google BigQuery 編 - 02 : データ処理 / クエリ / データ抽出
PDF
Developers Summit 2015 【19-B-L】 DevOpsの究極の形!?、クラウドで始めるドキュメント・データベース活用のポイント。
PDF
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
PDF
Azure Purview Linage for Dataflow/Spark
PDF
[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所
PDF
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
PDF
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
PDF
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
PPTX
Glue DataBrewでデータをクリーニング、加工してみよう
PDF
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語る
PDF
データ分析基盤構築のポイントと関連クラスメソッドサービスの紹介
PDF
データ分析基盤運⽤チームの 運⽤業務を改善してみた話
Alteryxの紹介とデモ
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
データ分析を支える技術 DWH再入門
データサイエンティストが力を発揮できるアジャイルデータ活用基盤
Tableau Desktop データ準備の新機能: ユニオン、ピボット、データインタープリタ、など
データウェアハウス・BI の再構築から見る情報系基盤の再構築ポイント
Tableauが魅せる Data Visualization の世界
Gtfsデータリポジトリ紹介 iodd発表資料
Google Cloud ベストプラクティス:Google BigQuery 編 - 02 : データ処理 / クエリ / データ抽出
Developers Summit 2015 【19-B-L】 DevOpsの究極の形!?、クラウドで始めるドキュメント・データベース活用のポイント。
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
Azure Purview Linage for Dataflow/Spark
[DI03] DWH スペシャリストが語る! Azure SQL Data Warehouse チューニングの勘所
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
Snowflake Architecture and Performance(db tech showcase Tokyo 2018)
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
Glue DataBrewでデータをクリーニング、加工してみよう
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語る
データ分析基盤構築のポイントと関連クラスメソッドサービスの紹介
データ分析基盤運⽤チームの 運⽤業務を改善してみた話
Ad

Viewers also liked (8)

PDF
Google Container Engine (GKE) & Kubernetes のアーキテクチャ解説
PDF
Microsoft azureで実装するwebserviceondocker
PPTX
はじめてのAzure Azure的ピタゴラスイッチのススメ- PaaS・サーバーレス 初級編 -
PDF
インフラエンジニアのこれまでとこれから
PDF
元OracleMasterPlatinumがCloudSpanner触ってみた
PPTX
RDBのDBAから見た GCP Managed Database
PDF
こわくない Git
PDF
インフラエンジニアってなんでしたっけ(仮)
Google Container Engine (GKE) & Kubernetes のアーキテクチャ解説
Microsoft azureで実装するwebserviceondocker
はじめてのAzure Azure的ピタゴラスイッチのススメ- PaaS・サーバーレス 初級編 -
インフラエンジニアのこれまでとこれから
元OracleMasterPlatinumがCloudSpanner触ってみた
RDBのDBAから見た GCP Managed Database
こわくない Git
インフラエンジニアってなんでしたっけ(仮)
Ad

Similar to 福岡クラウドUG-BigQuery (11)

PDF
D1-2-S07 オンプレミスのデータウェアハウス基盤を BigQuery へ
PDF
Cookpad TechConf 2016 - DWHに必要なこと
PDF
これでBigQueryをドヤ顔で語れる!BigQueryの基本
PPTX
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
PDF
マルチビッグデータの活用を支える DWHの作り方
PDF
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
PPTX
BigData Architecture for Azure
PDF
BigQueryを始めてみよう - Google Analytics データを活用する
PPTX
FutureTechNight_GoogleCloudデータ活用勉強会.pptx
PDF
BigQuery + Fluentd
PPTX
ビッグデータ処理データベースの全体像と使い分け
2018年version
D1-2-S07 オンプレミスのデータウェアハウス基盤を BigQuery へ
Cookpad TechConf 2016 - DWHに必要なこと
これでBigQueryをドヤ顔で語れる!BigQueryの基本
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
マルチビッグデータの活用を支える DWHの作り方
Hadoopビッグデータ基盤の歴史を振り返る #cwt2015
BigData Architecture for Azure
BigQueryを始めてみよう - Google Analytics データを活用する
FutureTechNight_GoogleCloudデータ活用勉強会.pptx
BigQuery + Fluentd
ビッグデータ処理データベースの全体像と使い分け
2018年version

Recently uploaded (9)

PDF
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
PDF
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
PDF
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
PDF
【QYResearch】グローバル磁性材料産業チェーンの構造分析と市場動向の詳細解説
PDF
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
PDF
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
PDF
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
PDF
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
PDF
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
【QYResearch】グローバル磁性材料産業チェーンの構造分析と市場動向の詳細解説
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略

福岡クラウドUG-BigQuery