Submit Search
Google BigQueryを使ってみた!
43 likes
13,547 views
Yusuke Wada
PerlCasual #06 2014/10/24 Yusuke Wada a.k.a. yusukebe
Technology
Read more
1 of 39
Download now
Downloaded 30 times
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
More Related Content
PDF
Google Analytics のデータ分析ハンズオン
Kenichi Tatsuhama
PDF
Android 開発の昔と今
Kenichi Tatsuhama
PDF
AdTruthが生み出すGoogle アナリティクス プレミアムの新しい活用方法 第1部
Sumio Ebisawa
PPTX
「デジタルマーケティングプラットホーム」 に進化するGoogle アナリティクス
Sumio Ebisawa
PDF
これでBigQueryをドヤ顔で語れる!BigQueryの基本
Tomohiro Shinden
PDF
BigQueryの課金、節約しませんか
Ryuji Tamagawa
PDF
SQLおじさん(自称)がBigQueryのStandard SQLを使ってみた
Kumano Ryo
PDF
Perlcasual#6_2014-10-24
akihiro_0228
Google Analytics のデータ分析ハンズオン
Kenichi Tatsuhama
Android 開発の昔と今
Kenichi Tatsuhama
AdTruthが生み出すGoogle アナリティクス プレミアムの新しい活用方法 第1部
Sumio Ebisawa
「デジタルマーケティングプラットホーム」 に進化するGoogle アナリティクス
Sumio Ebisawa
これでBigQueryをドヤ顔で語れる!BigQueryの基本
Tomohiro Shinden
BigQueryの課金、節約しませんか
Ryuji Tamagawa
SQLおじさん(自称)がBigQueryのStandard SQLを使ってみた
Kumano Ryo
Perlcasual#6_2014-10-24
akihiro_0228
Viewers also liked
(19)
PDF
HTTP2Study chronicle #http2conf
Jxck Jxck
PDF
Google big query × Amazon redshift
Fumihide Nario
PDF
Ansvar Community Insurance Proposal
Statewide Insurance Brokers
PPT
企画案
Shinichiro Aska
PDF
How To Select Best Transmission For Your Vehicle
Dreamcars Auto Repair
DOCX
The Test, Gillie, Gettysburg, 4 JUL 2014
David R. Gillie
PDF
福岡商工会議所講演会(2017年2月17日)
隆志 柳瀬
PDF
AIG Corporate Travel PDS
Statewide Insurance Brokers
PDF
TreeFrog Frameworkの紹介
ao27
PDF
ホームセンターにある画像をVision apiで分析してみた話
Wasaburo Miyata
PDF
BigQuery case study in Groovenauts & Dive into the DataflowJavaSDK
nagachika t
PDF
Ruby Kaja のご提案
nagachika t
PDF
オプショナル型。 〜 なんとなく付ける ! ? 撲滅
Tomoki Hasegawa
PDF
App engine admin apiを利用したgae%2 f go環境へのデプロイとgcp東京リージョンの性能評価
Kumano Ryo
PDF
Gceハンズオン20150411イン福岡
Ryosuke Akahoshi
PDF
Distributed Deep Q-Learning
Lyft
PDF
Firebase によるリアルタイム モバイル開発 @gcpug 福岡
Google Cloud Platform - Japan
PDF
Inspection of CloudML Hyper Parameter Tuning
nagachika t
PDF
Webサービスのコンテンツパターン 或いはデータの活⽤
Yusuke Wada
HTTP2Study chronicle #http2conf
Jxck Jxck
Google big query × Amazon redshift
Fumihide Nario
Ansvar Community Insurance Proposal
Statewide Insurance Brokers
企画案
Shinichiro Aska
How To Select Best Transmission For Your Vehicle
Dreamcars Auto Repair
The Test, Gillie, Gettysburg, 4 JUL 2014
David R. Gillie
福岡商工会議所講演会(2017年2月17日)
隆志 柳瀬
AIG Corporate Travel PDS
Statewide Insurance Brokers
TreeFrog Frameworkの紹介
ao27
ホームセンターにある画像をVision apiで分析してみた話
Wasaburo Miyata
BigQuery case study in Groovenauts & Dive into the DataflowJavaSDK
nagachika t
Ruby Kaja のご提案
nagachika t
オプショナル型。 〜 なんとなく付ける ! ? 撲滅
Tomoki Hasegawa
App engine admin apiを利用したgae%2 f go環境へのデプロイとgcp東京リージョンの性能評価
Kumano Ryo
Gceハンズオン20150411イン福岡
Ryosuke Akahoshi
Distributed Deep Q-Learning
Lyft
Firebase によるリアルタイム モバイル開発 @gcpug 福岡
Google Cloud Platform - Japan
Inspection of CloudML Hyper Parameter Tuning
nagachika t
Webサービスのコンテンツパターン 或いはデータの活⽤
Yusuke Wada
Ad
Similar to Google BigQueryを使ってみた!
(9)
PPTX
「チーム開発実践入門」勉強会
Yu Ishikawa
PDF
GoogleAnalytics Tools クックブック
Takashi Sudou
PPTX
Backlog事例と情報を残す活動。jbug広島#14 〜1人で解けないパズルは皆で解こうの会〜
uetanitakahiro
PDF
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
Techon Organization
PDF
20200629 データベース基礎~データベースの扱いとデータ設計~
Hikaru Tanaka
PDF
Qgis2.18 基礎編
Jyun Tanaka
PPTX
DMTC 2nd プレゼンテーション
真悟 平山
PPTX
企業等に蓄積されたデータを分析するための処理機能の提案
Toshiyuki Shimono
PDF
10+1 Things you should know about JavaScript testing
Takuto Wada
「チーム開発実践入門」勉強会
Yu Ishikawa
GoogleAnalytics Tools クックブック
Takashi Sudou
Backlog事例と情報を残す活動。jbug広島#14 〜1人で解けないパズルは皆で解こうの会〜
uetanitakahiro
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
Techon Organization
20200629 データベース基礎~データベースの扱いとデータ設計~
Hikaru Tanaka
Qgis2.18 基礎編
Jyun Tanaka
DMTC 2nd プレゼンテーション
真悟 平山
企業等に蓄積されたデータを分析するための処理機能の提案
Toshiyuki Shimono
10+1 Things you should know about JavaScript testing
Takuto Wada
Ad
More from Yusuke Wada
(20)
PDF
僕がつくった 70個のうちの48個のWebサービス達
Yusuke Wada
PDF
スッとGoを取り入れる
Yusuke Wada
PDF
東京脱出計画中
Yusuke Wada
PDF
Extreme remote working
Yusuke Wada
PDF
Podcastを支える技術、エンジニアのためのWebメディア、そしてCPAN
Yusuke Wada
PDF
創造のプロセスを回せ!v0.01
Yusuke Wada
PDF
It's not only about "REMOTE"
Yusuke Wada
PDF
事故からはじまるスケールチャンス
Yusuke Wada
PDF
とある Perl Monger の働き方
Yusuke Wada
PDF
5 minutes - YAPC::Asia Tokyo 2014
Yusuke Wada
PDF
Podcastをカジュアルに 支える技術
Yusuke Wada
PDF
The master plan ofscaling a web application
Yusuke Wada
PDF
そのWebサービスは本当に「あたりまえ」だったのか?
Yusuke Wada
PDF
Mojoliciousでつくる! Webアプリ入門
Yusuke Wada
PDF
10 things to learn from Bokete
Yusuke Wada
PDF
Inside Bokete: Web Application with Mojolicious and others
Yusuke Wada
PDF
僕らの履歴書
Yusuke Wada
PDF
僕らがWebサービスをつくる5つの理由
Yusuke Wada
PDF
僕らがつくるための 「5W」について
Yusuke Wada
PDF
「Webサービスのつくり方」 のつくり方
Yusuke Wada
僕がつくった 70個のうちの48個のWebサービス達
Yusuke Wada
スッとGoを取り入れる
Yusuke Wada
東京脱出計画中
Yusuke Wada
Extreme remote working
Yusuke Wada
Podcastを支える技術、エンジニアのためのWebメディア、そしてCPAN
Yusuke Wada
創造のプロセスを回せ!v0.01
Yusuke Wada
It's not only about "REMOTE"
Yusuke Wada
事故からはじまるスケールチャンス
Yusuke Wada
とある Perl Monger の働き方
Yusuke Wada
5 minutes - YAPC::Asia Tokyo 2014
Yusuke Wada
Podcastをカジュアルに 支える技術
Yusuke Wada
The master plan ofscaling a web application
Yusuke Wada
そのWebサービスは本当に「あたりまえ」だったのか?
Yusuke Wada
Mojoliciousでつくる! Webアプリ入門
Yusuke Wada
10 things to learn from Bokete
Yusuke Wada
Inside Bokete: Web Application with Mojolicious and others
Yusuke Wada
僕らの履歴書
Yusuke Wada
僕らがWebサービスをつくる5つの理由
Yusuke Wada
僕らがつくるための 「5W」について
Yusuke Wada
「Webサービスのつくり方」 のつくり方
Yusuke Wada
Google BigQueryを使ってみた!
1.
Google BigQueryを つかってみた!
PerlCasual#06 2014/10/24 Yusuke Wada a.k.a. yusukebe
2.
2つの問題意識
3.
1. 開発サイドから •
例えばアクセスログが膨らんで活用できない 1.サイズが大きい 2.分散されている 3.量が多いので解析するのが難しい • 何か困った時に過去のログが使えない... 大きなログを簡単に追いたい!
4.
2. ビジネスサイドから •
例えば行動ログ的な細かい指標が無い 1.データベース上の静的な情報のみ 2.Google Analyticsは非常に優秀だが... 3.ユーザーに紐付く情報を解析したい 指定したログを貯めてディレクターの人 でも解析・分析でできるようにしたい!
5.
と、その時... 巷でビッグクエリーという言葉を 聞くようになる...
6.
とか!
7.
Google BigQueryは巨大なデータを様々 なフォーマットで放り込めてSQLライ
クなクエリで問い合わせが可能でチョー 高速!120億レコードに対するクエリ を5秒でフルスキャン!ステキー しか も利用料も安いと来たもんだっ!
8.
ってことで Google BigQueryを使ってみた話+α
9.
データを用意する 業務で使っているログの場合 •
RPCへのアクセス+ユーザー識別子 • 一旦JSON形式でファイルへ書き出す • 集約サーバーに投げる • fluent-plugin-bigquery で BigQuery へ挿入
10.
Google BigQuery 集約サーバ
APIサーバAPIサーバAPIサーバ
11.
データを用意する デモのためにTwitter APIを利用する
• Streaming APIの「statuses/sample」を利用 • publicなツィートのほんの一部を取得可能 • fluent-plugin-twitter で簡単に • 最後はやはり fluent-plugin-bigquery を使う
12.
Google BigQuery Tweet収集サーバ
13.
スキーマは必要
15.
Google BigQueryは ブラウザから色々できる
16.
例えば... • BigQuery
Browser Tool (後述) • Googleアカウントベースで権限の追加 • 利用状況の確認 • APIクライアントの作成や削除 • APIリクエストのモニタリング • 課金の管理 フルマネージドで便利!
17.
独自のSQLで問い合わせる https://cloud.google.com/bigquery/query-reference
18.
ここで BigQuery Browser
Tool 登場
19.
SELECT COUNT(*) AS
tweet_count FROM [twitter-stream-sample:twitter.tweet] ちなみに10月18日(土)から収集開始
20.
22,289,497件 / 7.5秒
21.
Browser Toolで出来ること •
Queryの実行と結果を表形式で見る • Queryの保存とロード • CSV形式での結果のダウンロード • 新しいテーブルやDataSetの作成など 必要最小限の機能が揃っている さらにBigQuery Connector for Excelを使えばExcelとの連動も可能
22.
例えばディレクターが新しい KPIを図るためにQueryを 構築することも考えられる
23.
以上 Google BigQuery
を使ってみた話終わり One More Thing
24.
今作ってるモノ BigView For
Visualizing Google BigQuery • 元々業務でBigQueryの結果を可視化するため • Browser Toolのある種拡張 • BigQueryのThird-partyサービスは複雑で高価 • 目指すところはKibanaっぽいところ?
26.
BigViewで出来ること • Googleアカウントでのログイン
• 権限を持つプロジェクトへのクエリの実行 • とある条件下での結果のチャート表示 • Pieチャート • Lineチャート • クエリの保存 (未実装)
27.
BigViewを使ってみる
29.
1時間ごとのツイート数 をグラフにしてみる
30.
SELECT USEC_TO_TIMESTAMP((UTC_USEC_TO_HOUR(created_at))) AS
time, COUNT(*) AS tweet_count FROM [twitter-stream-sample:twitter.tweet] GROUP BY time ORDER BY time
32.
この辺はデータが欠落してます><
33.
ユーザーの使用言語の割合を チャートにしてみる
34.
SELECT user_lang, COUNT(user_lang)
AS lang_count FROM [twitter-stream-sample:twitter.tweet] GROUP BY user_lang ORDER BY lang_count DESC
37.
何らかのライセンスで パブリックに使ってもらう かもしれません!
38.
まとめ
39.
• Google BigQueryはブラウザで色々できちゃって
楽だし安いそして早い/速い • 実装(連携?)はおおよそfluentdにお任せ • 活用できてないデータを活かすことが出来る • Browser ToolでディレクターがSQLを書く? • BigViewでシンプルなデータの視覚化を目指す • Googleの回し者ではないです ^^
Download