BigQuery MLによる画像推論
2022/12/31 機械学習の社会実装勉強会第18 回
岩澤 幸太朗
➢ BigQuery MLで非構造化データの推論が可能に (インポートしたTensorFlowモデルを使用)
➢ 2022/10よりプレビュー → 2022/12 時点では画像データのみ
○ 音声・動画・テキストなどは今後対応予定
今回の内容
Structured Data Semi-structured Data Unstructured Data
➢ GCPの DataWarehouse サービス (AWSにおけるRedshift)
➢ GCPのデータパイプラインの中核
➢ Compute, Storage, Memory が分離し自動スケーリング
➢ 日々機能アップデート(他クラウドサービスとの連携強化等)
SQLで巨大なデータを管理、操作するプラットフォーム
対象: 構造化/半構造化/非構造化 データ
オブジェクトテーブルにより分析可能に (2022/10)
BigQuery
Tutorial:
https://codelabs.developers.google.com/codelabs/bqml-intro#0
利用できるモデル:
https://cloud.google.com/bigquery-ml/docs/bigqueryml-intro#supported_models_in
概要:
https://cloud.google.com/bigquery-ml/docs/bigqueryml-intro
➢ SQLのみで前処理、学習、予測が可能
➢ 作成済みTensorFlowモデルのインポートも可能
➢ Vertex AI との連携により効果的な運用が可能
○ 【第12回】Vertex AI Pipelinesで BigQuery MLのワークフローを管理(ETL ~ デプロイまで)
○ 【第10回】Vertex AI Model Registryで BigQuery MLのモデルを管理する
○ 【第9回】Vertex AI Workbench による Notebook 環境
BigQuery ML
➢ Next ‘22 にて発表
➢ Google Cloud Storage上の非構造化データを参照する外部テーブル
○ BigQuery MLによる推論実行 (2022/12時点では画像のみ)
○ リモート関数で分析実行
● オブジェクトテーブルの例(列:オブジェクトのメタデータ)
オブジェクトテーブル
オブジェクトテーブルのスキーマ
プレビュー申し込み
機能紹介ページ下部より申し込み
➢ CLOUD_RESOURCE 接続の作成
オブジェクト テーブルの概要
https://cloud.google.com/bigquery/docs/object-table-introduction?hl=ja
オブジェクト テーブルを作成する
https://cloud.google.com/bigquery/docs/object-tables?hl=ja
➢ 接続のサービスアカウントにCloud
Storage へのアクセス権限を付与
オブジェクトテーブルの作成 1
オブジェクトテーブルの作成 2
※プレビュー申し込み中のため、実行不可
➢ TensorFlowモデルを Google Cloud Storage にアップロード
○ TensorFlow Hub https://tfhub.dev/
○ 独自モデル
➢ アップロードしたモデルを BigQuery ML に読み込む
画像オブジェクト テーブルでの推論の実行
https://cloud.google.com/bigquery/docs/object-table-inference?hl=ja
チュートリアル: 分類モデルを使用してオブジェクト テーブルで推論を実行する
https://cloud.google.com/bigquery/docs/inference-tutorial-resnet?hl=ja
BigQuery ML による推論 1
制限事項
https://cloud.google.com/bigquery/docs/object-table-inference?
hl=ja#limitations
➢ オブジェクト テーブルを ML.PREDICT 関数への入力として使用
BigQuery ML による推論 2
Demo
プレビュー中で申請が間に合わなかったため
次回以降
- オブジェクトテーブルを用いてGCS上の非構造化データを参照することができる
- インポートしたTensorFlow モデルでBigQuery ML による推論が可能
まとめ
【新機能】BigQueryのオブジェクト テーブルを使ってみる(プレビュー)
https://dev.classmethod.jp/articles/bq-new-object-tables/
データと AI の統合により BigQuery に非構造化データ分析を提供する
https://cloud.google.com/blog/ja/products/data-analytics/how-to-manage-and-process-unstructured-data-in-bigquery
BigQuery リモート関数でCloud Translation API を使ってテキスト翻訳してみた
https://dev.classmethod.jp/articles/bigquery-remote-function-with-cloud-translation-api/
参考資料

More Related Content

PDF
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
PDF
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
PPTX
Microsoft Ignite Fall 2021 Data Platform Update Topics
PDF
Google Big Query
PDF
Big Data Architecture 全体概要
PDF
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
PPTX
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
PDF
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
Microsoft Ignite Fall 2021 Data Platform Update Topics
Google Big Query
Big Data Architecture 全体概要
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか

Similar to BigQuery ML for unstructured data (20)

PDF
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
PDF
Building 3D mobile apps using Power Apps Mixed Reality controls, Azure SQL Da...
PDF
Two Dataflows
PPTX
Data x AI x API で考えるビジネスインフラ
PPTX
Qlik_Tips_20250318_CrossProjectPipeline
PPTX
PPTX
FutureTechNight_GoogleCloudデータ活用勉強会.pptx
PDF
Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版
PDF
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
PDF
M06_DX を担うエンジニア向け Data & AI Analytics プラットフォームの最適解 ~ Azure Synapse 最新機能ご紹介 ~ ...
PDF
Open Hybrid Cloudを検討すべき理由.pdf
PDF
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
PPTX
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
PDF
MonotaRO のデータ活用と基盤の過去、現在、未来
PPTX
02_3_20240611_Qlik Cloud データ統合 しっかり学ぶ勉強会 #2 - データパイプラインの作成「データの管理(簡単なデータ変換)」
PDF
PostgreSQL最新動向 ~カラムナストアから生成AI連携まで~ (Open Source Conference 2025 Tokyo/Spring ...
PDF
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
PDF
No-Ops で大量データ処理基盤を簡単に実現する
PDF
No-Ops で大量データ処理基盤
PPTX
Microsoft Ignite 2019 最新アップデート - Azure Big Data Services を俯瞰的に眺める
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
Building 3D mobile apps using Power Apps Mixed Reality controls, Azure SQL Da...
Two Dataflows
Data x AI x API で考えるビジネスインフラ
Qlik_Tips_20250318_CrossProjectPipeline
FutureTechNight_GoogleCloudデータ活用勉強会.pptx
Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
M06_DX を担うエンジニア向け Data & AI Analytics プラットフォームの最適解 ~ Azure Synapse 最新機能ご紹介 ~ ...
Open Hybrid Cloudを検討すべき理由.pdf
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
MonotaRO のデータ活用と基盤の過去、現在、未来
02_3_20240611_Qlik Cloud データ統合 しっかり学ぶ勉強会 #2 - データパイプラインの作成「データの管理(簡単なデータ変換)」
PostgreSQL最新動向 ~カラムナストアから生成AI連携まで~ (Open Source Conference 2025 Tokyo/Spring ...
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
No-Ops で大量データ処理基盤を簡単に実現する
No-Ops で大量データ処理基盤
Microsoft Ignite 2019 最新アップデート - Azure Big Data Services を俯瞰的に眺める

More from 幸太朗 岩澤 (14)

PDF
15. Transformerを用いた言語処理技術の発展.pdf
PDF
14. BigQuery ML を用いた多変量時系列データの解析.pdf
PDF
12. Diffusion Model の数学的基礎.pdf
PDF
行列分解の数学的基礎.pdf
PDF
BigQuery MLの行列分解モデルを 用いた推薦システムの基礎
PDF
Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)
PDF
Vertex AI Pipelinesで BigQuery MLのワークフローを管理
PDF
7. Vertex AI Model Registryで BigQuery MLのモデルを管理する
PDF
6. Vertex AI Workbench による Notebook 環境.pdf
PDF
5. Big Query Explainable AIの紹介
PDF
4. CycleGANの画像変換と現代美術への応用
PDF
3. Vertex AIを用いた時系列データの解析
PDF
2. BigQuery ML を用いた時系列データの解析 (ARIMA model)
PDF
1. BigQueryを中心にした ML datapipelineの概要
15. Transformerを用いた言語処理技術の発展.pdf
14. BigQuery ML を用いた多変量時系列データの解析.pdf
12. Diffusion Model の数学的基礎.pdf
行列分解の数学的基礎.pdf
BigQuery MLの行列分解モデルを 用いた推薦システムの基礎
Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)
Vertex AI Pipelinesで BigQuery MLのワークフローを管理
7. Vertex AI Model Registryで BigQuery MLのモデルを管理する
6. Vertex AI Workbench による Notebook 環境.pdf
5. Big Query Explainable AIの紹介
4. CycleGANの画像変換と現代美術への応用
3. Vertex AIを用いた時系列データの解析
2. BigQuery ML を用いた時系列データの解析 (ARIMA model)
1. BigQueryを中心にした ML datapipelineの概要

BigQuery ML for unstructured data