Upload
Download free for 30 days
Login
Submit Search
BigQuery ML for unstructured data
0 likes
50 views
幸
幸太朗 岩澤
機械学習の社会実装勉強会 第15回の発表内容です。 オブジェクトテーブルという新しい仕組みを使ってBigQuery ML で画像データを推論することができるようになりました。
Technology
Read more
1 of 14
Download now
Download to read offline
1
2
3
4
5
6
7
8
9
10
11
12
13
14
More Related Content
PDF
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
日本マイクロソフト株式会社
PDF
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
Google Cloud Platform - Japan
PPTX
Microsoft Ignite Fall 2021 Data Platform Update Topics
Microsoft
PDF
Google Big Query
Ryuji Tamagawa
PDF
Big Data Architecture 全体概要
Knowledge & Experience
PDF
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Hideo Takagi
PPTX
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Insight Technology, Inc.
PDF
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
Techon Organization
【de:code 2020】 Azure Synapse Analytics 技術編 ~ 最新の統合分析プラットフォームによる新しい価値の創出(前編)
日本マイクロソフト株式会社
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
Google Cloud Platform - Japan
Microsoft Ignite Fall 2021 Data Platform Update Topics
Microsoft
Google Big Query
Ryuji Tamagawa
Big Data Architecture 全体概要
Knowledge & Experience
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Hideo Takagi
Attunityのソリューションと異種データベース・クラウド移行事例のご紹介
Insight Technology, Inc.
初めてのデータ分析基盤構築をまかされた、その時何を考えておくと良いのか
Techon Organization
Similar to BigQuery ML for unstructured data
(20)
PDF
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
Google Cloud Platform - Japan
PDF
Building 3D mobile apps using Power Apps Mixed Reality controls, Azure SQL Da...
Shotaro Suzuki
PDF
Two Dataflows
Yugo Shimizu
PPTX
Data x AI x API で考えるビジネスインフラ
Daiyu Hatakeyama
PPTX
Qlik_Tips_20250318_CrossProjectPipeline
QlikPresalesJapan
PPTX
Html5j 8
Tatsuro Hisamori
PPTX
FutureTechNight_GoogleCloudデータ活用勉強会.pptx
shotamiyazaki6
PDF
Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版
IBM Analytics Japan
PDF
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
オラクルエンジニア通信
PDF
M06_DX を担うエンジニア向け Data & AI Analytics プラットフォームの最適解 ~ Azure Synapse 最新機能ご紹介 ~ ...
日本マイクロソフト株式会社
PDF
Open Hybrid Cloudを検討すべき理由.pdf
Masahiko Umeno
PDF
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
Denodo
PPTX
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
Tetsutaro Watanabe
PDF
MonotaRO のデータ活用と基盤の過去、現在、未来
株式会社MonotaRO Tech Team
PPTX
02_3_20240611_Qlik Cloud データ統合 しっかり学ぶ勉強会 #2 - データパイプラインの作成「データの管理(簡単なデータ変換)」
QlikPresalesJapan
PDF
PostgreSQL最新動向 ~カラムナストアから生成AI連携まで~ (Open Source Conference 2025 Tokyo/Spring ...
NTT DATA Technology & Innovation
PDF
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
日本マイクロソフト株式会社
PDF
No-Ops で大量データ処理基盤を簡単に実現する
Kiyoshi Fukuda
PDF
No-Ops で大量データ処理基盤
Google Cloud Platform - Japan
PPTX
Microsoft Ignite 2019 最新アップデート - Azure Big Data Services を俯瞰的に眺める
Daiyu Hatakeyama
[Cloud OnAir] 最新アップデート Google Cloud データ関連ソリューション 2020年5月14日 放送
Google Cloud Platform - Japan
Building 3D mobile apps using Power Apps Mixed Reality controls, Azure SQL Da...
Shotaro Suzuki
Two Dataflows
Yugo Shimizu
Data x AI x API で考えるビジネスインフラ
Daiyu Hatakeyama
Qlik_Tips_20250318_CrossProjectPipeline
QlikPresalesJapan
Html5j 8
Tatsuro Hisamori
FutureTechNight_GoogleCloudデータ活用勉強会.pptx
shotamiyazaki6
Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版
IBM Analytics Japan
[Oracle Innovation Summit Tokyo 2018] 水環境の持続を支えるクラウド型ICTプラットフォーム「Water Busine...
オラクルエンジニア通信
M06_DX を担うエンジニア向け Data & AI Analytics プラットフォームの最適解 ~ Azure Synapse 最新機能ご紹介 ~ ...
日本マイクロソフト株式会社
Open Hybrid Cloudを検討すべき理由.pdf
Masahiko Umeno
データ仮想化を活用したデータ分析のフローと分析モデル作成の自動化のご紹介
Denodo
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
Tetsutaro Watanabe
MonotaRO のデータ活用と基盤の過去、現在、未来
株式会社MonotaRO Tech Team
02_3_20240611_Qlik Cloud データ統合 しっかり学ぶ勉強会 #2 - データパイプラインの作成「データの管理(簡単なデータ変換)」
QlikPresalesJapan
PostgreSQL最新動向 ~カラムナストアから生成AI連携まで~ (Open Source Conference 2025 Tokyo/Spring ...
NTT DATA Technology & Innovation
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
日本マイクロソフト株式会社
No-Ops で大量データ処理基盤を簡単に実現する
Kiyoshi Fukuda
No-Ops で大量データ処理基盤
Google Cloud Platform - Japan
Microsoft Ignite 2019 最新アップデート - Azure Big Data Services を俯瞰的に眺める
Daiyu Hatakeyama
More from 幸太朗 岩澤
(14)
PDF
15. Transformerを用いた言語処理技術の発展.pdf
幸太朗 岩澤
PDF
14. BigQuery ML を用いた多変量時系列データの解析.pdf
幸太朗 岩澤
PDF
12. Diffusion Model の数学的基礎.pdf
幸太朗 岩澤
PDF
行列分解の数学的基礎.pdf
幸太朗 岩澤
PDF
BigQuery MLの行列分解モデルを 用いた推薦システムの基礎
幸太朗 岩澤
PDF
Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)
幸太朗 岩澤
PDF
Vertex AI Pipelinesで BigQuery MLのワークフローを管理
幸太朗 岩澤
PDF
7. Vertex AI Model Registryで BigQuery MLのモデルを管理する
幸太朗 岩澤
PDF
6. Vertex AI Workbench による Notebook 環境.pdf
幸太朗 岩澤
PDF
5. Big Query Explainable AIの紹介
幸太朗 岩澤
PDF
4. CycleGANの画像変換と現代美術への応用
幸太朗 岩澤
PDF
3. Vertex AIを用いた時系列データの解析
幸太朗 岩澤
PDF
2. BigQuery ML を用いた時系列データの解析 (ARIMA model)
幸太朗 岩澤
PDF
1. BigQueryを中心にした ML datapipelineの概要
幸太朗 岩澤
15. Transformerを用いた言語処理技術の発展.pdf
幸太朗 岩澤
14. BigQuery ML を用いた多変量時系列データの解析.pdf
幸太朗 岩澤
12. Diffusion Model の数学的基礎.pdf
幸太朗 岩澤
行列分解の数学的基礎.pdf
幸太朗 岩澤
BigQuery MLの行列分解モデルを 用いた推薦システムの基礎
幸太朗 岩澤
Vertex AI Pipelinesで BigQuery MLのワークフローを管理 (ETL ~ デプロイまで)
幸太朗 岩澤
Vertex AI Pipelinesで BigQuery MLのワークフローを管理
幸太朗 岩澤
7. Vertex AI Model Registryで BigQuery MLのモデルを管理する
幸太朗 岩澤
6. Vertex AI Workbench による Notebook 環境.pdf
幸太朗 岩澤
5. Big Query Explainable AIの紹介
幸太朗 岩澤
4. CycleGANの画像変換と現代美術への応用
幸太朗 岩澤
3. Vertex AIを用いた時系列データの解析
幸太朗 岩澤
2. BigQuery ML を用いた時系列データの解析 (ARIMA model)
幸太朗 岩澤
1. BigQueryを中心にした ML datapipelineの概要
幸太朗 岩澤
BigQuery ML for unstructured data
1.
BigQuery MLによる画像推論 2022/12/31 機械学習の社会実装勉強会第18
回 岩澤 幸太朗
2.
➢ BigQuery MLで非構造化データの推論が可能に
(インポートしたTensorFlowモデルを使用) ➢ 2022/10よりプレビュー → 2022/12 時点では画像データのみ ○ 音声・動画・テキストなどは今後対応予定 今回の内容 Structured Data Semi-structured Data Unstructured Data
3.
➢ GCPの DataWarehouse
サービス (AWSにおけるRedshift) ➢ GCPのデータパイプラインの中核 ➢ Compute, Storage, Memory が分離し自動スケーリング ➢ 日々機能アップデート(他クラウドサービスとの連携強化等) SQLで巨大なデータを管理、操作するプラットフォーム 対象: 構造化/半構造化/非構造化 データ オブジェクトテーブルにより分析可能に (2022/10) BigQuery
4.
Tutorial: https://codelabs.developers.google.com/codelabs/bqml-intro#0 利用できるモデル: https://cloud.google.com/bigquery-ml/docs/bigqueryml-intro#supported_models_in 概要: https://cloud.google.com/bigquery-ml/docs/bigqueryml-intro ➢ SQLのみで前処理、学習、予測が可能 ➢ 作成済みTensorFlowモデルのインポートも可能 ➢
Vertex AI との連携により効果的な運用が可能 ○ 【第12回】Vertex AI Pipelinesで BigQuery MLのワークフローを管理(ETL ~ デプロイまで) ○ 【第10回】Vertex AI Model Registryで BigQuery MLのモデルを管理する ○ 【第9回】Vertex AI Workbench による Notebook 環境 BigQuery ML
5.
➢ Next ‘22
にて発表 ➢ Google Cloud Storage上の非構造化データを参照する外部テーブル ○ BigQuery MLによる推論実行 (2022/12時点では画像のみ) ○ リモート関数で分析実行 ● オブジェクトテーブルの例(列:オブジェクトのメタデータ) オブジェクトテーブル
6.
オブジェクトテーブルのスキーマ
7.
プレビュー申し込み 機能紹介ページ下部より申し込み
8.
➢ CLOUD_RESOURCE 接続の作成 オブジェクト
テーブルの概要 https://cloud.google.com/bigquery/docs/object-table-introduction?hl=ja オブジェクト テーブルを作成する https://cloud.google.com/bigquery/docs/object-tables?hl=ja ➢ 接続のサービスアカウントにCloud Storage へのアクセス権限を付与 オブジェクトテーブルの作成 1
9.
オブジェクトテーブルの作成 2 ※プレビュー申し込み中のため、実行不可
10.
➢ TensorFlowモデルを Google
Cloud Storage にアップロード ○ TensorFlow Hub https://tfhub.dev/ ○ 独自モデル ➢ アップロードしたモデルを BigQuery ML に読み込む 画像オブジェクト テーブルでの推論の実行 https://cloud.google.com/bigquery/docs/object-table-inference?hl=ja チュートリアル: 分類モデルを使用してオブジェクト テーブルで推論を実行する https://cloud.google.com/bigquery/docs/inference-tutorial-resnet?hl=ja BigQuery ML による推論 1 制限事項 https://cloud.google.com/bigquery/docs/object-table-inference? hl=ja#limitations
11.
➢ オブジェクト テーブルを
ML.PREDICT 関数への入力として使用 BigQuery ML による推論 2
12.
Demo プレビュー中で申請が間に合わなかったため 次回以降
13.
- オブジェクトテーブルを用いてGCS上の非構造化データを参照することができる - インポートしたTensorFlow
モデルでBigQuery ML による推論が可能 まとめ
14.
【新機能】BigQueryのオブジェクト テーブルを使ってみる(プレビュー) https://dev.classmethod.jp/articles/bq-new-object-tables/ データと AI
の統合により BigQuery に非構造化データ分析を提供する https://cloud.google.com/blog/ja/products/data-analytics/how-to-manage-and-process-unstructured-data-in-bigquery BigQuery リモート関数でCloud Translation API を使ってテキスト翻訳してみた https://dev.classmethod.jp/articles/bigquery-remote-function-with-cloud-translation-api/ 参考資料
Download