SlideShare a Scribd company logo
Introduction to TFX Family
1. TFT
2. TFMA
3. TFDV
 上田隼也 @hurutoriya 2018/09/01
$ whoami
● 上田隼也 :: @hurutoriya
● キカイガクシュウエンジニア
● Machine Learning Casual Talks Co-Organizer
● https://shunyaueta.com/
機械学習システムの困難性
機械学習モデルができた後に立ちはだかる壁
引用 : Hidden Technical Debt in Machine Learning Systems (NIPS2015)
機械学習システムの困難性
● 継続的再学習 (Continuous Learning)
● システムに必ずヒトが介在する (Human-in-the-loop)
● データは不変の存在ではない (Data is mutable)
引用 : Hidden Technical Debt in Machine Learning Systems (NIPS2015)
機械学習システムコンポーネント
● データ収集→特徴量抽出→データ検証 (ETL)
● 各種ワークフロー管理
● 推論結果のサービング環境
● マシンリソース管理
● モデルの精度トラッキング
プロダクションレベルの機械学習システムとは?
● 最重要: Reliability + Scalability
○ Google が提唱する機械学習基盤の考え
○ TensorFlow Extend
● 機械学習システム各種ワークフロー
● 機械学習エンジニアとユーザーとして捉えた際に
何が必要案件なのかを洗い出してくれてる
KDD Link here, KDD Video here, Paper Link here, Author Demo Video here .
High-level component overview of a machine learning platform.
現在リリースされているTFXコンポーネント
1. TensorFlow Data Validation (TFDV)
2. TensorFlow Transformation (TFT)
3. TensorFlow Model Analysis (TFMA)
Apache Beam に依存しており、Python2.7環境が必須
TensorFlow Data Validation
● データ検証を行うコンポーネント
● データパイプラインの定義: Apache Beam
○ 柔軟性
■ 各種統計値を柔軟に計算可能
○ 拡張性
■ 分散処理フレームワークの特性
TensorFlow Data Validation
● Notebook上で統計値を可視化(Facets を利用)
TensorFlow Data Validation
● スキーマの推測
○ データの特性を反映する形でスキーマを推測
○ データは流動的なものなのでシステム側で適合させる
TensorFlow Data Validation
● 新データに対する検証
TensorFlow Data Validation
● 継続的なデータ検証
TensorFlow Data Validation
● 異なるデータセットに対する検証
TensorFlow Data Validation
● 学習環境と本番環境間の不均衡検出
TensorFlow Transformation
● 平均・標準偏差に基づいた正規化
● (入力データの語彙に基づいた)文字列→数値の変換
● TensorFlowの計算グラフとしてエクスポート可能
TensorFlow Model Analysis
機械学習モデルの解析を行う
● TensorBoard との違い
○ TensorBoeard : 学習の判断に必要
■ モデルの収束など
○ TFMA: モデルリリースの判断に必要
■ Cross Validationの結果など
TensorFlow Model Analysis
● One model VS. multiple models
○ TensorBoard: 基本的に単一モデルのメトリクス
○ TFMA: 複数モデルを時系列に沿って評価可能
TensorFlow Model Analysis
● モデルの評価をセグメントごとに分割
TensorFlow Model Analysis
● セグメントごとに分割された評価指標の可視化
Reference
● TFX: A TensorFlow-Based Production-Scale Machine Learning Platform
○ 日本語解説資料
● Kubeflow
○ 日本語解説資料
● Applied Machine Learning at Facebook: A Datacenter Infrastructure
Perspective
● Introducing FBLearner Flow: Facebook’s AI backbone
● Machine Learning in Uber's Data Science Platforms
● Bighead: Airbnb’s End-to-End Machine Learning Platform
● Rules os ML: EN, JP
● Machine Learning Glossary by Google

More Related Content

PDF
Introduction to argo
PDF
Kubeflowで何ができて何ができないのか #DEvFest18
PDF
Kuberflow Kubernetes上の機械学習プラットフォーム
PDF
Autopilot google kubernetes engineでargo workflowsを動かす
PDF
2018 07-23
PDF
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
PDF
Feature StoreをRustで実装した話
PDF
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)
Introduction to argo
Kubeflowで何ができて何ができないのか #DEvFest18
Kuberflow Kubernetes上の機械学習プラットフォーム
Autopilot google kubernetes engineでargo workflowsを動かす
2018 07-23
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
Feature StoreをRustで実装した話
Deep learningの発展と化学反応への応用 - 日本化学会第101春季大会(2021)

What's hot (20)

PDF
Machine learning microservice_management
PDF
KubeCon 2021 NA Recap - Scheduler拡張事例最前線 / Kubernetes Meetup Tokyo #47 / #k8sjp
PDF
Deep learningwithgithubanddocker
PDF
[DLHacks]Comet ML -機械学習のためのGitHub-
PDF
How to Schedule Machine Learning Workloads Nicely In Kubernetes #CNDT2020 / C...
PDF
ディープラーニングイメージで構築する快適・高速な機械学習環境
PDF
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
PPTX
ぼくの実装した最弱のディープラーニング
PDF
Google Cloud AI の紹介 @ GCPUG Nara #03
PPTX
Azure machine learning
PPTX
Rustで3D graphics programming
PDF
Machine learning CI/CD with OSS
PPTX
Azure ml上のRにおける状態空間法でのwebのアクセス解析
PDF
Cloud operator days tokyo 2020講演資料_少人数チームでの機械学習製品の効率的な開発と運用
PDF
[DL Hacks 実装]StyleNet: Generating Attractive Visual Captions with Styles
PDF
PyCharm入門
PDF
論文紹介 "DARTS: Differentiable Architecture Search"
PDF
Klab expert camp 成果発表
PDF
NetworkXによる語彙ネットワークの可視化
PDF
How to Develop Experiment-Oriented Programs
Machine learning microservice_management
KubeCon 2021 NA Recap - Scheduler拡張事例最前線 / Kubernetes Meetup Tokyo #47 / #k8sjp
Deep learningwithgithubanddocker
[DLHacks]Comet ML -機械学習のためのGitHub-
How to Schedule Machine Learning Workloads Nicely In Kubernetes #CNDT2020 / C...
ディープラーニングイメージで構築する快適・高速な機械学習環境
機械学習プロジェクトにおける Cloud AI Platform の使い方 (2018-11-19)
ぼくの実装した最弱のディープラーニング
Google Cloud AI の紹介 @ GCPUG Nara #03
Azure machine learning
Rustで3D graphics programming
Machine learning CI/CD with OSS
Azure ml上のRにおける状態空間法でのwebのアクセス解析
Cloud operator days tokyo 2020講演資料_少人数チームでの機械学習製品の効率的な開発と運用
[DL Hacks 実装]StyleNet: Generating Attractive Visual Captions with Styles
PyCharm入門
論文紹介 "DARTS: Differentiable Architecture Search"
Klab expert camp 成果発表
NetworkXによる語彙ネットワークの可視化
How to Develop Experiment-Oriented Programs
Ad

Similar to Introduction to TFX (TFDV+TFT+TFMA) (20)

PDF
How to break the machine learning system barrier ?
PDF
ミッションクリティカルシステムの運用管理はHinemosで
PDF
Tier Ⅳ Tech Meetup #2 - 自動運転を作るのはCloudシステムの集合体?? 活用技術を大解剖 -
PDF
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
PPTX
実践:今日から使えるビックデータハンズオン あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門
PPTX
リクルートを支える横断データ基盤と機械学習の適用事例
PPTX
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論
PDF
kagamicomput201814
PDF
機械学習によるリモートネットワークの異常検知
PDF
メルペイあと払いを実現するData Pipeline
PDF
アプリケーション展開におけるキーポイント

PPTX
1028 TECH & BRIDGE MEETING
PDF
開催の辞
PDF
鷲崎弘宜, "機械学習システムの多面的モデリング・パイプライン統合フレームワーク", 第6回 AI/IoTシステム安全性シンポジウム, 2024
PDF
Iot algyan jhirono 20190111
PDF
データ分析ランチセッション#24 OSSのAutoML~TPOTについて
PDF
MonotaRO のデータ活用と基盤の過去、現在、未来
PPTX
機械学習 - MNIST の次のステップ
PDF
機械学習応用アーキテクチャ・デザインパターン概観
PDF
ML基盤メタサーベイ cvpaper.challenge #meta-study-group勉強会(2019/03/15)
How to break the machine learning system barrier ?
ミッションクリティカルシステムの運用管理はHinemosで
Tier Ⅳ Tech Meetup #2 - 自動運転を作るのはCloudシステムの集合体?? 活用技術を大解剖 -
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
実践:今日から使えるビックデータハンズオン あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門
リクルートを支える横断データ基盤と機械学習の適用事例
AIシステムの要求とプロジェクトマネジメント-前半:機械学習工学概論
kagamicomput201814
機械学習によるリモートネットワークの異常検知
メルペイあと払いを実現するData Pipeline
アプリケーション展開におけるキーポイント

1028 TECH & BRIDGE MEETING
開催の辞
鷲崎弘宜, "機械学習システムの多面的モデリング・パイプライン統合フレームワーク", 第6回 AI/IoTシステム安全性シンポジウム, 2024
Iot algyan jhirono 20190111
データ分析ランチセッション#24 OSSのAutoML~TPOTについて
MonotaRO のデータ活用と基盤の過去、現在、未来
機械学習 - MNIST の次のステップ
機械学習応用アーキテクチャ・デザインパターン概観
ML基盤メタサーベイ cvpaper.challenge #meta-study-group勉強会(2019/03/15)
Ad

More from Shunya Ueta (12)

PDF
Introducing "Challenges and research opportunities in eCommerce search and re...
PDF
Auto Content Moderation in C2C e-Commerce at OpML20
PDF
How to evaluate & manage machine learning model #daft
PDF
TFX: A tensor flow-based production-scale machine learning platform
PDF
Applied machine learning at facebook a datacenter infrastructure perspective...
PDF
C-IMAGE: city cognitive mapping through geo-tagged photos 解説
PDF
Self-turning Spectral Clustering (NIPS2004)
PDF
Semi-Supervised Learning Using Gaussian Fields and Harmonic Functions (ICML2003)
PDF
Detecting Research Topics via the Correlation between Graphs and Texts
PDF
Fast normalized cut with linear constraint (CVPR2009)
PDF
"Spectral graph reduction for efficient image and streaming video segmentatio...
PDF
コミュニティサイトを爆速で作成し、お手軽に運用する方法
Introducing "Challenges and research opportunities in eCommerce search and re...
Auto Content Moderation in C2C e-Commerce at OpML20
How to evaluate & manage machine learning model #daft
TFX: A tensor flow-based production-scale machine learning platform
Applied machine learning at facebook a datacenter infrastructure perspective...
C-IMAGE: city cognitive mapping through geo-tagged photos 解説
Self-turning Spectral Clustering (NIPS2004)
Semi-Supervised Learning Using Gaussian Fields and Harmonic Functions (ICML2003)
Detecting Research Topics via the Correlation between Graphs and Texts
Fast normalized cut with linear constraint (CVPR2009)
"Spectral graph reduction for efficient image and streaming video segmentatio...
コミュニティサイトを爆速で作成し、お手軽に運用する方法

Introduction to TFX (TFDV+TFT+TFMA)