SlideShare a Scribd company logo
MOV お客さま探索ナビの
GCP ML開発フローについて
鈴木 隆史
AI本部 AIシステム部 MLエンジニアリンググループ
株式会社ディー・エヌ・エー
自己紹介
鈴木 隆史 | Takashi Suzuki
AI本部 AIシステム部 MLエンジニアリンググループ
前職では新卒でITメガベンチャーに入社し、サーバーサイドエンジニアとしてゲーム開発と
ビッグデータを活用したサービス分析をリード。
その後、大規模データ基盤の新規構築と運用保守などのデータエンジニアリング業務と、レ
コメンドアルゴリズムの設計開発やチャットボット開発などのMLエンジニアリング業務に
従事していた。
2019年にDeNAに入社し、オートモーティブ事業における機械学習の実験基盤やパイプライ
ンの設計開発を行っている。
2
アジェンダ
3
サービス
システム概要
ML開発フロー
1
2
3
まとめ4
サービス
4
1
タクシー配車アプリ MOV
5
お客さま探索ナビ
6
この車両にとって
最適な走行経路は何か?
システム概要
7
2
全体システム構成
8
9
コンポーネント概要
リアルタイム
データ処理
● 車両データのETL
● DWH
● データ前処理
需要供給予測
● 特徴量作成
● MLモデル予測
走行ルート推薦
● 最適方策の獲得
● 全体最適化
リアルタイム需要供給予測
10
直近の乗車数
周辺の乗車数
各種統計量
MLモデル
直後30分に発生
する乗車数
ML開発フロー
11
3
本番環境
● 推論パイプライン
● モデル精度監視
12
ML開発フロー
実験環境
● 分析/モデル開発
● 実験管理
CI/CD
本番環境
● 推論パイプライン
● モデル精度監視
13
ML開発フロー
実験環境
● 分析/モデル開発
● 実験管理
CI/CD
分析/モデル開発における課題
14
01
セキュアなクラウド環境
権限・証跡がきちんと管理され
ローカルPC以上に快適に
メンバーと共有しやすい環境
02
学習時のスケール
一番メモリを必要とするモデル学習時に
他タスクに影響ないように
スケールする環境
ユーザ認証Jupyter環境
● GKE構築でセキュア(SSL、IP制限)でスケールしやすい
● 個人認証(Cloud IAP)をサポート
● Notebookを共有しやすい
v.s. Datalab
● セキュア要件への柔軟さ
● 起動の速さ
セキュアなクラウド環境:JupyterHub
15
フルマネージド学習基盤
● 1分単位の起動時間課金
● Dockerカスタムイメージの学習をサポート
● ジョブ実行までidle timeが発生する
v.s. GKE
● 柔軟なインスタンス変更
● クラスタ作成不要の手軽さ
学習時のスケール:AI Platform Training Job
16
AI Platform
本番環境
● 推論パイプライン
● モデル精度監視
17
ML開発フロー
実験環境
● 分析/モデル開発
● 実験管理
CI/CD
実験管理における課題
18
01
各実験パラメータの管理
複数モデルの実験を行うため各実験のパラメータ管理が必要
comet.ml
- 豊富な視覚化/比較
- ハイパラ探索
- コード管理
- Git Integration
- 有料
各実験パラメータの管理
19
mlflow
- 視覚化/比較
- 簡易ハイパラ探索
- 無料
BigQuery
- 視覚化はDataPortal
- リストはDataConnector
- カスタムしやすい
本番環境
● 推論パイプライン
● モデル精度監視
20
ML開発フロー
実験環境
● 分析/モデル開発
● 実験管理
CI/CD
CI/CDにおける課題
21
01
コードの再現性
データサイエンティストから
MLエンジニアに渡された
コード・モデルの実行/再現の
担保
02
ロールバック
新しいモデルにバグが
あった場合の
以前のモデルに切り戻
したいとき
03
モデルのテスト
パイプラインに反映する前の
簡易な動作テストと
小規模データの検証テスト
コード・モデルの再現性
● コミュニケーションギャップの解消
● 再現性の担保
● GKEやTraining Jobのコンテナで利用しやすい
モデルのロールバック
● DockerのImage Tag/Digestでversion管理
● 切り戻す際には以前のImageへ
再現性とロールバック:Docker I/F
22
動作・検証テスト
● 時間の関係でCircleCIでチェックするのは動作・検証テストのみ
● 小規模データでモデルの有効性と実装エラーを検証
● 本番条件での連携と評価テストは専用Invoke
モデルの簡易テスト:pytest
23
本番環境
● 推論パイプライン
● モデル精度監視
24
ML開発フロー
実験環境
● 分析/モデル開発
● 実験管理
CI/CD
02
冪等性担保
パイプラインの再実行などにより
データ重複やモデルの精度ズレが
発生しないようにする
推論パイプラインにおける課題
25
01
複雑な依存関係
学習に利用する各種特徴量の作成と
データの前処理や推論や評価など
一連の依存関係を担保
マネージドAirflow
● 複雑な依存関係定義によりヒューマンエラー防止
● 冪等性なJob実行により再現性を担保
● 定期的にJobを実行してモデルを更新
● 重い処理はGKEやTraining Jobを利用
v.s. Kubeflow Pipeline
● 途中Jobから再実行可能
● 外部トリガー・外部リソースの利用が容易
● 評価指標は管理できない
パイプラインにおける課題:Cloud Composer
26
Cloud
Composer
本番環境
● 推論パイプライン
● モデル精度監視
27
ML開発フロー
実験環境
● 分析/モデル開発
● 実験管理
CI/CD
モデル精度監視における課題
28
01
モデルの経年劣化
日々変化するタクシー需要トレンドに追従して
新しいデータでモデルを再学習させ、精度をモニタリングしたい
モデル推論の精度を監視
● モデルの定期更新はComposerで担保
● モデル精度をカスタムメトリックでMonitoring
● ベースモデルと比較して悪ければ通知
モデルの経年劣化:Stackdriver Monitoring
29
Stackdriver
Monitoring
まとめ
30
4
MLOpsの立ち位置
● 業務ごとに専門性が増し、生産性向上のために分業化が進むと、個々人が把握できる
コンポーネントは減ってしまう
● 再現性の担保、依存関係の管理、精度やエラー監視する仕組みなどのMLOpsを事前
に準備することで、技術的負債を減らすことができる
● チームごとの課題を把握し、予めI/Fや方針を握っておくことが重要
大事にしていること
31
本説明会及び説明資料の内容は、発表日時点で入手可能な情報や判断に基づくも
のです。将来発生する事象等により内容に変更が生じた場合も、当社が更新や変更
の義務を負うものではありません。
また、本説明会及び説明資料に含まれる将来の見通しに関する部分は、多分に
不確定な要素を含んでいるため、実際の業績等は、さまざまな要因の変化等により、
これらの見通しと異なる場合がありますことをご了承ください。
株式会社ディー・エヌ・エー
32

More Related Content

PPTX
MOVで実践したサーバーAPI実装の超最適化について [MOBILITY:dev]
PPTX
後部座席タブレットにおけるMaaS時代を見据えた半歩先のUX設計」 [MOBILITY:dev]
PDF
LINE Bot 開発のための Azure Logic Apps 入門
PPTX
ノンコーディングでも!ここまでできるkintone
PPTX
Only Logic Apps
PDF
Azure × LINE でクラウドを楽しもう
PPTX
20180119_AIを支えるクラウド技術
PDF
Azure Webinar - Cognitive Services 概要[Demo編]_20180123
MOVで実践したサーバーAPI実装の超最適化について [MOBILITY:dev]
後部座席タブレットにおけるMaaS時代を見据えた半歩先のUX設計」 [MOBILITY:dev]
LINE Bot 開発のための Azure Logic Apps 入門
ノンコーディングでも!ここまでできるkintone
Only Logic Apps
Azure × LINE でクラウドを楽しもう
20180119_AIを支えるクラウド技術
Azure Webinar - Cognitive Services 概要[Demo編]_20180123

What's hot (20)

PDF
AIの見方、AIとの付き合い方
PDF
Serverlessconf Tokyo 2017 Biz serverless お客様のビジネスを支える サーバーレスアーキテクチャーと開発としてのビジ...
PPTX
This is iPaas
PDF
進化を続けるBluemix 最新情報
PDF
スマートスピーカーの提案時によく出てくる課題と、その処方箋のLine
PDF
Data-centricなML開発
PDF
[AI/ML] 機械学習における AWS を用いたマイクロサービスアーキテクチャ
PDF
[第37回 Machine Learning 15minutes!] Microsoft AI - Build 2019 Updates ~ Azure ...
PDF
AI プログラミング - OCA / 京都TECH オープンキャンパス 2021
PPTX
StrongLoopでサクっと始めるAPIエコノミー
PDF
JAZUG に参加してMicrosoft MVP になった話
PPSX
Mobile Hubで変わる、アプリ開発最前線
PDF
Decode19 cd42 fixer_public_0601
PDF
Azure IoT Edge で Custom Vision
PDF
使ってみよう!”人工知能パーツ” Microsoft Cognitive Services_20180216
PPTX
IoTC -> Power Automate & Apps
PDF
LINE Commumity Microsoft_ConversationalAI_20200409
PDF
API ペタペタしただけのお手軽 感情分析アプリ
PDF
Azure Webinar: Microsoft Bot Framework と Cognitive Services LUIS で実現する自然言語解析B...
PPT
Softlayer と Bluemix (IaaS と PaaS) 適材適所でアプリケーション開発
AIの見方、AIとの付き合い方
Serverlessconf Tokyo 2017 Biz serverless お客様のビジネスを支える サーバーレスアーキテクチャーと開発としてのビジ...
This is iPaas
進化を続けるBluemix 最新情報
スマートスピーカーの提案時によく出てくる課題と、その処方箋のLine
Data-centricなML開発
[AI/ML] 機械学習における AWS を用いたマイクロサービスアーキテクチャ
[第37回 Machine Learning 15minutes!] Microsoft AI - Build 2019 Updates ~ Azure ...
AI プログラミング - OCA / 京都TECH オープンキャンパス 2021
StrongLoopでサクっと始めるAPIエコノミー
JAZUG に参加してMicrosoft MVP になった話
Mobile Hubで変わる、アプリ開発最前線
Decode19 cd42 fixer_public_0601
Azure IoT Edge で Custom Vision
使ってみよう!”人工知能パーツ” Microsoft Cognitive Services_20180216
IoTC -> Power Automate & Apps
LINE Commumity Microsoft_ConversationalAI_20200409
API ペタペタしただけのお手軽 感情分析アプリ
Azure Webinar: Microsoft Bot Framework と Cognitive Services LUIS で実現する自然言語解析B...
Softlayer と Bluemix (IaaS と PaaS) 適材適所でアプリケーション開発
Ad

Similar to MOV お客さま探索ナビの GCP ML開発フローについて (20)

PDF
GOの機械学習システムを支えるMLOps事例紹介
PPTX
ML Ops NYC 19 & Strata Data Conference 2019 NewYork 注目セッションまとめ
PPTX
JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜
PPTX
JapanTaxiにおけるSagemaker+αによる機械学習アプリケーションの本番運用
PPTX
先駆者に学ぶ MLOpsの実際
PDF
MLプロジェクトのリリースフローを考える
PPTX
How to organize data science project (データサイエンスプロジェクトの始め方101)
PDF
ドメイン駆動設計入門
PPTX
Digitize business processes
PDF
ドメイン駆動設計の正しい歩き方
PDF
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
PDF
ドメイン駆動設計 ( DDD ) をやってみよう
PDF
タクシー運行最適化を実現する機械学習システムの社会実装
PDF
VSM(ValueStreamMapping)によって 実現できたリリースまでに268.5hかかっていた時間を54.5hに短縮できた秘訣
PDF
プロダクトがリリースされるまでを『見える化』することで組織体質を変えていった話
PPTX
UMLモデルを使った自動生成
PDF
大阪DDD読書会ワークショップvol.1ガイダンス
PDF
ビジネスプロセスワークショップ 2017大阪
PDF
【Japan Partner Conference 2019】Society 5.0 “超スマート社会” の実現に向けた日本マイクロソフトの取り組み
PPTX
車両運行管理システムのためのデータ整備と機械学習の活用
GOの機械学習システムを支えるMLOps事例紹介
ML Ops NYC 19 & Strata Data Conference 2019 NewYork 注目セッションまとめ
JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜
JapanTaxiにおけるSagemaker+αによる機械学習アプリケーションの本番運用
先駆者に学ぶ MLOpsの実際
MLプロジェクトのリリースフローを考える
How to organize data science project (データサイエンスプロジェクトの始め方101)
ドメイン駆動設計入門
Digitize business processes
ドメイン駆動設計の正しい歩き方
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
ドメイン駆動設計 ( DDD ) をやってみよう
タクシー運行最適化を実現する機械学習システムの社会実装
VSM(ValueStreamMapping)によって 実現できたリリースまでに268.5hかかっていた時間を54.5hに短縮できた秘訣
プロダクトがリリースされるまでを『見える化』することで組織体質を変えていった話
UMLモデルを使った自動生成
大阪DDD読書会ワークショップvol.1ガイダンス
ビジネスプロセスワークショップ 2017大阪
【Japan Partner Conference 2019】Society 5.0 “超スマート社会” の実現に向けた日本マイクロソフトの取り組み
車両運行管理システムのためのデータ整備と機械学習の活用
Ad

More from DeNA (20)

PPTX
DRIVE CHARTの裏側 〜 AI ☓ IoT ☓ ビッグデータを 支えるアーキテクチャ 〜
PPTX
IoTと業務システムをつなぐgRPC/RESTサービスの開発と運用
PPTX
Can We Make Maps from Videos? ~From AI Algorithm to Engineering for Continuou...
PDF
SHOWROOMとDeNAで取り組んだライブ配信基盤刷新・超低遅延ライブ配信の裏側【DeNA TechCon 2020 ライブ配信】
PPTX
クラウド環境でのセキュリティ監査自動化【DeNA TechCon 2020 ライブ配信】
PPTX
DeClang 誕生!Clang ベースのハッキング対策コンパイラ【DeNA TechCon 2020 ライブ配信】
PDF
仕様起因の手戻りを減らして開発効率アップを目指すチャレンジ 【DeNA TechCon 2020 ライブ配信】
PPTX
DeNA データプラットフォームにおける 自由と統制のバランス【DeNA TechCon 2020 ライブ配信】
PPTX
リアルタイムリモートデバッグ環境によるゲーム開発イテレーションの高速化【DeNA TechCon 2020 ライブ配信】
PDF
MOV の機械学習システムを支える MLOps 実践【DeNA TechCon 2020 ライブ配信】
PDF
コンピュータビジョン技術の実応用〜DRIVE CHARTにおける脇見・車間距離不足検知〜【DeNA TechCon 2020 ライブ配信】
PDF
DeNA の Slack 導入と活用の事例紹介
PPTX
タクシーxAIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについて [SRE NEXT 2020]
PPTX
オートモーティブ領域における 位置情報関連アルゴリズムあれこれ
PPTX
ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]
PPTX
課題ドリブン、フルスタックAI開発術 [MOBILITY:dev]
PPTX
DeNA の AWS アカウント管理とセキュリティ監査自動化
PPTX
DeNAのQCTマネジメント IaaS利用のベストプラクティス [AWS Summit Tokyo 2019]
PPTX
知っててもいいかもしれない知財のこと(抜粋版)
PPTX
ゲーム開発者からMaaS開発者へ ゲーム開発のノウハウを活かして 移動体情報配信システムを作ってみた [DeNA TechCon 2019]
DRIVE CHARTの裏側 〜 AI ☓ IoT ☓ ビッグデータを 支えるアーキテクチャ 〜
IoTと業務システムをつなぐgRPC/RESTサービスの開発と運用
Can We Make Maps from Videos? ~From AI Algorithm to Engineering for Continuou...
SHOWROOMとDeNAで取り組んだライブ配信基盤刷新・超低遅延ライブ配信の裏側【DeNA TechCon 2020 ライブ配信】
クラウド環境でのセキュリティ監査自動化【DeNA TechCon 2020 ライブ配信】
DeClang 誕生!Clang ベースのハッキング対策コンパイラ【DeNA TechCon 2020 ライブ配信】
仕様起因の手戻りを減らして開発効率アップを目指すチャレンジ 【DeNA TechCon 2020 ライブ配信】
DeNA データプラットフォームにおける 自由と統制のバランス【DeNA TechCon 2020 ライブ配信】
リアルタイムリモートデバッグ環境によるゲーム開発イテレーションの高速化【DeNA TechCon 2020 ライブ配信】
MOV の機械学習システムを支える MLOps 実践【DeNA TechCon 2020 ライブ配信】
コンピュータビジョン技術の実応用〜DRIVE CHARTにおける脇見・車間距離不足検知〜【DeNA TechCon 2020 ライブ配信】
DeNA の Slack 導入と活用の事例紹介
タクシーxAIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについて [SRE NEXT 2020]
オートモーティブ領域における 位置情報関連アルゴリズムあれこれ
ドライブレコーダ映像からの3次元空間認識 [MOBILITY:dev]
課題ドリブン、フルスタックAI開発術 [MOBILITY:dev]
DeNA の AWS アカウント管理とセキュリティ監査自動化
DeNAのQCTマネジメント IaaS利用のベストプラクティス [AWS Summit Tokyo 2019]
知っててもいいかもしれない知財のこと(抜粋版)
ゲーム開発者からMaaS開発者へ ゲーム開発のノウハウを活かして 移動体情報配信システムを作ってみた [DeNA TechCon 2019]

MOV お客さま探索ナビの GCP ML開発フローについて

Editor's Notes

  • #7: 乗車予測を立てることで空車となる時間を短縮し、歩合制の契約が多いタクシー運転手の収入を安定させる