Submit Search
タクシードライブレコーダーの動画処理MLパイプラインにkubernetesを使ってみた
Download as PPTX, PDF
0 likes
6,910 views
Tetsutaro Watanabe
JapanTaxiにてタクシードライブレコーダーの動画処理のための機械学習パイプラインにkubernetesを使ってみた話です
Technology
Read more
1 of 23
Download now
Downloaded 15 times
1
2
3
4
5
6
7
8
9
10
11
12
Most read
13
14
15
16
17
18
19
20
21
22
23
More Related Content
PPTX
ML Ops NYC 19 & Strata Data Conference 2019 NewYork 注目セッションまとめ
Tetsutaro Watanabe
PPTX
ドライブレコーダの動画を使った道路情報の自動差分抽出
Tetsutaro Watanabe
PPTX
JapanTaxiにおけるSagemaker+αによる機械学習アプリケーションの本番運用
Tetsutaro Watanabe
PPTX
データ収集の基本と「JapanTaxi」アプリにおける実践例
Tetsutaro Watanabe
PPTX
JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜
Tetsutaro Watanabe
PPTX
リクルートを支える横断データ基盤と機械学習の適用事例
Tetsutaro Watanabe
PDF
Feature StoreをRustで実装した話
emakryo
PPTX
データサイエンティスト向け性能問題対応の基礎
Tetsutaro Watanabe
ML Ops NYC 19 & Strata Data Conference 2019 NewYork 注目セッションまとめ
Tetsutaro Watanabe
ドライブレコーダの動画を使った道路情報の自動差分抽出
Tetsutaro Watanabe
JapanTaxiにおけるSagemaker+αによる機械学習アプリケーションの本番運用
Tetsutaro Watanabe
データ収集の基本と「JapanTaxi」アプリにおける実践例
Tetsutaro Watanabe
JapanTaxiにおけるML Ops 〜機械学習の開発運用プロセス〜
Tetsutaro Watanabe
リクルートを支える横断データ基盤と機械学習の適用事例
Tetsutaro Watanabe
Feature StoreをRustで実装した話
emakryo
データサイエンティスト向け性能問題対応の基礎
Tetsutaro Watanabe
What's hot
(20)
PPTX
ドライブレコーダの画像認識による道路情報の自動差分抽出
Tetsutaro Watanabe
PPTX
MLOpsはバズワード
Tetsutaro Watanabe
PPTX
巨大なサービスと膨大なデータを支えるプラットフォーム
Tetsutaro Watanabe
PPTX
ビックデータ処理技術の全体像とリクルートでの使い分け
Tetsutaro Watanabe
PPTX
IoTデバイスデータ収集の難しい点
Tetsutaro Watanabe
PPTX
先駆者に学ぶ MLOpsの実際
Tetsutaro Watanabe
PPTX
Google Cloud Next '18 Recap/報告会 機械学習関連
Tetsutaro Watanabe
PDF
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
Recruit Technologies
PPTX
日経コンピュータ主催:さわってわかる機械学習 Azure Machine Learning 実践セミナー
Hiroshi Senga
PDF
20180627 - DEEP LEARNING LAB / Cognitive Services 最新情報 30 分でズバリ!
Takashi Okawa
PPTX
ビッグデータ処理データベースの全体像と使い分け 2018年version
Tetsutaro Watanabe
PDF
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
Recruit Technologies
PPTX
DLモデル開発中の雑務が嫌で支援プラットフォームを作った話
Kamonohashi
PDF
20150625 cloudera
Recruit Technologies
PDF
JJUG CCC リクルートの Java に対する取り組み
Recruit Technologies
PDF
DX認定制度システム開発裏話:技術編
Arichika TANIGUCHI
PDF
Rubyの会社でPythonistaが3ヶ月生き延びた話
Tokoroten Nakayama
PPTX
Deep Learning Lab - Microsoft Machine Learning meetup 2018/06/27 - 推論編
Daiyu Hatakeyama
PPTX
AI を道具として使うための基礎知識 - Microsoft AI
Daiyu Hatakeyama
PDF
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
Preferred Networks
ドライブレコーダの画像認識による道路情報の自動差分抽出
Tetsutaro Watanabe
MLOpsはバズワード
Tetsutaro Watanabe
巨大なサービスと膨大なデータを支えるプラットフォーム
Tetsutaro Watanabe
ビックデータ処理技術の全体像とリクルートでの使い分け
Tetsutaro Watanabe
IoTデバイスデータ収集の難しい点
Tetsutaro Watanabe
先駆者に学ぶ MLOpsの実際
Tetsutaro Watanabe
Google Cloud Next '18 Recap/報告会 機械学習関連
Tetsutaro Watanabe
リクルートのビッグデータ活用基盤とデータ活用に向けた取組み
Recruit Technologies
日経コンピュータ主催:さわってわかる機械学習 Azure Machine Learning 実践セミナー
Hiroshi Senga
20180627 - DEEP LEARNING LAB / Cognitive Services 最新情報 30 分でズバリ!
Takashi Okawa
ビッグデータ処理データベースの全体像と使い分け 2018年version
Tetsutaro Watanabe
リクルートのビッグデータ活用基盤とビッグデータ活用のためのメタデータ管理Webのご紹介
Recruit Technologies
DLモデル開発中の雑務が嫌で支援プラットフォームを作った話
Kamonohashi
20150625 cloudera
Recruit Technologies
JJUG CCC リクルートの Java に対する取り組み
Recruit Technologies
DX認定制度システム開発裏話:技術編
Arichika TANIGUCHI
Rubyの会社でPythonistaが3ヶ月生き延びた話
Tokoroten Nakayama
Deep Learning Lab - Microsoft Machine Learning meetup 2018/06/27 - 推論編
Daiyu Hatakeyama
AI を道具として使うための基礎知識 - Microsoft AI
Daiyu Hatakeyama
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
Preferred Networks
Ad
Similar to タクシードライブレコーダーの動画処理MLパイプラインにkubernetesを使ってみた
(20)
PDF
JapanTaxiのAI活用事例
Fumihiko Takahashi
PPTX
『モビリティ・インテリジェンス』の社会実装 [DeNA TechCon 2019]
DeNA
PDF
タクシー×AIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについて
Takashi Suzuki
PPTX
2020 08-01 ALGYAN AI&ロボティクス (1)
Akira Tateishi
PPTX
タクシーxAIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについて [SRE NEXT 2020]
DeNA
PPTX
AI robot car
Akira Sasaki
PDF
JapanTaxi R&Dの取り組み事例
Fumihiko Takahashi
PPTX
車両運行管理システムのためのデータ整備と機械学習の活用
Eiji Sekiya
PDF
[db analytics showcase Sapporo 2017] B14: GPU コンピューティング最前線 by エヌビディア 佐々木邦暢
Insight Technology, Inc.
PDF
GPU クラウド コンピューティング
NVIDIA Japan
PPTX
物体検出フレームワークMMDetectionで快適な開発
Tatsuya Suzuki
PPTX
DataEngConf NYC’18 セッションサマリー #2
gree_tech
PDF
[Cloud OnAir] Google Cloud Next '18 最新情報 2018年7月26日 放送
Google Cloud Platform - Japan
PDF
加藤先生ご講演資料_20210824
直久 住川
PPTX
Si2017 チームイエスマン 発表スライド
Robotics Engineer
PDF
ドライブレコーダーの映像で Scene Text Recognitionする
Fumihiko Takahashi
PDF
Mobilitydev2019 10 31_slideshare
Tier_IV
PDF
JAWS re:Mote 2015 Nagoya
陽平 山口
PDF
全国タクシーのサーバーサイドをVb.netからruby on railsに書き換えた話
達也 川原
PDF
MediaPipeの紹介
emakryo
JapanTaxiのAI活用事例
Fumihiko Takahashi
『モビリティ・インテリジェンス』の社会実装 [DeNA TechCon 2019]
DeNA
タクシー×AIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについて
Takashi Suzuki
2020 08-01 ALGYAN AI&ロボティクス (1)
Akira Tateishi
タクシーxAIを支えるKubernetesとAIデータパイプラインの信頼性の取り組みについて [SRE NEXT 2020]
DeNA
AI robot car
Akira Sasaki
JapanTaxi R&Dの取り組み事例
Fumihiko Takahashi
車両運行管理システムのためのデータ整備と機械学習の活用
Eiji Sekiya
[db analytics showcase Sapporo 2017] B14: GPU コンピューティング最前線 by エヌビディア 佐々木邦暢
Insight Technology, Inc.
GPU クラウド コンピューティング
NVIDIA Japan
物体検出フレームワークMMDetectionで快適な開発
Tatsuya Suzuki
DataEngConf NYC’18 セッションサマリー #2
gree_tech
[Cloud OnAir] Google Cloud Next '18 最新情報 2018年7月26日 放送
Google Cloud Platform - Japan
加藤先生ご講演資料_20210824
直久 住川
Si2017 チームイエスマン 発表スライド
Robotics Engineer
ドライブレコーダーの映像で Scene Text Recognitionする
Fumihiko Takahashi
Mobilitydev2019 10 31_slideshare
Tier_IV
JAWS re:Mote 2015 Nagoya
陽平 山口
全国タクシーのサーバーサイドをVb.netからruby on railsに書き換えた話
達也 川原
MediaPipeの紹介
emakryo
Ad
More from Tetsutaro Watanabe
(9)
PPTX
WiredTigerを詳しく説明
Tetsutaro Watanabe
PPTX
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
Tetsutaro Watanabe
PPTX
リクルートテクノロジーズ における EMR の活用とコスト圧縮方法
Tetsutaro Watanabe
PPTX
MongoDBが遅いときの切り分け方法
Tetsutaro Watanabe
PPTX
MongoDB3.2の紹介
Tetsutaro Watanabe
PPTX
MongoDB World 2014に行ってきた!
Tetsutaro Watanabe
PPTX
がっつりMongoDB事例紹介
Tetsutaro Watanabe
PPTX
初心者向けMongoDBのキホン!
Tetsutaro Watanabe
PPTX
MongoDBの監視
Tetsutaro Watanabe
WiredTigerを詳しく説明
Tetsutaro Watanabe
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
Tetsutaro Watanabe
リクルートテクノロジーズ における EMR の活用とコスト圧縮方法
Tetsutaro Watanabe
MongoDBが遅いときの切り分け方法
Tetsutaro Watanabe
MongoDB3.2の紹介
Tetsutaro Watanabe
MongoDB World 2014に行ってきた!
Tetsutaro Watanabe
がっつりMongoDB事例紹介
Tetsutaro Watanabe
初心者向けMongoDBのキホン!
Tetsutaro Watanabe
MongoDBの監視
Tetsutaro Watanabe
タクシードライブレコーダーの動画処理MLパイプラインにkubernetesを使ってみた
1.
1 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved タクシードライブレコーダーの 動画処理MLパイプラインに kubernetesを使ってみた 2019/9/9 JapanTaxi 次世代モビリティ事業部 渡部徹太郎 Webエンジニアが使う身近な Kubernetes
2.
2 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 2 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved ID : fetaro 名前:渡部 徹太郎 研究:東京工業大学でデータベースと情報検索の研究(@日本データベース学会) 前職: - 大手SIer: オンライントレードシステム基盤 - 大手SIer: オープンソース技術部隊 (MongoDB等) - リクルートテクノロジーズ: ビッグデータ分析基盤 (EMR, Hortonworks, BigQuery, Oracle Exadata) 現職: - JapanTaxi: データエンジニア エディタ: - emacs派 趣味: - 自宅サーバ 日本AWSユーザ会(JAWS) ビッグデータ支部 自己紹介
3.
3 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 3 Proprietary and Confidential ©2019 JapanTaxi, Inc. All Rights Reserved 800万DL超 日本No1タクシーアプリ『JapanTaxi』 アプリマップ上で指定したピン位置にタクシーを手配。 全国47都道府県で約7万台と、全国のタクシー車両1/3がアプリで呼べる。 Google Mapsや音声AIなど様々な注文チャネル、決済、経費精算に対応。 *App Annie調べ タクシー配車/ライドシェアアプリ内における、日本国内累計ダウンロード数/月間平均アクティブユーザー数(iOS/Google Play合算値)調査期間:2017年10月1日〜2018年9月30日 外部注文チャネル 地図・経路検索 Google Maps iphone map 経費精算 Concur MoneyForward タクシー配車アプリ『JapanTaxi』 海外 KakaoT TaxiGo my route iphone siri Alexa/echo spot mydaiz LINE clova Yahoo!乗換案内 外部注文チャネル 音声AI NAVITIME setowa 信州ナビ Japan Trip Navigator
4.
4 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 4 Proprietary and Confidential ©2019 JapanTaxi, Inc. All Rights Reserved タクシー配車アプリ『JapanTaxi』 今いる場所 行きたい場所 呼ぶ
5.
5 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 5 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved やりたいこと 作っているシステム アジェンダ
6.
6 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights ReservedProprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved やりたいこと
7.
7 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 7 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
8.
8 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 8 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved センシングカーとしてのタクシー車両
9.
9 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 9 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 1日のタクシー動態の様子 タクシーは毎日大量に走り回っているため、 取得できるデータが膨大
10.
10 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 10 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 白線検出 駐車場 満車・空車 ドラレコ動画を解析し、高付加価値な情報をつけてビジネスにする 工事現場 ガソリン 料金
11.
11 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights ReservedProprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 作っているシステム
12.
12 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 12 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved システムの全体像 クラウド モザイク 処理 高付加価値 メタデータ 計算処理 動画の 受信 サーバ センサデータ送付 動画送付 マップ マッチ センサ データの 受信サーバ 送付すべき動画のリスト 復号 ・ 細分化
13.
13 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 13 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved システムを作る上でのポイント マップマッチ o マップマッチエンジンがDockerコンテナで配布されている 動画復号 o OSにインストールするパッケージが必要(Pythonの外側の世界が必要) モザイク処理 o できるだけ低価格で機械学習の推論がしたい • GPU使用率を限界まで上げたい • モデルのロードなどのGPUを使わない時間を極力減らしたい • 割安仮想マシンを使いたい o 高い精度が求められるため、物体検出に加えて、各画像フレーム間での補間計算が必要 • 画像一枚を処理すればよいわけではない • 推論の前後処理が重要 高付加価値メタデータ計算処理 o できるだけ低価格で機械学習の推論がしたい o 複数のデータサイエンティストがユースケースに合わせた様々なライブラリを使う 分散処理 o 上記全てにおいて、タクシー台数の増加に合わせてスケールできる分散処理の仕組みが必要
14.
14 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 14 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 技術選定にて没になった技術 候補 メリット デメリット サーバレス コンピューティン ティング ・インターネット上にノウハウが多く、開発が簡 発が簡単 ・処理時間に制限がある ・GPUが使えない ・OSのパッケージがインストールできない 機械学習 サービス ・モデル開発のための環境が整っている ・推論の前後処理の開発が難しい ・バッチ推論の度にリソースを確保するため、モデ モデルのロード時間がもったいない ・OSのパッケージがインストールできない 仮想マシン+ Docker ・割安仮想マシン(※)が使える ・OSのパッケージがインストール可能 ・モデルを一回ロードして長時間推論させられ られる ・マップマッチコンテナがそのまま動く ・作り込む必要があるものが多い ・スケールイン・スケールアウト ・リソースモニタリング・コントロール ・コンテナデプロイ ・ログ参照 (※)割安仮想マシン=GCPのプリエンプティブVMやAWSのスポットインスタンス
15.
15 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 15 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved kubenetesの採用 kubernetes採用理由 o 必要な要素が揃っていた • コンテナが使える • OSのライブラリが動く • いろんなバージョンのライブラリを使い分けられる • 作りこむ箇所が少ない(スケールイン・アウト、デプロイ、リソース制御、ログ参照) • 割安仮想マシンが利用できる • モデルを最初に読み込んで、長期間推論を実行し続けられる=GPUを限界まで使える その他 o メルカリ社や米Lyft社がML基盤として採用している o クラウドに(ある程度)依存しないように作れる
16.
16 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 16 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved kubenetesによるシステムの構築 センサ データの 受信 クラウド モザイク 処理 高付加価値 メタデータ 計算 動画の 受信 サーバ センサデータ送付 動画送付 マップ マッチ 送付すべき動画のリスト 復号 ・ 細分化 Kubernetes コンテナ L B L B クラウドが提供 オブジェクト ストレージ オブジェクト ストレージ データウェア ハウス
17.
17 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 17 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved OSイメージ 高付加価値メタデータ計算コンテナの構成 仮想マシン GPU ドライバ GPU Python 独自フレームワーク 推論プログラム コンテナ最適化OS データ 取得 モデル 推論 結果 格納 クラウドが提供 コンテナ データエンジニア 担当 サイエンティスト 担当 利用ライブラ リ宣言 requirements. txt データエンジニア 担当 オブジェクト ストレージ GPU ライブラリ データウェア ハウス キュー ポイント • サイエンティストとのIFには 独自フレームワークを用意 • コンテナ生成時に使用ライブラ リ宣言ファイルを元にライブラ リをインストール • コンテナ起動時に、 モデルをメモリに読みこむ URL URL
18.
18 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 18 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved コンテナの配置とスケール戦略 仮想マシン 仮想マシン 仮想マシン CP U CP U CP U 仮想マシ ンCP U 仮想マシ ンCP U 仮想マシ ンCP U データ 受信 マップ マッチ マップ マッチ データ 受信 モザ イク モザ イク メタデータ 計算 LB LB メタデータ 計算 CPUノードプール GPUノードプール GPU GPU GPU キュー キュー 料金が高いため、スケールイン・アウト料金が高くないため、一定数起動 (タクシー台数が増えてきたらスケールアウト)
19.
19 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 19 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved Ackしていないメッセージ数がしきい値を超えていないため、Podのスケールアウトは起きない GPUノードプールのスケールイン・スケールアウト キュー Pod HorizontalPodAutoscaler Ackしていないメッセージ数 > 3 モニタリング Ackしていないメッセージ数=2 仮想マシン GPU コンテナ ReplicaSet ノードプール Cluster Autoscaler 最小=1, 最大=2 Running
20.
20 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 20 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved GPUノードプールのスケールイン・スケールアウト しきい値を超えたため、Podが増える。しかしPodはリソースが無いため待たされる(Pending) キュー Pod HorizontalPodAutoscaler Ackしていないメッセージ数 > 3 モニタリング Ackしていないメッセージ数=4 仮想マシン GPU コンテナ ReplicaSet Pod 要求=GPU 1つ コンテナ ノードプール Cluster Autoscaler 最小=1, 最大=2 Running Pending
21.
21 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 21 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved GPUノードプールのスケールイン・スケールアウト キュー Pod HorizontalPodAutoscaler Ackしていないメッセージ数 > 3 モニタリング Ackしていないメッセージ数=4 仮想マシン GPU コンテナ ReplicaSet Pod 要求=GPU 1つ コンテナ ノードプール 仮想マシン GPU Podが待たされているとノードプールがスケールアウトする。これでPodがRunningになる Cluster Autoscaler 最小=1, 最大=2 Running Running
22.
22 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 22 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved 良かった点 o kubecliが便利すぎる • デプロイ、ログの確認、コンテナに入り込んでのデバッグ、すべてができる • 特に同じ種類の複数のコンテナのログをまとめて見れるのは便利すぎる o 知見が多い • エラーが起きてもググればなんとかなる 難しかった点 o ネットワーク構造が複雑 • クラウドのネットワークに加えて、kubernetesクラスタネットワーク、クラスタIP、ポッドのIPな ど • トラブったらデバッグできる自信がない 全体的に o 手軽にコンテナのデプロイ、スケールアウト、監視をするにはよい。 o 機械学習のユースケースにおいては他の機能は使わなくてもいだろう • サービスメッシュとしての機能は不要。 • kubeflowは使う予定はない。 • エンドポイントの作成やモデル推定のパイプラインは今のところ不要なため。 所感
23.
23 Proprietary and Confidential
©2017 JapanTaxi, Inc. All Rights Reserved 〒102-0094 東京都千代田区紀尾井町3-12 3-12 Kioicho Chiyoda-ku, Tokyo 102-0094 Japan TEL 03-6265-6265 FAX 03-3239-8115 www.japantaxi.co.jp 文章·画像等の内容の無断転載及び複製等の行為はご遠慮ください。 Proprietary and Confidential ©2017 JapanTaxi, Inc. All Rights Reserved
Download