Submit Search
MLCT#12 使われる機能目指して 測ったり試したり
0 likes
1,994 views
Yuji Oshima
2020/05/28開催のMLCT#12のスライドです.
Technology
Read more
1 of 37
Download now
Download to read offline
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
More Related Content
PDF
Katib
Yuji Oshima
PDF
2018 07-23
Yuji Oshima
PDF
KubeFlowでどこまでいける?
Yuji Oshima
PDF
KubeFlow MeetUp #1 Katibよもやま話
Yuji Oshima
PDF
virtual-kubeletってなんだ?Alibaba Cloudで動かしてみよう
Shinya Mori (@mosuke5)
PDF
KustomizeとGitHub Actionsを利用したUbieのデプロイの仕組み
Daisuke Taniwaki
PDF
Kubernetes & Google Container Engine; DockerコンテナをGKEでクラスタリングしてみた
祐磨 堀
PDF
ChainerMNをDocker containerで動かす
Daisuke Taniwaki
Katib
Yuji Oshima
2018 07-23
Yuji Oshima
KubeFlowでどこまでいける?
Yuji Oshima
KubeFlow MeetUp #1 Katibよもやま話
Yuji Oshima
virtual-kubeletってなんだ?Alibaba Cloudで動かしてみよう
Shinya Mori (@mosuke5)
KustomizeとGitHub Actionsを利用したUbieのデプロイの仕組み
Daisuke Taniwaki
Kubernetes & Google Container Engine; DockerコンテナをGKEでクラスタリングしてみた
祐磨 堀
ChainerMNをDocker containerで動かす
Daisuke Taniwaki
What's hot
(20)
PDF
Kubeflowで何ができて何ができないのか #DEvFest18
Shunya Ueta
PPTX
Reactive Workflow Argo Eventsの紹介
Daisuke Taniwaki
PDF
知って欲しいPaaSの話
Kazuto Kusama
PDF
Pokémon GOとGCP
Google Cloud Platform - Japan
PDF
GraalVM Native Imageが見せた未来
Rakuten Group, Inc.
PDF
Google for Mobile: Google スケールで構築する! ゲームインフラと分析環境 - 橋口 剛
Google Cloud Platform - Japan
PDF
Japan Container Days: 「今こそKubernetes。最高の仕事道具で使いこなそう」by capsmalt
capsmalt
PDF
HashiCorp Terraform Enterprise 紹介
hashicorpjp
PDF
DeveloperSuccess として何を届けられるか、様々な分野を経た先として何ができるか
bitbank, Inc. Tokyo, Japan
PPTX
DockerCon '17 Feedback and Introduction of Longhorn at Rancher JP
Go Chiba
PDF
CEDEC 2015: Google スケールで実現する!ゲーム&分析基盤
Google Cloud Platform - Japan
PDF
Kubernetesのない世界 すべてがサーバーレスになる
真吾 吉田
PDF
Google Container Engine を始めてみよう
Google Cloud Platform - Japan
PDF
20201008 GitHub at Microsoft
Issei Hiraoka
PDF
Netflix Meetup in Kyoto 参加報告
tnoda
PDF
GitHub Actions で CI/CD
Issei Hiraoka
PDF
そろそろLambda(CI/CD編)
輝 子安
PDF
[CEDEC 2021] 運用中タイトルでも怖くない! 『メルクストーリア』におけるハイパフォーマンス・ローコストなリアルタイム通信技術の導入事例
Naoya Kishimoto
PDF
10分でわかる Cilium と XDP / BPF
Shuji Yamada
PDF
cndjp: 「Microclimate」by capsmalt
capsmalt
Kubeflowで何ができて何ができないのか #DEvFest18
Shunya Ueta
Reactive Workflow Argo Eventsの紹介
Daisuke Taniwaki
知って欲しいPaaSの話
Kazuto Kusama
Pokémon GOとGCP
Google Cloud Platform - Japan
GraalVM Native Imageが見せた未来
Rakuten Group, Inc.
Google for Mobile: Google スケールで構築する! ゲームインフラと分析環境 - 橋口 剛
Google Cloud Platform - Japan
Japan Container Days: 「今こそKubernetes。最高の仕事道具で使いこなそう」by capsmalt
capsmalt
HashiCorp Terraform Enterprise 紹介
hashicorpjp
DeveloperSuccess として何を届けられるか、様々な分野を経た先として何ができるか
bitbank, Inc. Tokyo, Japan
DockerCon '17 Feedback and Introduction of Longhorn at Rancher JP
Go Chiba
CEDEC 2015: Google スケールで実現する!ゲーム&分析基盤
Google Cloud Platform - Japan
Kubernetesのない世界 すべてがサーバーレスになる
真吾 吉田
Google Container Engine を始めてみよう
Google Cloud Platform - Japan
20201008 GitHub at Microsoft
Issei Hiraoka
Netflix Meetup in Kyoto 参加報告
tnoda
GitHub Actions で CI/CD
Issei Hiraoka
そろそろLambda(CI/CD編)
輝 子安
[CEDEC 2021] 運用中タイトルでも怖くない! 『メルクストーリア』におけるハイパフォーマンス・ローコストなリアルタイム通信技術の導入事例
Naoya Kishimoto
10分でわかる Cilium と XDP / BPF
Shuji Yamada
cndjp: 「Microclimate」by capsmalt
capsmalt
Ad
Similar to MLCT#12 使われる機能目指して 測ったり試したり
(20)
PDF
MediaPipeを使ったARアプリ開発事例 ~カメラをかざして家䛾中で売れるも䛾を探そう~
Chica Matsueda
PPTX
2020 08-01 ALGYAN AI&ロボティクス (1)
Akira Tateishi
PDF
Azure IoT Edge で Custom Vision
Yoshitaka Seo
PDF
Edge Computing 「あらゆるものが考える」世界を作るのに必要な技術
Takeaki Imai
PDF
WWN 20180526
陽平 山口
PDF
産業用ロボットにおけるUnityとAI技術の活用
aicube inc.
PDF
[Cloud OnAir] Google Cloud Next '18 最新情報 2018年7月26日 放送
Google Cloud Platform - Japan
PDF
TFLite_and_PyTorch_Mobile
yusuke shibui
PDF
Intel OpenVINO、 NVIDIA Deepstream対応開発キットから、 エッジサーバー、Azure Data Box Edgeまで、 Az...
IoTビジネス共創ラボ
PPTX
EnOcean-iot, Generative-AI, and RAG for LLM
Atomu Hidaka
PDF
GCPUG Sapporo vol.2 ML Night
陽平 山口
PDF
20170518 eureka dli
ManaMurakami1
PDF
[ビッグデータオールスターズ] クラウドサービス最新情報 機械学習/AIでこんなことまでできるんです! (Microsoft編)
Naoki (Neo) SATO
PPTX
AI robot car
Akira Sasaki
PPTX
エッジAiの事例を簡単に試せる!edge tpuとai初心者
ミソジ
PDF
SIAI2020
陽平 山口
PDF
Android/iOS端末におけるエッジ推論のチューニング
Deep Learning Lab(ディープラーニング・ラボ)
PPTX
モバイル向けEdgeTPUの紹介
卓然 郭
PPTX
Soracom ug
Yoshinori Hayashi
PPTX
AI x ロボティクス x ブロックチェーンによる次世代自律テクノロジー
Atsushi Ishii
MediaPipeを使ったARアプリ開発事例 ~カメラをかざして家䛾中で売れるも䛾を探そう~
Chica Matsueda
2020 08-01 ALGYAN AI&ロボティクス (1)
Akira Tateishi
Azure IoT Edge で Custom Vision
Yoshitaka Seo
Edge Computing 「あらゆるものが考える」世界を作るのに必要な技術
Takeaki Imai
WWN 20180526
陽平 山口
産業用ロボットにおけるUnityとAI技術の活用
aicube inc.
[Cloud OnAir] Google Cloud Next '18 最新情報 2018年7月26日 放送
Google Cloud Platform - Japan
TFLite_and_PyTorch_Mobile
yusuke shibui
Intel OpenVINO、 NVIDIA Deepstream対応開発キットから、 エッジサーバー、Azure Data Box Edgeまで、 Az...
IoTビジネス共創ラボ
EnOcean-iot, Generative-AI, and RAG for LLM
Atomu Hidaka
GCPUG Sapporo vol.2 ML Night
陽平 山口
20170518 eureka dli
ManaMurakami1
[ビッグデータオールスターズ] クラウドサービス最新情報 機械学習/AIでこんなことまでできるんです! (Microsoft編)
Naoki (Neo) SATO
AI robot car
Akira Sasaki
エッジAiの事例を簡単に試せる!edge tpuとai初心者
ミソジ
SIAI2020
陽平 山口
Android/iOS端末におけるエッジ推論のチューニング
Deep Learning Lab(ディープラーニング・ラボ)
モバイル向けEdgeTPUの紹介
卓然 郭
Soracom ug
Yoshinori Hayashi
AI x ロボティクス x ブロックチェーンによる次世代自律テクノロジー
Atsushi Ishii
Ad
More from Yuji Oshima
(7)
PDF
2018 07-19dist
Yuji Oshima
PPTX
KubernetesでGPUクラスタを管理したい
Yuji Oshima
PPTX
Infrakitの話とk8s+GPUの話
Yuji Oshima
PPTX
Infrakit Docker_Tokyo_meetup
Yuji Oshima
PDF
Docker1.12イングレスロードバランサ
Yuji Oshima
PDF
runC概要と使い方
Yuji Oshima
PDF
近頃のDockerネットワーク
Yuji Oshima
2018 07-19dist
Yuji Oshima
KubernetesでGPUクラスタを管理したい
Yuji Oshima
Infrakitの話とk8s+GPUの話
Yuji Oshima
Infrakit Docker_Tokyo_meetup
Yuji Oshima
Docker1.12イングレスロードバランサ
Yuji Oshima
runC概要と使い方
Yuji Oshima
近頃のDockerネットワーク
Yuji Oshima
MLCT#12 使われる機能目指して 測ったり試したり
1.
使われる機能目指して 測ったり試したり 2020-05-28 Yuji Oshima @overs_5121
2.
whoami 大嶋 悠司 Tech Lead
of EdgeAI team in Mercari ● OSS活動: ○ Kubeflow katib (owner) ○ Docker infrakit (maintainer) ● Github: YujiOshima ● Twitter: @overs_5121
3.
whoami 大嶋 悠司 Tech Lead
of EdgeAI team in Mercari ● OSS活動: ○ Kubeflow katib (owner) ○ Docker infrakit (maintainer) ● Github: YujiOshima ● Twitter: @overs_5121 今日はEdgeAI技術を使ったアプリについてお話します!
4.
Edge AI? お客様の近くのデバイス上でMLの推論を行う技術 何かしらリッチな サーバ
5.
何ができるのか 何かしらリッチな サーバ > 500m sec <
50m sec ● モデルサイズ ● 消費電力 の制限
6.
何のためにやるのか 制限は大きいが ● 低レイテンシ ● ネットを必要としない推論 によってUXを大きく改善 メルカリでは(少なくとも今の所)Edge
= モバイル
7.
Machine Learning on
Mobile
8.
やることはだいたいおんなじ モデル軽量化 ・量子化など モデル形式を変 換 モデル学習 デバイス上で 実行 現状 (2020/05) もっとも成熟しているTFLiteを選択
9.
何をつくったか 目的:バーコード出品をもっと認知してもらいたい! 手段:撮影した商品画像が本などだったら即座にバーコー ド出品をサジェストしてみては? 実装:MobileNetなどのImage Classificationモデルででき そう 参考:https://developers-jp.googleblog.com/2020/04/tensorflow-lite.html
10.
モデル学習 モデル軽量化 ・量子化など モデル形式を変 換 モデル学習 デバイス上で 実行
11.
モデル学習 基本的には普通に学習 Quantization Aware Training[1]を行った UINT8への量子化による 精度劣化を防ぐ ※ただし学習時の計算コストは上がる [1]
https://arxiv.org/abs/1712.05877
12.
モデル学習 モデル軽量化 ・量子化など モデル形式を変 換 モデル学習 デバイス上で 実行
13.
モデルサイズと推論速度 モデルサイズ >> 100MB 推論速度
>> 100m sec 推論速度 < 50 msec モデルサイズ < 10MB
14.
TF Liteの変換オプション ● FLOAT32 ○
CPUやGPUでモデルを学習・推論するときと同じ ● FLOAT16 ○ 重みを単精度で表現することで軽量化 ● Weight only quantization (UINT8) ○ 重みをUINT8量子化 ● Full quantization (UINT8) ○ 重みと活性化関数を量子化
15.
変換オプションによるサイズと速度 weight onlyで目標のlatencyは達成できるためweight only
quantを選択 File size latency FLOAT32 ☓ △ FLOAT16 △ △ weight only quant ◎ △ full quant ◯ ◎
16.
ランタイム モデル軽量化 ・量子化など モデル形式を変 換 モデル学習 デバイス上で 実行
17.
FT Lite +
delegation TF LiteはAndroid, iOSそれぞれにruntimeを用意 更にdelegationを用いてパフォーマンスを向上 ● GPU ● CoreML ● Hexagon DSP ● XNNPack 今回はdelegationなしで十分なパフォーマンス 今後やってきます!
18.
完成!!!
19.
お疲れさまでした!!!!!
20.
ほんとう? モデル軽量化 ・量子化など モデル形式を 変換 モデル学習 デバイス上で 実行 ?
21.
結果 ● タップしてくれる人が想定以上に少ない... ● バーコード出品の増加率も高くない
22.
計測改善 モデル軽量化 ・量子化など モデル形式を 変換 モデル学習 デバイス上で 実行 計測・改善
23.
モデルの問題か? ● モデルの精度は? ○ メルカリの出品画像をテスト画像&Quantize後のモデルで検証 ○
90%近い Precision が出ている ○ 恐らくはモデルの精度頑張るフェーズではない ● モデルのlatencyは? ○ それなりに古い端末でも 30 msec前後で動いている ○ それほど体験を毀損しないのでは?
24.
結果 User Interface ● 表示時間 ○
あんまり長いと邪魔だろう...4秒くらいかなあ(感覚) ○ 短すぎたのでは?
25.
各秒数でタップしたユーザ数 4 sec 表示 8
sec 表示 SEC 表示時間
26.
各秒数でタップしたユーザ数 4 sec 表示 8
sec 表示 SEC 表示時間 延ばしたほうが良さそう
27.
デザイン 仮説:お客様は文言をしっかり読んでいる(そして伝わってない) お客様とのインタラクションは十分か ● 文言 ○ そもそもバーコード出品が何かわからないのでは? ●
デザイン ○ 使用するが押せると思わないのでは?
28.
デザイン改善
29.
デザイン改善
30.
デザイン改善
31.
改善の結果 Android, iOS共にバーコード出品数増加に貢献 デザイン改善後は改善前に比べて効果が倍! 改善版はぜひお手元の端末でご確認ください! デザイン,モデルの精度,モデルのlatencyを総合的にモニタリング MLをモバイル上で使う営み UXを改善する営み
32.
UXを考えていく
33.
拡張: ● ユーザがタスクを楽しんでいる ● 責任を伴う ●
タスクに対してvisionがある 自動化 vs 拡張 自動化が可能なタスクであっても,ユーザがそれを望まないことがある その場合ユーザの能力を「拡張」するようなUIがよい 自動化: ● ユーザにタスクができない ● タスクが退屈で繰り返される https://pair.withgoogle.com/
34.
自動化の例:AI出品 商品名や詳細,カテゴリやブランドを画 像から自動で入力 何を書くか分からない場合に有効
35.
拡張の例: Mercari IME 商品タイトルや詳細に使われそうな単 語をIMEの形でサジェスト 商品出品は ●
責任を伴う ● お客様がVisionを持つ タスク
36.
拡張の例: Mercari IME 商品タイトルや詳細に使われそうな単 語をIMEの形でサジェスト 商品出品は ●
責任を伴う ● ユーザがVisionを持つ タスク 今後どこかで話します!
Download