SlideShare a Scribd company logo
アノテーションこそが本質
A B E J A セ ミ ナ ー ル ー ム 2 0 1 8 . 7 . 5 来 栖 川 電 算 取 締 役 山 口 陽 平
A B E J A C l o u d A I N i g h t A n n o t a t i o n M e e t u p # a b e j a a i
今日話すこと
1. はじめに
2. 背景
3. 来栖川電算のプロセス
4. 来栖川電算のツール
5. まとめ
2
はじめに
自己紹介 & 会社紹介
3
山 口 陽 平
@melleo1978
• 所属 & 経歴
– 有限会社 来栖川電算 取締役
– 名古屋工業大学大学院 博士前期課程修了
– IPA未踏ソフトウェア創造事業 採択
– Mashup Awards 9 優秀賞受賞
• 自己紹介 企画から実装まで全部やる人
– AI技術 & アルゴリズム の研究開発
• 文字認識,物体認識,動作認識,行動認識
– 言語処理系 の研究開発
• 分散DB,仮想機械,コンパイラ
• 好きなサービス AWS Lambda
※実物に髪の毛はありません。
4
山 口 陽 平
@melleo1978
• [実践]画像認識 を執筆 WEB+DB PRESS Vol.83
– これから画像認識をはじめる人におススメ
5
– OpenCV の使い
方や実装例
– SIFTなどの各種
アルゴリズムや
特定物体認識の
しくみ
– 精度改善への取
り組み方
来栖川電算
設立 2003年(名古屋工業大学発ベンチャー) 従業員 50人
• SF 世界の技術を実現し、社会に役立てる
– AI 技術のライセンス販売・研究・SI
• 文字認識,物体認識,動作認識,行動認識
– スマホアプリの企画・制作・運営
スマートライフ技術
NTTドコモ様との共同研究
スマートドライブ技術
大手自動車メーカー様むけ
メイドさん
もふくめて
6
技術者集団
様々なアルゴリズムや知識で課題解決
• 最先端の AI 技術
– 文字認識,物体認識,モーション認識
• 限界性能を引き出す優れた実装技術
– 機械学習・コンパイラ・データベースなどの
アルゴリズムやバイナリハックを駆使した高
精度化・高速化・省資源化・並列化・分散化
• 高品質なソフトウェアを実現する技術
– 言語・アーキテクチャ・プロセスに対する深
い理解に基づく設計と計画
7
8
なりきり2.0
ヒーローの動きでゲームを制御
毎朝体操
腕の動きで体操採点するアプリ
動作推定API
加速度センサで人の行動を推定
タンゴチュウ
写真に写る単語を抽出するサービス
地図生成
オルソ画像から地物・交通規則を抽出
走行データ解析
周辺環境を認識し、様々な解析に活用
AR付箋
書籍の中身を検索するアプリ
Cellars
ワインラベルで情報検索するアプリ
画像認識API
商品パッケージで情報検索するAPI
AnnoFab(アノテーションサービス)
高品質なアノテーションを大量に作成可能
Ahab(実験スケジューラ)
大量の実験と計算資源を効率的に管理
DNNコンパイラ
DNNの推論を10~1000倍も効率化
コミュニティ活動
様々な勉強会を積極的に主催、スタッフとして協力
9
背景
今、アノテーションがアツい
10
AI 実現のための力点
そもそも仕様(データ収集・アノテーション)は重要
1. タスク設計 重要度:40%
• システム全体のデータフローの設計
• 機械学習を適用する機能と入出力の明確化
2. データ収集・アノテーション 重要度:40%
• データの質・量・時期の計画・生産
• アノテーションルールの明確化・改良
3. 機械学習 重要度:20%
• パイプライン(学習・推論)の設計・改良
• 訓練・検証・ハイパーパラメータの調整
11
最近の傾向
深層学習以降、データ整備による性能改善がよく効く
• モデルがデータによく適合 ⇒ 切り分け◎
12
推
論
の
誤
り
性
能
の
改
善
モデルアーキテクチャの改善
データ収集・アノテーションの改善
サンプリング・シンセサイズの改善
評価手法の改善
タスク設計の改善
来栖川電算のプロセス
「データからの学び」を重視する
13
素人ができる?
そもそも想定外のケースが山ほどでてくる…
14
出典: google street view
我々は間違っている
研究者・アノテータが賢くならないとダメ
• 練習・チェックにより学ぶ機会を得る
15
アノテーション(練習)
アノテーション設計
アノテーション(本番)
チェック
学びの例
学びにより「差し戻し回数」が減ってゆく
16
ルールの例1
アノテーションが終わるたびに膨大なルールが完成
17
都合により削除
ルールの例2
具体例や判断フローチャートなど
18
都合により削除
他の知見
まずいルールには種類がある
• 時間がかかる部分
– ×作図
– ●探索 & 判断の迷い
• ブレるルール
– 主観に基づく入力
– 予測に基づく入力
• 漏れるルール
– 特定の条件でだけ囲うなど
19
来栖川電算のツール
すみません。ここからは宣伝ではないです!!!
20
高品質アノテーションを効率的に生産する
“技” が詰まったクラウドサービス
21
開始までたったの3分
カスタマイズされたエディタを利用可能(改修不要)
⇒ データをアップロードして、アノテーション仕様を入力するだけ
22
豊富な編集機能
漏れと矛盾を防ぎ迅速で正確な作業を可能にする機能が満載
⇒ 自動検査,入力補完,ショートカット,ガイド表示,検査コメント,…
23
きめ細やかな課題管理
指摘と現物を見比べながら円滑な修正が可能
⇒ タスク一覧,エディタに統合された課題管理(前頁図)
24
自動的な計測と可視化
品質や生産性に関わる様々な指標を確認可能
⇒ 差戻回数,進捗状況,作業時間,…
25
その他
徹底的な自動化支援
⇒ Web API と CLI により、大量一括処理や外部システムとの連携が容易
多言語対応
⇒ 表示されるメッセージは全て日本語と英語に対応。カスタマイズ可能
プライベートストレージ対応 ※有料オプション
⇒ セキュリティが心配な方のために、社内ストレージに対応
プロフェッショナルサービス ※有料オプション
⇒ アノテーション作業,AI開発,これらに対するコンサルティング
26
まとめ
全然、言い足りないけど
27
まとめ
来栖川電算流 アノテーションはこうしろ
• ルールが確定するまで丸投げしない
• 研究者と一緒にルール策定
• 最初にみんなで練習
• 緊密な課題管理ができるツールの使用
– ABEJA のツール
– 来栖川電算のツール
28

More Related Content

PDF
JAWS FESTA 2018 OSAKA KCI SESSION
PDF
来栖川電算の技術紹介
PPTX
Pythonで簡単動画解析
PPTX
センシングサイエンティストが経費精算を自動化したらこうなった
PDF
Casual learning machine_learning_with_excel_no1
PDF
SIAI2020
PDF
Nagoya Career Meetup 2018夏
PPTX
AIによる簡単レコメンドシステム実装
JAWS FESTA 2018 OSAKA KCI SESSION
来栖川電算の技術紹介
Pythonで簡単動画解析
センシングサイエンティストが経費精算を自動化したらこうなった
Casual learning machine_learning_with_excel_no1
SIAI2020
Nagoya Career Meetup 2018夏
AIによる簡単レコメンドシステム実装

What's hot (6)

PDF
JAWS FESTA 20191102
PPTX
第6回 Machine Learning 15minutes!
PDF
中年期ITエンジニアのキャリア発達
PDF
文科系教育におけるIT人材育成
PPTX
3Dモデル類似検索
PPTX
11月 Machine Learning15 「確証バイアスによる仮説生成に注意するとAI開発は上手くいく」
JAWS FESTA 20191102
第6回 Machine Learning 15minutes!
中年期ITエンジニアのキャリア発達
文科系教育におけるIT人材育成
3Dモデル類似検索
11月 Machine Learning15 「確証バイアスによる仮説生成に注意するとAI開発は上手くいく」
Ad

Similar to Annotation Meetup 20180705 (20)

PDF
WWN 20180526
PDF
KCI PROFILE 2021-10-07
PDF
JAWSDAYS 2018 LUNCH SESSION
PDF
AI Utilization Seminar 20190709
PDF
NGK2022S
PDF
MISO20200530
PDF
JAWSUG 20180413
PDF
JAWS-UG Nagoya 20130406 物体認識システムを支えるAWS
PDF
JAWSUG 20191028
PDF
DevLOVE20140823
PDF
JAWS DAYS 2022
PDF
JAWS DAYS 2015 PubCrawl Group1
PDF
Machine Learning Nagoya 20170619
PDF
ML@Loft 20200430
PDF
JAWSDAYS2016 ランチタイムセッション
PDF
MANABIYA Machine Learning Hands-On
PDF
JAWSUG 20191028 (modified)
PDF
オンライン講座を利用して機械学習・人工知能・ データ分析の最適な学び方を学ぶ講座
PDF
JAWSUG 20190828
PDF
JAWS-UG Nagoya 20160729
WWN 20180526
KCI PROFILE 2021-10-07
JAWSDAYS 2018 LUNCH SESSION
AI Utilization Seminar 20190709
NGK2022S
MISO20200530
JAWSUG 20180413
JAWS-UG Nagoya 20130406 物体認識システムを支えるAWS
JAWSUG 20191028
DevLOVE20140823
JAWS DAYS 2022
JAWS DAYS 2015 PubCrawl Group1
Machine Learning Nagoya 20170619
ML@Loft 20200430
JAWSDAYS2016 ランチタイムセッション
MANABIYA Machine Learning Hands-On
JAWSUG 20191028 (modified)
オンライン講座を利用して機械学習・人工知能・ データ分析の最適な学び方を学ぶ講座
JAWSUG 20190828
JAWS-UG Nagoya 20160729
Ad

More from 陽平 山口 (12)

PDF
NGK2023S ChatGPT
PDF
JAWSUG 20210128
PDF
AWS Webinar 20201224
PDF
JAWSUG 20190620
PDF
JAWS DAYS 2019
PDF
JAWS FESTA 2018 OSAKA AHAB
PDF
NAGOSUTA 20181020
PDF
JAWSUG20180925
PDF
JAWSUG名古屋 AWS勉強会 20180309
PDF
JAWSUG20171220
PDF
AI Business Challenge Day 20170316
PDF
JAWS DAYS 2017 lunch session
NGK2023S ChatGPT
JAWSUG 20210128
AWS Webinar 20201224
JAWSUG 20190620
JAWS DAYS 2019
JAWS FESTA 2018 OSAKA AHAB
NAGOSUTA 20181020
JAWSUG20180925
JAWSUG名古屋 AWS勉強会 20180309
JAWSUG20171220
AI Business Challenge Day 20170316
JAWS DAYS 2017 lunch session

Annotation Meetup 20180705