「AIプロダクト品質保証ガイドライン」
のご紹介:
1
http://www.qa4ai.jp/download/
For ICLR 2019 読み会 in 京都 https://connpass.com/event/127970/
機械学習技術を利用する製品やシステムの「品質保証」をどうするか。
産官学でオープンに議論し成果を出す場がQA4AIコンソーシアム。
こんな品質保証ガイドライン
• 約150ページ
2
メンバー(39名+3組織)
• 青木 利晃(北陸先端科学技術大学院大学)
• 池田 裕則(東芝インフラシステムズ)
• 石川 冬樹(国立情報学研究所、運営副委員長)
• 伊藤 宏幸(LINE)
• 猪又 憲治(三菱電機)
• 今井 健男(Idein)
• 梅津 良昭(リコー)
• 遠藤 征樹(日立産業制御ソリューションズ)
• 大西 秀一(ヴィッツ)
• 小川 秀人(日立製作所、運営副委員長)
• 荻野 恒太郎(楽天)
• 長田 健一(日立オートモティブシステムズ)
• 柏 良輔(横河電機)
• 岸 知二(早稲田大学)
• 鬼頭 正広(アイシン・コムクルーズ)
• 窪田 邦夫(カルソニックカンセイ)
• 久連石 圭(東芝)
• 黒田 園子(パナソニック)
• 榊原 彰(日本マイクロソフト)
• 佐藤 孝司(NEC、運営委員)
• 島田 さつき(富士通クォリティラボ)
• 鈴木 万治(DENSO International America)
• 鈴木 里惇(LINE)
• 妹尾 義樹(国立産業技術総合研究所)
• 田口 研治(CAV Technologies)
• 土屋 知典(富士通)
• 徳 隆宏(オムロン、運営委員)
• 徳本 晋(富士通研究所)
• 西 康晴(電気通信大学、運営委員長)
• 濱田 晃一(DeNA、運営委員)
• 日置 智之(シナモン)
• 藤井 岳(シナモン)
• 誉田 直美(NEC)
• 増田 聡(日本IBM)
• 町田 欣史(NTTデータ)
• 松原 修(富士通北陸システムズ)
• 松谷 峰生(LIFULL、運営委員)
• 光本 直樹(デンソー、運営委員)
• 鷲崎 弘宜(早稲田大学)
• 宇宙航空研究開発機構(JAXA)
研究開発部門第三研究ユニット
• ソフトウェアテスト技術振興協会(ASTER)
• 日本科学技術連盟(JUSE)
(以上五十音順、敬称略、2019年5月17日現在)
3
QA4AI ガイドライン 2019.05 版
• 品質保証活動の考え方 (5つの軸)
• 品質保証技術のカタログ
• 品質保証技術のドメインごとの検討結果
• コンテンツ生成
• スマートスピーカー
• 産業システム
• 自動運転
4
5つの軸とバランス
• 5つのちゃんと軸と、そのバランスのとり方を説明しています
• ちゃんとデータとれてる? Data Integrity
• ちゃんとモデル作って確かめた? Model Robustness
• ちゃんと対話して軌道修正できる? Process Agility
• ちゃんとお客さんと話してる? Customer Expectation
• システムのちゃんと基準を満たせそう? System Quality
5
Customer
Expectation
System
Quality
Process
Agility
Model
Robustness
Data
Integrity
品質保証技術のカタログ(一例)
• AIプロダクト固有の品質特性
• 教師あり学習のモデルに対する性能指標
• 適合率・精度、再現率、F値、ROC曲線におけるAUC、平均二乗誤差、決定係数
• 汎化性能、過学習・未学習
• 交差検証
• データに対する評価
• 規則性(傾向、分布)、訓練データと運用データの違い、
• ISO/IEC 25012 (JIS X 25012)データ品質モデル
• 頑健性
• 説明可能性
• 機械学習を用いたシステム全体における品質
などなど
6
コンテンツ生成
• 対象となる生成系システムの品質特性を評価する技術アプローチを検討した
• 例:自然さ、鮮明さ、多様さ
• 生成対象の画像・動画での学習済識別モデルを用い、識別結果分布・特徴量分布を用いて評価する
• Inception Score、Fréchet Inception Distance
• 例:動画のなめらかさ
• 画像間のOptical Flowの統計値を評価する
• 例:構造系列としての自然さ
• 身体構造上接続している器官点間の相対距離の変化量を数値化し評価する。
• 例:自然さ、鮮明さ
• GANs学習により、本物のデータであるかを判別する識別器を構築できる
• Webからイラストを収集し、崩れやノイズを付加することにより不自然な画像や動画のデータを作ることで、
品質評価AIを構築することができる。
• 例:社会的適切さ
• 検索エンジンで用いられている社会的に不適切なデータを識別するAIを用いることができる
スマートスピーカー
品質保証として考慮すべき観点について検討し,テスト方法をまとめた
性別(男女など)、年齢(高低)、トーン(アクセント、早口、声色)、
言葉の区切り位置(「天気は?/天気、は?」など)、感情(「優しい/厳しい」など)、
母国語外である言語学習者による発音
設置環境、音声ノイズ(テレビ、話し声など)、雑音ノイズ(生活音など)、
設置場所、振動(足場の不安定さによる揺れなど)、側面(反響による影響など)
話者認識、個人の特定
口調(敬語、命令語、若者言葉など)、助詞(「てにをは」のばらつきなど)、
文法(語順の変化、体言止めなど)、略語(「こいばな」といった略語、歌手名の略称など)、
同音異義語(「雨/飴」、「みたい/見たい」、同音の地名など)、
和製英語(ノートパソコン、コンセントなど)、流行語(ばえる、モヤるなど)
発音(漢字の読み方。「ついたち/いちにち」、慣用句、有名人など)、
トーン(アクセント、感情、声色など)、話し方(文章の区切り位置など)、
情報(速度、「長すぎる/短すぎる」など)
会話の多様性や、面白さ
コマンドレスポンス、音楽再生時の音質
ペアレンタルコントロール、不適切なレスポンス、プライバシー
外部デバイスの呼び出し、外部デバイスの安全性
9
産業システム
産業システム固有の特徴をまとめ,アプローチ案をまとめた
ステークホルダー多様性
大規模・複雑なシステムであり複数事業者が契約に基づいて
サブシステムの構築・運用がなされる形態が多いため、
データの整合性や、権利保護、システム全体を検証する必要がある
環境依存性
システムは5M+E(Man、Machine、Material、Measurement、Method、Environment)
の変化に晒されており、多様なデータや再現性の異なるデータを前提とした保証が必要
説明容易性
システムが妥当であることを保証するプロセス・規格が複数存在し、
エンドユーザーへの説明責任と納得を引き出す必要がある
IXI開発モデル
自動運転
• 自動運転の課題や対応案をまとめた。
• ドライバや社会は自動運転によって事故が低減することを期待する
• 開発時には想定できない様々な状況で使われる可能性がある
• ミッションクリティカル性が高く、かつ自律性が高い
• 組み込み製品である
• 課題①:未学習データに対してDNNが予測不能の挙動をする危惧がある
• しかし、運用時のあらゆるユースケースを網羅したデータセットの準備は不可能であり、
学習の網羅性、評価の網羅性の確保が困難である
• 課題②:正しく学習されていたとしても誤認識・未認識が避けられないという危惧がある
• しかしこれにより車の安心安全機能を損なってはならない
• 課題③:市場投入後の世の中の変化にDNNが対応できなくなるという危惧がある
• 例えば歩行者のファッション、車両の形状、交通状況などが市場投入の前後で大きく変わる可能性があり、
これら変化に対応しなければならない
安心のCreative Commons
• 商用(研究、開発、運用、企画等)での使用・改変可能です。
• フィードバックください
11
今日紹介した内容は一部だけです。
ガイドラインと、発表資料はWebにあげていますので、
まずはアクセスしてみてください。
12
http://www.qa4ai.jp/download/
ガイドライン本体
約150page PDF
ガイドラインを一緒に使いましょう!
• 「ちゃんと」との闘いはこれからだ!
13
最適化できるみたいだから
そのまま使ってみよう
あの野郎マジ懲りねえ・・

More Related Content

PDF
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
PDF
[ICML2019読み会in京都] Agnostic Federated Learning
PPTX
NeurIPS2018読み会@PFN a unified feature disentangler for multi domain image tran...
PDF
(Ja) A unified feature disentangler for multi domain image translation and ma...
PPTX
Unsupervised image to-image translation networks
PDF
Domain Adaptation 発展と動向まとめ(サーベイ資料)
PDF
ICDM'18 速報
PPTX
The 12th picmet japan_minitalk
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
[ICML2019読み会in京都] Agnostic Federated Learning
NeurIPS2018読み会@PFN a unified feature disentangler for multi domain image tran...
(Ja) A unified feature disentangler for multi domain image translation and ma...
Unsupervised image to-image translation networks
Domain Adaptation 発展と動向まとめ(サーベイ資料)
ICDM'18 速報
The 12th picmet japan_minitalk

What's hot (16)

PDF
国際会議 IEEE Computational Intelligence for Financial Engineering & Economics (C...
PDF
Unity道場 ロボティクス 秋のLT祭り 2021
PDF
【Unity道場 建築スペシャル2】BIMの“I”の使い方
PDF
ICML2019@Long Beach 参加速報(2日目)
PDF
AI活用の事始め~データサイエンスの観点から~
PPTX
AIとロボットが変える人の未来
PDF
私がのこすだろうたった1つの言葉
PDF
建設シミュレータOCSの開発 / OCS・VTC on Unity におけるROS対応機能について
PDF
Tokyo H2O.ai Meetup#2 by Iida
PPTX
「コンテンツ×IT」で世界と戦え!"北海道"を率いる札幌のポテンシャル
PPTX
自作プログラミング言語の集い
PDF
ドコモ5 gライフスタイル・アイデアソン
PDF
東大大学院 戦略ソフトウェア特論2021「ロボットで世界を計算可能にする」海野裕也
PDF
Unityでロボットの教師データは作れる!
PDF
ROSのロボットモデルでバーチャルロボット受肉する
PPTX
GGA、10月12日開催@G's
国際会議 IEEE Computational Intelligence for Financial Engineering & Economics (C...
Unity道場 ロボティクス 秋のLT祭り 2021
【Unity道場 建築スペシャル2】BIMの“I”の使い方
ICML2019@Long Beach 参加速報(2日目)
AI活用の事始め~データサイエンスの観点から~
AIとロボットが変える人の未来
私がのこすだろうたった1つの言葉
建設シミュレータOCSの開発 / OCS・VTC on Unity におけるROS対応機能について
Tokyo H2O.ai Meetup#2 by Iida
「コンテンツ×IT」で世界と戦え!"北海道"を率いる札幌のポテンシャル
自作プログラミング言語の集い
ドコモ5 gライフスタイル・アイデアソン
東大大学院 戦略ソフトウェア特論2021「ロボットで世界を計算可能にする」海野裕也
Unityでロボットの教師データは作れる!
ROSのロボットモデルでバーチャルロボット受肉する
GGA、10月12日開催@G's
Ad

Similar to ICLR'19 読み会 in 京都 [LT枠] AIプロダクト品質保証ガイドラインの紹介 (20)

PDF
Digital Innovation Leadership Panel Discussion
PDF
日本のテスト産業の国際競争力 ~日本をソフトウェアテスト立国にしよう~
PDF
Paradigm shifts in QA for AI products
PPT
Miu紹介最新版20130711
PDF
機械学習システムの品質保証に向けた課題とコンソーシアム活動
PDF
機械学習適用ソフトウェアの検証技術
PDF
Elithの下垣内が現在のLLM技術の最新動向や今後の開発の方向性について解説しました
PDF
石川・金沢IoTビジネス共創ラボ 第3回勉強会
PDF
機械学習品質マネジメントプロジェクトのご紹介
PDF
ソフトウェア工学における問題提起と機械学習の新たなあり方
PDF
Rsj2013 02 nakabo
PDF
日立PBI技術を用いた「デバイスフリーリモートワーク」構想
PDF
AIのリスクを一緒におさらいしましょう (推し技術:生成AI)Let's review the risks of AI together
PDF
立教大学MBA:AIの最先端技術によるこれからの価値創造
PDF
Rsj2013 03 homma
PDF
石川・金沢IoTビジネス共創ラボ 第二回勉強会「趣旨説明と活動内容について」
PDF
(拡大表示で文字が読める)2020年度日本技術士会九州本部 北九州地区継続研鑽(CPD)プログラム
PDF
アジャイル品質保証の知識体系 – SQuBOK 2020 予定より –
PPTX
エンジニアの未来サミット for student
Digital Innovation Leadership Panel Discussion
日本のテスト産業の国際競争力 ~日本をソフトウェアテスト立国にしよう~
Paradigm shifts in QA for AI products
Miu紹介最新版20130711
機械学習システムの品質保証に向けた課題とコンソーシアム活動
機械学習適用ソフトウェアの検証技術
Elithの下垣内が現在のLLM技術の最新動向や今後の開発の方向性について解説しました
石川・金沢IoTビジネス共創ラボ 第3回勉強会
機械学習品質マネジメントプロジェクトのご紹介
ソフトウェア工学における問題提起と機械学習の新たなあり方
Rsj2013 02 nakabo
日立PBI技術を用いた「デバイスフリーリモートワーク」構想
AIのリスクを一緒におさらいしましょう (推し技術:生成AI)Let's review the risks of AI together
立教大学MBA:AIの最先端技術によるこれからの価値創造
Rsj2013 03 homma
石川・金沢IoTビジネス共創ラボ 第二回勉強会「趣旨説明と活動内容について」
(拡大表示で文字が読める)2020年度日本技術士会九州本部 北九州地区継続研鑽(CPD)プログラム
アジャイル品質保証の知識体系 – SQuBOK 2020 予定より –
エンジニアの未来サミット for student
Ad

More from Takahiro Toku (7)

PPTX
How to let them in house of quality
PPTX
Jasst実行委員ってなんなん JaSST nano 第4回発表
PPTX
知らない国・プロダクトのQAを2週間で始めるこつ
PPTX
JaSST Kansai 2017 AIとテストパターン - AI and Testing Pattern-
PPTX
Asian Automation Alliance 自動化を進める・止めるにあたってのヒント
PPTX
読書感想文 20140615 医療機器ソフトウェア_検証・妥当性確認・およびコンプライアンス
PPTX
読書感想文 20140615 医療機器ソフトウェア_検証・妥当性確認・およびコンプライアンス
How to let them in house of quality
Jasst実行委員ってなんなん JaSST nano 第4回発表
知らない国・プロダクトのQAを2週間で始めるこつ
JaSST Kansai 2017 AIとテストパターン - AI and Testing Pattern-
Asian Automation Alliance 自動化を進める・止めるにあたってのヒント
読書感想文 20140615 医療機器ソフトウェア_検証・妥当性確認・およびコンプライアンス
読書感想文 20140615 医療機器ソフトウェア_検証・妥当性確認・およびコンプライアンス

ICLR'19 読み会 in 京都 [LT枠] AIプロダクト品質保証ガイドラインの紹介