SlideShare a Scribd company logo
Azure Machine Learning NLP 最新動向 2020/07/02
Azure Machine Learning NLP 最新動向 2020/07/02
Agenda
https://interpret.ml/
機械学習モデル解釈・説明のための
包括的なフレームワーク
決定木
ルールリスト
線形回帰・ロジスティック回帰
GAM2
….
SHAP
LIME
Partial Dependence
Sensitivity Analysis
Interpretability for
Text Data
https://github.com/interpretml/interpret-text
• 最先端のテキスト解釈・説明の技術を積極的に採用
• 各アルゴリズムについて、使いやすい統合 API を提供
• 対話型ダッシュボードによるインサイトの獲得を支援
各文章データのテキスト分類モデルの
解釈性・説明性の機能を提供するオープンソースライブラリ
• Classical Text Explainer
(glass-box)
• Unified Information Explainer
(post-hoc and model agnostic)
• Introspective Rationale Explainer
(plug-in during training, model agnostic)
古典的な手法 & 最先端の手法
• 古典的な機械学習パイプライン
• 前処理、エンコーディング、学習、
ハイパーパラメータチューニングが実装済み
• サポートしているモデル
• scikit-learn の線形モデル (coefs_)
• Tree ベースのアンサンブルモデル (feature_importances)
• 上記モデルの係数や重要度を利用した説明性を提供
デフォルトの設定 : 1-gram bag-of-words
+ scikit-learn count vectorizer + Logistic regression
• 相互情報量をベースにした post-hoc の
アプローチ
• DNN モデルの隠れ層について、
統一された一貫性のある説明性を提供
• 現在は BERT をサポート
• 将来的に LSTM, RNN に対応予定
Towards A Deep and Unified Understanding of Deep Neural Models in NLP, Guan et al. [ICML 2019]
• モデル学習の仕組みに埋め込むタイプ
• 内省的生成器 (Introspective Generator) を前処理で利用
• 入力テキストを根拠 (rationales) と反根拠 (anti-rationales) に分岐
• 根拠 (rationales) のみを使って、精度が最大になるように学習
• モデルは入力テキストから生成された根拠 (rationales) しか見ないため、
何が予測に影響したのかを提示可能
Rethinking Cooperative Rationalization: Introspective Extraction and Complement Control, Yu et al. [EMNLP 2019]
内省的生成器
min-max ゲーム
予測器 補完的予測器
Classical Text Explainer Unified Information
Explainer
Introspective Rationale
Explainer
Input model support Scikit-learn linear models
and tree-based models
PyTorch PyTorch
Explain BERT No Yes Yes
Explain RNN No No Yes
NLP Pipeline
Support
Handles text pre-
processing, encoding,
training, hyperparameter
tuning
Uses BERT tokenizer
however user needs to
supply trained/fine-
tuned BERT model, and
samples of trained data
Generator and predictor
modules handle the required
text pre-processing.
Demo
• Webサイト
• interpret.ml
• Interpre-text 対話型ダッシュボード
• サンプル : https://github.com/interpretml/interpret-text/tree/master/notebooks
Azure Machine Learning NLP 最新動向 2020/07/02
ユーザーの入力 特徴量
エンジニアリング
アルゴリズム
の選択
ハイパーパラメータ
のチューニング
モデルの
リーダーボード
データセット
設定と制約
76% 34% 82%
41%
88%
72%
81% 54% 73%
88% 90% 91%
95% 68%
56%
89% 89% 79%
順位 モデル スコア
1 95%
2 76%
3 53%
…
自動機械学習は与えられたデータに対して
「高精度のモデル」を構築するために、
特徴量エンジニアリング、アルゴリズム選択、ハイパーパラメータ選択を
自動で効率的に探索します。
特徴量エンジニアリング
• 欠損値の自動補完
• 特徴量変換のカスタム指定
• 自動での特徴量変換
• 時系列データ前処理の自動化
• Lag, Rolling Windows etc
• BERT Embedding 対応
※参考;How BERT is integrated into Azure automated machine learning
https://techcommunity.microsoft.com/t5/azure-ai/how-bert-is-integrated-into-azure-
automated-machine-learning/ba-p/1194657
BERT の多言語対応
• これまでは英語のみの対応
• 日本語 に対応した BERT Embedding
が特徴量として利用可能に
Demo
AutoML 日本語データ
• livedoor ニュースの多クラス分類
※コードを公開しています。
- AutoML のBERT モデルによるテキスト分類
https://medium.com/@konabuta/automl-の-bert-モデルによるテキスト分類-5758d4456975
Azure Machine Learning NLP 最新動向 2020/07/02
Agenda
https://dllab.connpass.com/event/178714/
Azure Machine Learning NLP 最新動向 2020/07/02
Azure Machine Learning NLP 最新動向 2020/07/02

More Related Content

PDF
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
PDF
BERTに関して
PDF
ChatGPTの仕組みの解説と実務でのLLMの適用の紹介_latest.pdf
PPTX
How to use in R model-agnostic data explanation with DALEX & iml
PPTX
Solving Quantitative Reasoning Problems with Language Models
PPTX
[DL輪読会]Explainable Reinforcement Learning: A Survey
PPTX
survey on math transformer 2023 0628 sato
PDF
STAIR Lab Seminar 202105
BERT の解剖学: interpret-text による自然言語処理 (NLP) モデル解釈
BERTに関して
ChatGPTの仕組みの解説と実務でのLLMの適用の紹介_latest.pdf
How to use in R model-agnostic data explanation with DALEX & iml
Solving Quantitative Reasoning Problems with Language Models
[DL輪読会]Explainable Reinforcement Learning: A Survey
survey on math transformer 2023 0628 sato
STAIR Lab Seminar 202105

Similar to Azure Machine Learning NLP 最新動向 2020/07/02 (17)

PDF
Facebookの人工知能アルゴリズム「memory networks」について調べてみた
PDF
[DL Hacks]Pretraining-Based Natural Language Generation for Text Summarizatio...
PPTX
深層学習による自然言語処理の研究動向
PDF
An efficient framework for learning sentence representations
PDF
大規模データに基づく自然言語処理
PDF
[DLLAB Engineer Days 講演資料] Automated ML & Model Interpretability
PDF
Automated ml & model interpretability
PDF
広告文生成タスクの規定とベンチマーク構築
PPTX
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
PDF
BERT+XLNet+RoBERTa
PDF
自然言語処理分野の最前線(ステアラボ人工知能シンポジウム2017)
PDF
CluBERT: A Cluster-Based Approach for Learning Sense Distributions in Multipl...
PDF
ElectraとpQRNNについて
PPTX
LLM は言葉の意味を理解しているのか?
PDF
Hands on-ml section1-1st-half-20210317
PDF
東京大学2021年度深層学習(Deep learning基礎講座2021) 第8回「深層学習と自然言語処理」
PDF
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」(一部文字が欠けてます)
Facebookの人工知能アルゴリズム「memory networks」について調べてみた
[DL Hacks]Pretraining-Based Natural Language Generation for Text Summarizatio...
深層学習による自然言語処理の研究動向
An efficient framework for learning sentence representations
大規模データに基づく自然言語処理
[DLLAB Engineer Days 講演資料] Automated ML & Model Interpretability
Automated ml & model interpretability
広告文生成タスクの規定とベンチマーク構築
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」
BERT+XLNet+RoBERTa
自然言語処理分野の最前線(ステアラボ人工知能シンポジウム2017)
CluBERT: A Cluster-Based Approach for Learning Sense Distributions in Multipl...
ElectraとpQRNNについて
LLM は言葉の意味を理解しているのか?
Hands on-ml section1-1st-half-20210317
東京大学2021年度深層学習(Deep learning基礎講座2021) 第8回「深層学習と自然言語処理」
東京大学2020年度深層学習(Deep learning基礎講座) 第9回「深層学習と自然言語処理」(一部文字が欠けてます)
Ad

More from Keita Onabuta (9)

PDF
Azure における強化学習への取り組み
PDF
Azure Machine Learning Build 2020
PDF
DataDrift in Azure Machine Learning
PDF
Azure ML - OpenVINO 師走の推論ナイト 20191211 講演資料
PDF
AutoML & InterpretML (2019/11/27 Deep Learning Lab 講演資料)
PDF
Azure Machine Learning アップデートセミナー 20191127
PDF
品質管理 & 設備保全のための機械学習入門 2019年9月 (Quality Control and Predictive Maintenance App...
PDF
Neural Network Intelligence 概要 (AutoML Platform)
PDF
Azure machine learning service 最新の機械学習プラットフォーム
Azure における強化学習への取り組み
Azure Machine Learning Build 2020
DataDrift in Azure Machine Learning
Azure ML - OpenVINO 師走の推論ナイト 20191211 講演資料
AutoML & InterpretML (2019/11/27 Deep Learning Lab 講演資料)
Azure Machine Learning アップデートセミナー 20191127
品質管理 & 設備保全のための機械学習入門 2019年9月 (Quality Control and Predictive Maintenance App...
Neural Network Intelligence 概要 (AutoML Platform)
Azure machine learning service 最新の機械学習プラットフォーム
Ad

Recently uploaded (9)

PDF
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
PDF
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
PDF
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
PDF
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
PDF
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
PDF
【QYResearch】グローバル磁性材料産業チェーンの構造分析と市場動向の詳細解説
PDF
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
PDF
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
PDF
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
【QYResearch】グローバル磁性材料産業チェーンの構造分析と市場動向の詳細解説
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031

Azure Machine Learning NLP 最新動向 2020/07/02