Recommended [DL輪読会]Peeking into the Future: Predicting Future Person Activities and Locat...
「機械学習:技術的負債の高利子クレジットカード」のまとめ
【DL輪読会】Scaling Laws for Neural Language Models
[DL輪読会] マルチエージェント強化学習と心の理論
【DL輪読会】Transformers are Sample Efficient World Models
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
ブレインパッドにおける機械学習プロジェクトの進め方
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
Statistical Semantic入門 ~分布仮説からword2vecまで~
BlackBox モデルの説明性・解釈性技術の実装
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
More Related Content [DL輪読会]Peeking into the Future: Predicting Future Person Activities and Locat...
「機械学習:技術的負債の高利子クレジットカード」のまとめ
【DL輪読会】Scaling Laws for Neural Language Models
What's hot (20)
[DL輪読会] マルチエージェント強化学習と心の理論
【DL輪読会】Transformers are Sample Efficient World Models
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
ブレインパッドにおける機械学習プロジェクトの進め方
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
Statistical Semantic入門 ~分布仮説からword2vecまで~
BlackBox モデルの説明性・解釈性技術の実装
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
MASTERING ATARI WITH DISCRETE WORLD MODELS (DreamerV2)
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
【LT資料】 Neural Network 素人なんだけど何とかご機嫌取りをしたい
Similar to Hidden technical debt in machine learning systems(日本語資料) (20) 東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
機械学習工学と機械学習応用システムの開発@SmartSEセミナー(2021/3/30)
Session4:「先進ビッグデータ応用を支える機械学習に求められる新技術」/比戸将平
Structural data analysis based on multilayer networks
Top-K Off-Policy Correction for a REINFORCE Recommender System
The Recommendations for DX in Commercial Education
機械学習応用システムのためのセキュリティリスク分析手法
Learning Semantic Representations for Unsupervised Domain Adaptation 論文紹介
[NeurIPS2019 論文読み会] A Meta Analysis of Overfitting in Machine Learning
授業用Twitterクライアント・アーカイブシステムの開発とその評価
機械学習デザインパターン Machine Learning Design Patterns
ヒンシツ大学セミナー ゴール指向の測定と品質保証活動 -メトリクス解説およびGqm法のワークショップ-
NeurIPS2021から見るメタ学習の研究動向 - 第83回人工知能セミナー (2022.3.7)「AIトレンド・トップカンファレンス報告会(NeurI...
More from Ogushi Masaya (11) Deep reinforcement learning for imbalanced classification
Deep and confident prediction for time series at uber
A dual stage attention-based recurrent neural network for time series prediction
How to apply deep learning to 3 d objects
自然言語処理に適した ニューラルネットのフレームワーク - - - DyNet - - -
人工知能の技術で有名なニューラルネットワークのフレームワークである #Chainer を用いた対話botを使った俺の屍を越えてゆけ slide share
Step by Stepで学ぶ自然言語処理における深層学習の勘所
Wikipedia Entity VectorとWordNetで
対話内容を選定し Chainer を用いたAttentionモデルで 発話内の重要な単語...
Chainer with natural language processing hands on
Recently uploaded (10) 世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
細胞培養用バイオリアクターおよび発酵槽市場規模の成長見通し:2031年には2823百万米ドルに到達へ
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
Qlik TECH TALK セミナー:What's New In Qlik ~ 2025年7月リリース最新機能のご紹介
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
Hidden technical debt in machine learning systems(日本語資料)2. Table of Contents
1. 関係論文
2. 背景
3. 複雑なモデルのシステム境界侵食
4. データの依存性コストはコード依存性コストより高い
5. フィードバックループ
6. 機械学習アンチパターン
7. 設定ファイル負債
8. 外部世界の変化を扱う
9. 他の領域での機械学習の負債
2
5. 機械学習のシステムの難易度について述べた論文
▸ 今回、紹介する論文
▹ Sculley D, Holt G, Golovin D, Davydov E, Phillips T, Ebner D, Chaudhary V, Young
M, Crespo JF, Dennison D. Hidden technical debt in machine learning systems.
InAdvances in neural information processing systems 2015 (pp. 2503-2511).
▹ NIPS 2015の論文
5
:
12. 絡み合い
▸ CASE(Changing Anything Changes
Everything)
▹ 少し変わると全て変更される
▹ 入力特徴量が変更される(削除、増加、変化
etc) -> モデルの重みが全て変更される
▹ 重みだけでなく、ハイパーパラメータ、学習設定なども
変更される
12
:
23. 十分活用されていないデータ依存の傾向
▸ 傾向1:
▹ Legacy Features: 開発初期の特徴は運用するに連
れて冗長になる
▸ 傾向2:
▹ Bundled Features: 適切に分離されていない特徴。
ほぼ値がないものや値が存在しない特徴が混ざる
可能性がある
▸ 傾向3:
▹ ε-Features: 精度向上のわずかに影響もしくはモデ
ルの複雑性を向上させても精度向上させている
23
:
27. データ依存性の静的解析の対策
▸ データの依存性解析ツールの詳細
▹ McMahan, H. Brendan, et al. "Ad click prediction: a view from the
trenches." Proceedings of the 19th ACM SIGKDD international
conference on Knowledge discovery and data mining. ACM, 2013.
▹ https://static.googleusercontent.com/media/research.google.com
/en//pubs/archive/41159.pdf
27
:
40. 共通する匂い
▸ Plain-Old-Data Type Smell
▹ 浮動小数点や整数などのデータが存在
▹ ログの乗数、閾値が存在
▸ Multiple-Language Smell
▹ 複数の言語で記述されている
▸ Prototype Smell
▹ 抽象化されていない、インターフェースがない、
モジュール化されていないなど
40
:
43. 設定ファイル負債
▸ 例:
▹ 特徴量A: 9/14-9/17のログが正しくない
▹ 特徴量B: 10/7前は使用できない
▹ 特徴量C: 11/1以降はログフォーマットが変更
▹ 特徴量D: プロダクションで使用不可なので代わり
のD’とD’’を使用
▹ 特徴量Z: 効率化のためルックアップテーブル用の
余分なメモリを割り当て
43
:
60. Measuring Debt and Paying it Off
▸ 技術的な負債を抱えないために効果的な5
つの質問があります。
▹ 新しいアルゴリズムを簡単にフルスケールでテストできますか
▹ 全てのデータの依存関係は把握可能か
▹ システムへの新しい変化の影響をどれだけ正確に測定できますか
▹ 1つのモデルの改善が他のモデルをどれだけ劣化させるか
▹ 新規メンバーが入った時にどれだけ早くスピードを上げられるか
60
:
62. References
62
▸ Sculley D, Holt G, Golovin D, Davydov E, Phillips T, Ebner D,
Chaudhary V, Young M, Crespo JF, Dennison D. Hidden technical
debt in machine learning systems. InAdvances in neural information
processing systems 2015 (pp. 2503-2511).
▸ 「機械学習:技術的負債の高利子クレジットカー
ド」のまとめ
▹ https://www.slideshare.net/recruitcojp/ss-
42745505
Editor's Notes #2: Icon free
http://www.flaticon.com/
イラストや
http://www.irasutoya.com/
ぱくたそ
https://www.pakutaso.com/
http://www.slidescarnival.com/ja/%E3%82%A6%E3%82%A3%E3%83%AA%E3%82%A2%E3%83%A0%E3%81%AE%E3%83%97%E3%83%AC%E3%82%BC%E3%83%B3%E3%83%86%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%83%86%E3%83%B3%E3%83%97%E3%83%AC%E3%83%BC%E3%83%88/1705 #5: 時系列の予測ではなく分類に向いている #6: 時系列の予測ではなく分類に向いている #8: 時系列の予測ではなく分類に向いている #9: 時系列の予測ではなく分類に向いている #11: 時系列の予測ではなく分類に向いている #12: 時系列の予測ではなく分類に向いている #13: 時系列の予測ではなく分類に向いている #14: 時系列の予測ではなく分類に向いている #15: 時系列の予測ではなく分類に向いている #16: 時系列の予測ではなく分類に向いている #17: 時系列の予測ではなく分類に向いている #18: 時系列の予測ではなく分類に向いている #20: 時系列の予測ではなく分類に向いている #21: 時系列の予測ではなく分類に向いている #22: 時系列の予測ではなく分類に向いている #23: 時系列の予測ではなく分類に向いている #24: 時系列の予測ではなく分類に向いている #25: 時系列の予測ではなく分類に向いている #26: 時系列の予測ではなく分類に向いている #27: 時系列の予測ではなく分類に向いている #28: 時系列の予測ではなく分類に向いている #30: 時系列の予測ではなく分類に向いている #31: 時系列の予測ではなく分類に向いている #33: 時系列の予測ではなく分類に向いている #34: 時系列の予測ではなく分類に向いている #35: 時系列の予測ではなく分類に向いている #36: 時系列の予測ではなく分類に向いている #37: 時系列の予測ではなく分類に向いている #38: 時系列の予測ではなく分類に向いている #39: 時系列の予測ではなく分類に向いている #40: 時系列の予測ではなく分類に向いている #41: 時系列の予測ではなく分類に向いている #43: 時系列の予測ではなく分類に向いている #44: 時系列の予測ではなく分類に向いている #45: 時系列の予測ではなく分類に向いている #47: 時系列の予測ではなく分類に向いている #48: 時系列の予測ではなく分類に向いている #49: 時系列の予測ではなく分類に向いている #50: 時系列の予測ではなく分類に向いている #51: 時系列の予測ではなく分類に向いている #52: 時系列の予測ではなく分類に向いている #53: 時系列の予測ではなく分類に向いている #55: 時系列の予測ではなく分類に向いている #56: 時系列の予測ではなく分類に向いている #57: 時系列の予測ではなく分類に向いている #58: 時系列の予測ではなく分類に向いている #59: 時系列の予測ではなく分類に向いている #61: 時系列の予測ではなく分類に向いている #63:
\begin{eqnarray*}
\tilde{y}_T &=& F(y_1,....y_{T-1}, \vec{x}_1,...\vec{x}_T) \\
&=& \vec{v}^T_y(\vec{W}_y[\vec{d}_T;\vec{c}_T] + \vec{b}_w) + b_v
\end{eqnarray*}