面倒くさいこと考えたくない
あなたへ
〜TPOTと機械学習〜
Acroquest Technology株式会社
山本 大輝(@tereka114)
自己紹介
1. 山本 大輝(@tereka114)
2. Acroquest Technology 株式会社
3. 画像処理、データ分析
4. 「のんびりしているエンジニアの日記」
(http://nonbiri-tereka.hatenablog.com/)
機械学習にデータを入れたい?
何を考えますか?
データの加工方法?
確かにそうでしょう。
一覧化しました。
機械学習において考えないといけないこと
1. 前処理
1. 前処理の種類
2. 特徴選択
3. 特徴量加工
2. モデル
1. どんなモデルを作るか
1. Logistic Regression,
2. Random Forest
3. パラメータ
1. Ex. SVM(C, kernel ,eps etc)
4. 評価
1. Log loss, mse, rmse
考えること多すぎ!
めんどくさい
機械学習において考えないといけないこと
1. 前処理
1. 前処理の種類
1. Z変換
2. モデル
1. どんなモデルを作るか
1. Logistic Regression,
2. RandomForest
3. パラメータ
1. SVM(C, kernel ,eps etc)
4. 評価
1. Log loss, mse, rmse
自動化します。
そう、TPOTで
What is TPOT?
1. TPOTは自動的にモデル選択、パラメータの選択を
遺伝的プログラミングを使って、最適化します。
1. 遺伝的プログラミングの実装はDEAPを使っている。
2. で、何ができるの?
1. 入力した特徴量から最適化する。
2. 最適化したコードを吐き出す。
3. コマンドラインとしても実行可能
TPOT 概要
TPOT 概要
前処理 モデル構築 パラメータの最適化
TPOT Example
TPOT Example
データ作成
学習する
スコア計算する
ファイルにExport
Pipeline
TPOTクラス
1. TPOT自身は、TPOTのコードをexportする他に
predict, fit, fit_transform, score等のメソッドを持つ。
2. TPOTはscikit-learnを継承していないが、基本的に
scikit-learnと同じインターフェースとして使える。
3. 内部は全てscikit-learn
4. TPOT便利
生成コード
ここを変更する。
内部では・・・?
1. TPOTの前処理や分析は全てscikit-learnのクラスを
使っている。
1. Feature Selection等
2. 遺伝的プログラミングのコードはDEAPライブラリに
よる作成なので、パラメータ(generation)等は似て
いる。
まとめ
1. TPOTを使った簡単な機械学習に挑戦した。
2. 遺伝的プログラミングを使った最適化によって良い
処理を生成する。
3. 簡単にコードを生成し、使える。
御清聴ありがとうございました!

More Related Content

PPTX
「Python 機械学習プログラミング」 の挫折しない読み方
PPTX
Jupyter Notebookを納品した話
PDF
名古屋CV_ROSによるロボットソフトウェア開発の準備
PPTX
PPTX
総合技術特別講義講演資料2017
PDF
PyConJP2018_LT_mahjong_180918
PPTX
Alteryx UG3 LT #alteryx_ug
PDF
Mr201306 機械学習のセキュリティ技術応用
「Python 機械学習プログラミング」 の挫折しない読み方
Jupyter Notebookを納品した話
名古屋CV_ROSによるロボットソフトウェア開発の準備
総合技術特別講義講演資料2017
PyConJP2018_LT_mahjong_180918
Alteryx UG3 LT #alteryx_ug
Mr201306 機械学習のセキュリティ技術応用

Viewers also liked (9)

PDF
GBDTを使ったfeature transformationの適用例
PPTX
RandomForest
PDF
科学と機械学習のあいだ:変量の設計・変換・選択・交互作用・線形性
PPTX
10分でわかるRandom forest
PDF
Kaggleのテクニック
PDF
不均衡データのクラス分類
PDF
合成変量とアンサンブル:回帰森と加法モデルの要点
PDF
実践多クラス分類 Kaggle Ottoから学んだこと
ZIP
今さら聞けないカーネル法とサポートベクターマシン
GBDTを使ったfeature transformationの適用例
RandomForest
科学と機械学習のあいだ:変量の設計・変換・選択・交互作用・線形性
10分でわかるRandom forest
Kaggleのテクニック
不均衡データのクラス分類
合成変量とアンサンブル:回帰森と加法モデルの要点
実践多クラス分類 Kaggle Ottoから学んだこと
今さら聞けないカーネル法とサポートベクターマシン
Ad

Similar to 面倒くさいこと考えたくないあなたへ〜Tpotと機械学習〜 (6)

PPTX
実践:今日から使えるビックデータハンズオン あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門
PDF
Akira shibata at developer summit 2016
PPTX
0610 TECH & BRIDGE MEETING
PDF
実戦投入する機械学習
PDF
Jubatusにおける大規模分散オンライン機械学習
PDF
レコメンドアルゴリズムの基本と周辺知識と実装方法
実践:今日から使えるビックデータハンズオン あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門
Akira shibata at developer summit 2016
0610 TECH & BRIDGE MEETING
実戦投入する機械学習
Jubatusにおける大規模分散オンライン機械学習
レコメンドアルゴリズムの基本と周辺知識と実装方法
Ad

面倒くさいこと考えたくないあなたへ〜Tpotと機械学習〜