SlideShare a Scribd company logo
Tableau から始める機械学習
ー やってみようPython連携
Tableau Japan
bashii-Tomohiro Iwahashi
Why Python連携?
2
R, SPSS,
SAS,KXEN,KNIME,
RapidMiner,DataRobot
Magellan Blocks
ビジネスの理解
データの理解
データの準備
予測モデルの作
成
モデルの評価
展開と共有
Tableau Prep
機械学習+BI
python
機械学習エンジンを
利用して予測機能を
拡張!
Tableau Desktop
Tableau Server
Tableau Desktop
データそのものの意
味を理解・ドメイン
知識と突き合わせる
楽できるところ
は楽をしていい
じゃん!!
学習データからモデルを作成する
4
教師あり機械学習
5
訓練データ
温度 湿度 年数 故障した
か
50 60 70 N
40 50 50 N
10 20 30 N
50 90 90 Y
②訓練データを学習
clf.fit(trainX,Y)
説明変数
trainX
目的
変数
Y
テストデータ
温度 湿度 年数 故障す
る?
50 60 70 ??
40 50 50 ??
③予測結果を導く
clf.predict(testX)
予測モデル 予測結果
教師アリ
温度 湿度 年数 故障する
確率?
50 60 70 90%
40 50 50 30%
①予測モデルの定義
clf = tree.DecisionTreeClassifier(…)
ビジネスの理解
データの理解
データの準備
予測モデルの作
成
モデルの評価
展開と共有
こんなデータがあります
7
説明変数
目的変数
定期預金を申し込むか申し込
まないのかを「予測」したい。
過去の経験から…
Bank Marketing (with social/economic context) (UCI Machine
Learning Repository)
とりあえず相関図を書いてみる。
8
ビジネスの理解
データの理解
データの準備
予測モデルの作
成
モデルの評価
展開と共有
Tableau Prepを使ってデータの準備
10
分布の確認
ユニオン・ジョイン・
ピボット
データ揺らぎの除
去
NULLデータの除
去
ビジネスの理解
データの理解
データの準備
予測モデルの作
成
モデルの評価
展開と共有
過去のデータから何らかのルールが見つけられるのでは?➡ 決定木
12
ビジネスの理解
データの理解
データの準備
予測モデルの作
成
モデルの評価
展開と共有
申し込み=Yの多い領域は?
14
15
当っている
当っている
予測No 予測Yes
実際No
実際Yes
予測No 予測Yes
実際No
実際Yes
当っている
当っている
作成したモデルを使って予測する
16
① CSVまたはDBからの取り込み
機械学習連携方法
© 2018 Tableau Software. All Rights Reserved
② 外部サービスとの連携 計算式として取得
Tabpy
温度 湿度 年数 故障?
50 60 70 Y
40 50 50 N
予測結果をバッチで
作成しTableauから
接続
予測結果をリアルタ
イムで取得したい
計算式からPython
を呼び出して、結果を
所定の位置に表示す
る
18
Tabpyって何ですか?
• 一番簡単なTabpyサンプル → 足し算
外部連携を使いま
すよ!返り値は
REALですよ。
実行されるpython
コード _arg に
Tableau からの
データが入る
Tableau から代入
するメジャーを指
定
19
List型で
Tableau に返
しますよ
表計算として
利用するので
集計になりま
すよ。
訓練データ
温度 湿度 年数 申込み
50 60 70 N
40 50 50 N
10 20 30 N
50 90 90 Y
説明変数
目的
変数
テストデータ
温度 湿度 年数 申込み
50 60 70 ??
40 50 50 ??
②予測の実施
予測モデル
予測結果
温度 湿度 年数 故障す
る?
50 60 70 Y
40 50 50 N
①予測モデルの作成
説明変数
予測モデルを作成す
るフェーズ
訓練データ
温度 湿度 年数 申込み
50 60 70 N
40 50 50 N
10 20 30 N
50 90 90 Y
説明変数
目的
変数
テストデータ
温度 湿度 年数 申込み
50 60 70 ??
40 50 50 ??
予測モデル
予測結果
説明変数
①予測モデルの作成
②予測結果を得る
温度 湿度 年数 故障す
る?
50 60 70 Y
40 50 50 N
予測モデルを利用し
て実際に予測する
フェーズ
訓練データ
テストデータ
温度 湿度 年数
50 60 70
40 50 50
デプロイ済み
予測モデル
Tabpy Server
温度 湿度 年数 申込み
50 60 70 Y
40 50 50 N
Tableau
予測結果
Tabpy Client事前に学習して
あるモデルを利用
するだけ
tabpy.query(‘def_x’ , …)
def_x
Tabpy Clientを利用した予測モデルの利用
事前に訓練デー
タをもとに学習を
しておく
Tabpy Serverにモデルをデプロイする
23
デプロイされたモデルをTableauから利用する
24
予測ができれば・・・可視化ができる!
25
予測ができれば次のビ
ジネスアクションに繫
げられる。
予測確率を
色で表現
参考リンク
26
ブログ: Tableauから始めるデータサイエンス
• 決定木モデルを使った機械学習とデータマイニングプロセスを体
験しよう!
• 過去データから学習して置いたモデルをTabpy Clientから呼び出
して予測結果を可視化する
• Tabpy Clientを使ってあらかじめ定義した関数をTableauから呼
ぶ
• GitHub-Tabpy

More Related Content

PDF
失敗から学ぶ機械学習応用
PDF
研究発表のためのプレゼンテーション技術
PPTX
【DL輪読会】時系列予測 Transfomers の精度向上手法
PDF
グラフニューラルネットワーク入門
PDF
ベイジアンモデリングによるマーケティングサイエンス〜状態空間モデルを用いたモデリング
PDF
ストリーム処理プラットフォームにおけるKafka導入事例 #kafkajp
PPTX
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
PPTX
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
失敗から学ぶ機械学習応用
研究発表のためのプレゼンテーション技術
【DL輪読会】時系列予測 Transfomers の精度向上手法
グラフニューラルネットワーク入門
ベイジアンモデリングによるマーケティングサイエンス〜状態空間モデルを用いたモデリング
ストリーム処理プラットフォームにおけるKafka導入事例 #kafkajp
DXとかDevOpsとかのなんかいい感じのやつ 富士通TechLive
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.

What's hot (20)

PDF
Optimizer入門&最新動向
PDF
ブレインパッドにおける機械学習プロジェクトの進め方
PDF
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
PDF
CV分野におけるサーベイ方法
PDF
楽しい研究のために今からできること 〜新しく研究を始める皆さんへ〜
PDF
At least onceってぶっちゃけ問題の先送りだったよね #kafkajp
PDF
Pythonではじめるロケーションデータ解析
PDF
研究効率化Tips Ver.2
PDF
4 データ間の距離と類似度
PDF
cvpaper.challenge 研究効率化 Tips
PPTX
[DL輪読会]相互情報量最大化による表現学習
PPTX
先駆者に学ぶ MLOpsの実際
PPTX
【論文紹介】How Powerful are Graph Neural Networks?
PDF
SSII2022 [OS3-01] 深層学習のための効率的なデータ収集と活用
PDF
『バックドア基準の入門』@統数研研究集会
PDF
階層ベイズとWAIC
PDF
傾向スコア解析とUplift Modelling
PDF
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
PDF
2019年度チュートリアルBPE
PDF
機械学習システムのアーキテクチャアラカルト
Optimizer入門&最新動向
ブレインパッドにおける機械学習プロジェクトの進め方
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
CV分野におけるサーベイ方法
楽しい研究のために今からできること 〜新しく研究を始める皆さんへ〜
At least onceってぶっちゃけ問題の先送りだったよね #kafkajp
Pythonではじめるロケーションデータ解析
研究効率化Tips Ver.2
4 データ間の距離と類似度
cvpaper.challenge 研究効率化 Tips
[DL輪読会]相互情報量最大化による表現学習
先駆者に学ぶ MLOpsの実際
【論文紹介】How Powerful are Graph Neural Networks?
SSII2022 [OS3-01] 深層学習のための効率的なデータ収集と活用
『バックドア基準の入門』@統数研研究集会
階層ベイズとWAIC
傾向スコア解析とUplift Modelling
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
2019年度チュートリアルBPE
機械学習システムのアーキテクチャアラカルト
Ad

Similar to Tableauから始める機械学習ーやってみようPython連携_2019-05-23 (20)

PDF
Tableau x Einstein 連 携 に 関 す る 勝 手 な 考 察
PDF
Tableau Developers Club 外部サービス連携#1 Tabpy触ってみよう#1
PPTX
Tableau r graph_theory
PPTX
Tableau r graph_theory
PPTX
リクルートを支える横断データ基盤と機械学習の適用事例
PDF
10大ニュースで振り返るPGCon2015
PDF
OSC 2020 Fukuoka IT運用自動化を支援する「運用レコメンドプラットフォーム」実現の舞台裏
PDF
トレジャーデータとtableau実現する自動レポーティング
PDF
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
PPTX
いまできるデータ分析を Power BI ではじめよう
PDF
元BIエバンジェリストが語る!脱獄matplot!
PDF
ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド
PDF
リクルート式Hadoopの使い方
PDF
Iot algyan jhirono 20190111
PDF
Example using LattePanda
PDF
[de:code 2019 振り返り Night!] Data Platform
PDF
Hivemall v0.3の機能紹介@1st Hivemall meetup
PDF
kintoneではじめるビジネスインテリジェンス
PPTX
実践:今日から使えるビックデータハンズオン あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門
PDF
TokyoR24 - PerformanceRvsC#
Tableau x Einstein 連 携 に 関 す る 勝 手 な 考 察
Tableau Developers Club 外部サービス連携#1 Tabpy触ってみよう#1
Tableau r graph_theory
Tableau r graph_theory
リクルートを支える横断データ基盤と機械学習の適用事例
10大ニュースで振り返るPGCon2015
OSC 2020 Fukuoka IT運用自動化を支援する「運用レコメンドプラットフォーム」実現の舞台裏
トレジャーデータとtableau実現する自動レポーティング
経済学のための実践的データ分析2. python, R, Jupyter notebook 事始め/統計ソフトちゃんちゃかちゃん
いまできるデータ分析を Power BI ではじめよう
元BIエバンジェリストが語る!脱獄matplot!
ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド
リクルート式Hadoopの使い方
Iot algyan jhirono 20190111
Example using LattePanda
[de:code 2019 振り返り Night!] Data Platform
Hivemall v0.3の機能紹介@1st Hivemall meetup
kintoneではじめるビジネスインテリジェンス
実践:今日から使えるビックデータハンズオン あなたはタイタニック号で生き残れるか?知的生産性UPのための機械学習超入門
TokyoR24 - PerformanceRvsC#
Ad

More from Tomohiro Iwahashi (12)

PDF
【5/28(火)開催】キッコーマン株式会社 × 株式会社キーウォーカー共催ウェビナー「事例から学ぶ!BIからAIへ一歩踏み出すために、今できることを考えよう」
PDF
Slalom(スラロム) x Snowflake x Tableau 主催:データを力に変える・データドリブン文化の広げ方について熱く語ろう!
PDF
Taleau データサイエンス勉強会 岩橋2021-04-07
PDF
20200113 tableau ds_momo
PDF
Masahiko suzuki 2021-01-13
PDF
Tableauデータサイエンス勉強会12月ライトニング_柴田さん
PDF
焼鳥屋の GMB×Tableau
PDF
焼鳥屋の GMB×Tableau
PDF
海外コミュニティの事例と Workout Wednesdayの話
PDF
How canwecollaboratew ithaiandbi-nttdata-tokai2019-0724-kubo
PDF
Tableauで実現するAI時代の次世代データ活用 (後編)
PDF
Tableauによるデータ可視化と機械学習によるデータ分析
【5/28(火)開催】キッコーマン株式会社 × 株式会社キーウォーカー共催ウェビナー「事例から学ぶ!BIからAIへ一歩踏み出すために、今できることを考えよう」
Slalom(スラロム) x Snowflake x Tableau 主催:データを力に変える・データドリブン文化の広げ方について熱く語ろう!
Taleau データサイエンス勉強会 岩橋2021-04-07
20200113 tableau ds_momo
Masahiko suzuki 2021-01-13
Tableauデータサイエンス勉強会12月ライトニング_柴田さん
焼鳥屋の GMB×Tableau
焼鳥屋の GMB×Tableau
海外コミュニティの事例と Workout Wednesdayの話
How canwecollaboratew ithaiandbi-nttdata-tokai2019-0724-kubo
Tableauで実現するAI時代の次世代データ活用 (後編)
Tableauによるデータ可視化と機械学習によるデータ分析

Recently uploaded (10)

PDF
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
PDF
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
PDF
細胞培養用バイオリアクターおよび発酵槽市場規模の成長見通し:2031年には2823百万米ドルに到達へ
PDF
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
PDF
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
PDF
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
PDF
Qlik TECH TALK セミナー:What's New In Qlik ~ 2025年7月リリース最新機能のご紹介
PDF
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
PDF
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
PDF
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research
世界半導体用酸化ハフニウム市場のサプライチェーン解析:上流、下流、収益モデル分析2025-2031
XCMSを用いた質量分析データ処理_BioCAsia2021_yamamoto.pdf
細胞培養用バイオリアクターおよび発酵槽市場規模の成長見通し:2031年には2823百万米ドルに到達へ
グローバルロープウェイ用スチールワイヤーロープ市場2025:主要企業のシェア、売上動向、競争戦略
【QYResearch】人形ロボット産業の市場構造と今後の発展方向に関する分析レポート
【QYResearch】グローバル農業機械市場の動向分析と成長戦略に関する総合調査報告
Qlik TECH TALK セミナー:What's New In Qlik ~ 2025年7月リリース最新機能のご紹介
【QYResearch】グローバルコネクタ市場の動向と将来展望に関する詳細な分析報告
商用ウェブカメラ市場:世界の産業現状、競合分析、シェア、規模、動向2025-2031年の予測
限外ろ過膜調査レポート:市場規模、シェア、産業分析データ、最新動向2025-2031 YH Research

Tableauから始める機械学習ーやってみようPython連携_2019-05-23