SlideShare a Scribd company logo
洞見未來,用Python 與 R
結合深度學習技術預測趨勢
丘祐瑋 – David Chiu
EMAIL: david@largitdata.com
網站: www.largitdata.com
電話: +886929094381
1
關於我
• 大數軟體有限公司創辦人
• 前趨勢科技工程師
• ywchiu.com
• 大數學堂
http://www.largitdata.com/
• 粉絲頁
https://www.facebook.com/largitdata
• R for Data Science Cookbook
https://www.packtpub.com/big-data-and-business-
intelligence/r-data-science-cookbook
• Machine Learning With R Cookbook
https://www.packtpub.com/big-data-and-business-
intelligence/machine-learning-r-cookbook
2
Machine Learning With R Cookbook (機器學習與R語言
實戰) & R for Data Science Cookbook
Author: Yu-Wei (David) Chiu
3
為什麼我們需要大數據?
4
5
6
7
Kaggle
8
9
根據個人特性精準推薦商品或服務
預測未來可能會發生的事件
10
11
在零售業
是否能預測產品銷量或客戶來客數
以擬訂銷售或進貨策略
12
在金融業
是否能預測ATM的現金需求
以決定何時補鈔
13
在製造業
是否能預測生產原料的價格波動
以決定避險或買賣策略
從資料鑒往
從資料知來14
數據分析語言
15
R & Python 資料科學分析工具
16
數據分析語言
17
R 語言
• AT&T貝爾實驗室暨S語言所發展出來的GNU 專案
• 提供統計分析與圖形視覺化功能的開來源程式語言
• 使用C, Fortran 程式設計的函式語言
18
R 語言
• S 語言的方言 (分支)
• 受到函數式程式設計語言Scheme 的啟發,因而
想將 該功能加入到 S 語言當中
• 1992年Ross Ihaka 與 Robert Gentleman 為了
教 授統計,因此開發出了 R語言
• 除了R 以外,還有S-Plus,但兩個分支走向不同 ,
一個走向社群,一個走向商業
19
R 語言
立即完成統計分析
• 數據處理
• 資料分析
• 報表製作
內建許多數學函式及圖形套件(也可安裝協力廠商套件)
• 可以結合其他語言:如Java, C++
• 免費且開源 http://cran.r-project.org/src/base/
容易擴充和客制化
20
21
使用 R
快速預測黃金價格
22
編輯區 歷史&環境
繪圖&套件&檔案控制臺
使用 Rstudio
使用Quantmod
library(quantmod)
getMetals('gold')
chartSeries(XAUaUSD)
23
產生預測結果
library(forecast)
XAUUSD %>%
ets %>%
forecast(h=30) %>%
autoplot
24
Python 語言
動態語言 (Dynamic Language)
• 於執行時期(Runtime)執行程式碼 (不用編譯)
• Dynamic Type: 函式與變數都不需要宣告類型
直譯式語言 (Interpreted Language)
每次執行後可以直接看到結果
物件導向語言 (OOP)
可執行於多平臺 (Python VM)
25
Guido van Rossum – Python 之父
26
Python 無所不在
27
Python 簡單易用
28
29
https://trends.google.com.tw/trends/explore?date=today%205-y&q=%E7%87%92%E8%82%89
使用Google Trend 預測需求
30
使用 Jupyter Notebook
31
讀取Google Trend 資料
import pandas
df = pandas.read_csv('multiTimeline.csv',
date_parser=['週'])
df.index = df['週']
df.head()
32
繪製趨勢圖表
%pylab inline
df['燒肉'].plot(kind='line')
33
使用ARIMA 產生預測
from matplotlib import pyplot
from statsmodels.tsa.arima_model import ARIMA
X = df['燒肉'].astype(float).values
size = int(len(X) * 0.66)
train, test = X[0:size], X[size:len(X)]
history = [x for x in train]
predictions = list()
for t in range(len(test)):
model = ARIMA(history, order=(5,1,0))
model_fit = model.fit(disp=0)
output = model_fit.forecast()
yhat = output[0]
predictions.append(yhat)
obs = test[t]
history.append(obs)
34
比較實際結果與預測結果
pyplot.plot(test)
pyplot.plot(predictions, color='red')
pyplot.show()
35
R v.s. Python
36
37
R & Python 像萬能的瑞士小刀
用你的想像力才能讓他充分發揮作用
深度學習
38
AlphaGO
使用深度學習技術打敗頂尖棋手39
Tesla
讓自動駕駛不再是夢想40
41
類神經網路
1. 加總收集到的訊號
2. 非線性轉換
3. 產生一個新的信號
42
• 來自同一個觀察的獨
立變數
• 必須要標準化
• 連續型數字
• Binary
• 類別資料
• Activation
Function
神經元
43
類神經網路
三層神經網路兩層神經網路
44
傳統類神經網路的問題
• 計算量太大,當時的電腦計算能力無法求出令人滿意的模型
• 效果並不較傳統機器學習演算法優秀
45
類神經網路的轉機
2006 – A fast learning algorithm for deep belief nets
提出用神經網路的非監督式學習來做為神經網路初始權重的指派
GPU 計算
分散式運算架構
46
Convolution Neural Network
47
利用 CNN 辨識影像
48
Recurrent Neural Network
RNN 的應用
49
50
LSTM
51
深度學習框架
52
Keras
Keras是一個由Python編寫而成高階類神經網路API,可接合
Tensorflow、Theano以及CNTK等深度學習框架後端
Keras 特性
• 簡易、快速設計模型原型(Keras具模組化,極簡,和可擴充性)
• 支持CNN和RNN,或二者的結合
• 可無縫切換CPU和GPU版本
53
用Keras 預測時間序列 (Python)
model = Sequential()
look_back = 1
model.add(Dense(8, input_dim=look_back, activation='relu'))
model.add(Dense(1))
model.compile(loss='mean_squared_error', optimizer='adam')
model.fit(trainX, trainY, epochs=200, batch_size=2, verbose=2)
54
用Keras 預測時間序列 (R)
model <- Sequential()
model$add(LSTM(units = 4, input_shape=c(num_steps, num_features)))
model$add(Dense(1))
keras_compile(model, loss='mean_squared_error', optimizer='adam')
keras_fit(model, X_train, y_train, batch_size = 1, epochs = 500, verbose = 1)
資料分析平台
55
統一分析環境架構
56
統一分析環境架構
關聯式資料庫支柱
佈署營運分析用的系統(BI, CRM),確保營運系統可以滲透到
業務流程中
探索支柱
可探索、測試任意類型資料,使企業可以快速從資料中獲得
新的洞察
非關聯式支柱
做初始資料加工各類資料具有相當價值,可用在低價值資料
的存儲
57
網銀
資料
臨櫃
資料
金融
商品
客戶
資料
分群、預測模組
單一視圖
資料儲存模組
報表
展現模組
手持
裝置展現模組
分析報表模組
資料交換與整合
職員
業務主管
巨量資料
處理層
巨量資料
分析展現層
輿情、網站資料
1
3
4
5
2
數位金融Big Data 平台架構模組
58
分析語言
資料庫
分析工具
應用
層
分析
層
資料
層
網路爬蟲 Open Data資料庫
儀表板
輿情分析、房屋鑑價、使用者貼標
ATM金流分析、智慧選址
59
資料分析平台
透過瀏覽器操作
資料分析平台
分析平台可以向資料庫、Hadoop
與檔案取用資料並將分析後的數據
存儲回資料庫中
60
61
SQL Server 2017
62
搭配 做視覺化呈現
THANK YOU
EMAIL: david@largitdata.com
網站: www.largitdata.com
電話: 0929094381
63

More Related Content

PDF
無中生有 - 利用外部數據打造新商業模式
PDF
python 實戰資料科學工作坊
PDF
20170430 python爬蟲攻防戰-攻防與金融大數據分析班
PDF
參考講義展示版-丘祐瑋-20170617-機器學習python入門者課程
PDF
廣宣學堂Python金融爬蟲原理班 20170416
PPTX
從統計到資料科學
PDF
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)
PDF
從網頁存取記錄瞭解使用者行為與網頁區塊貢獻分析-崔殷豪
無中生有 - 利用外部數據打造新商業模式
python 實戰資料科學工作坊
20170430 python爬蟲攻防戰-攻防與金融大數據分析班
參考講義展示版-丘祐瑋-20170617-機器學習python入門者課程
廣宣學堂Python金融爬蟲原理班 20170416
從統計到資料科學
The Data Science Program 讓公共服務變聰明的《資料科學計畫》 (蔣居裕)
從網頁存取記錄瞭解使用者行為與網頁區塊貢獻分析-崔殷豪

What's hot (20)

PDF
那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper
PDF
周世恩/資料分析前的奏曲 : 談資料收集的挑戰
PPTX
# 手把手 Python 資料分析 I
PDF
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
PDF
20161024 R語言資料分析實務 (3)
PDF
20161017 R語言資料分析實務 (2)
PDF
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
PDF
Hadoop Deployment Model @ OSDC.TW
PDF
Enterprise Data Lake in Action
PDF
20161003 R語言資料分析實務 (1)
PDF
R統計軟體 -安裝與使用
PDF
淺談台灣巨量資料產業發展現況
PDF
[系列活動] 手把手教你R語言資料分析實務
PPT
R統計軟體簡介
PDF
李慕約&王向榮/如何備料:資料的抓取、清理以及串接
PDF
資料分析的前奏曲 談資料收集的挑戰
PDF
曾韵/沒有大數據怎麼辦 ? 會計師事務所的小數據科學
PDF
Pyconf2014 lightening
PDF
[DSC 2016] 系列活動:許懷中 / R 語言資料探勘實務
PDF
給軟體工程師的不廢話 R 語言精要班
那些你知道的,但還沒看過的 Big Data 風景 ─ 致 Hadooper
周世恩/資料分析前的奏曲 : 談資料收集的挑戰
# 手把手 Python 資料分析 I
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
20161024 R語言資料分析實務 (3)
20161017 R語言資料分析實務 (2)
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
Hadoop Deployment Model @ OSDC.TW
Enterprise Data Lake in Action
20161003 R語言資料分析實務 (1)
R統計軟體 -安裝與使用
淺談台灣巨量資料產業發展現況
[系列活動] 手把手教你R語言資料分析實務
R統計軟體簡介
李慕約&王向榮/如何備料:資料的抓取、清理以及串接
資料分析的前奏曲 談資料收集的挑戰
曾韵/沒有大數據怎麼辦 ? 會計師事務所的小數據科學
Pyconf2014 lightening
[DSC 2016] 系列活動:許懷中 / R 語言資料探勘實務
給軟體工程師的不廢話 R 語言精要班
Ad

Similar to 洞見未來,用python 與 r 結合深度學習技術預測趨勢 (9)

PPTX
20151016 中興大學 big data + machine learning
PDF
machine learning introduction
 
PDF
開場致詞 -- 2014 台灣資料科學愛好者年會
PDF
Intro to Python - BMI Case Practice
PDF
20160525 跨界新識力沙龍論壇 機器學習與跨業應用展望
PPTX
3. classification and regression
PPTX
教材摘要版 -Big data-海量資料的資料採礦方法-三星課程網陳景祥顧問-20130521
PDF
20160818巨量資料的分析現況與展望(國發會) 張大明v2.1
PDF
Deep learning
20151016 中興大學 big data + machine learning
machine learning introduction
 
開場致詞 -- 2014 台灣資料科學愛好者年會
Intro to Python - BMI Case Practice
20160525 跨界新識力沙龍論壇 機器學習與跨業應用展望
3. classification and regression
教材摘要版 -Big data-海量資料的資料採礦方法-三星課程網陳景祥顧問-20130521
20160818巨量資料的分析現況與展望(國發會) 張大明v2.1
Deep learning
Ad

More from David Chiu (8)

PDF
新聞 X 謊言 用文字探勘挖掘財經新聞沒告訴你的真相(丘祐瑋)
PDF
Data Analysis - Making Big Data Work
PDF
PyCon APAC 2014 - Social Network Analysis Using Python (David Chiu)
PPTX
Big Data Analysis With RHadoop
PDF
Social Network Analysis With R
PDF
Machine Learning With R
PPTX
R language tutorial
PPT
Hidden Markov Model & Stock Prediction
新聞 X 謊言 用文字探勘挖掘財經新聞沒告訴你的真相(丘祐瑋)
Data Analysis - Making Big Data Work
PyCon APAC 2014 - Social Network Analysis Using Python (David Chiu)
Big Data Analysis With RHadoop
Social Network Analysis With R
Machine Learning With R
R language tutorial
Hidden Markov Model & Stock Prediction

洞見未來,用python 與 r 結合深度學習技術預測趨勢