第一組
廖又春
李元銘
陳育琳
AGENDA
核心目標與動機
開發流程及架構
應用及展望
Development structure and process
Achievements and prospectives
Goals and Visions
開發流程及架構 應用及展望
MOTIVATION
類流感症狀包括發燒、頭痛、肌肉痠痛、疲倦、流鼻水、喉嚨痛和咳
嗽等,嚴重時可能引發併發症,甚至導致死亡。
預測台灣及六大地區(台北區、北區、中區、南區、高屏區、東區)
未來四週的類流感門診與急診感染人數,藉此提前部署醫療設備與人
力資源,同時向民眾提供警示。
開發流程及架構 應用及展望
OUR VISION
利用Open data (疾管署)類流感確診人數作為數據,
以機器學習模型來預測未來感染數
利用Flask框架請求和回應HTTP,
視覺化預測數據
預測未來感染數 網頁展示視覺化數據
開發流程及架構 應用及展望
BENCHMARK 宏碁股份有限公司協助疾管署建置平台與提供預測模型
開發流程及架構 應用及展望
EVALUATION
核心目標與動機 應用及展望
Hit Rate 趨勢走向預測正確率
預測就診數與實際就診數的升降是否一致之比率(越高則模型對趨勢預測的準確率越高)
EVALUATION
MAPE 就診人次預測誤差率
實際就診數與預測就診數之差距比率(越低則模型預測誤差值越低)
核心目標與動機 應用及展望
EVALUATION
實際值 預測值
第一週 第二週 第三週 第四週
0
5
10
15
20
25
30
35
實際值 預測值
第一週 第二週 第三週 第四週
0
5
10
15
20
25
30
35
Hit Rate:高
MAPE:高
Hit Rate:低
MAPE:較低
核心目標與動機 應用及展望
EVALUATION
MAPE 就診人次預測誤差率
實際就診數與預測就診數之差距比率(越低則模型預測誤差值越低)
核心目標與動機 應用及展望
Hit Rate 趨勢走向預測正確率
預測就診數與實際就診數的升降是否一致之比率(越高則模型對趨勢預測的準確率越高)
MODEL
TRAINING
資料蒐集 & 探勘
資料清洗&整理
特徵工程
模型訓練 &
超參數調整
預測感染數 &
檢視模型表現
核心目標與動機 應用及展望
DATA MINING 急診傳染病監測統計-類流感: https://data.gov.tw/dataset/14584
健保門診及住院就診人次統計-類流感: https://data.gov.tw/dataset/14593
核心目標與動機 應用及展望
普查資料
每週更新
時間數列資料
DATA MINING 急診傳染病監測統計-類流感: https://data.gov.tw/dataset/14584
健保門診及住院就診人次統計-類流感: https://data.gov.tw/dataset/14593
核心目標與動機 應用及展望
普查資料
每週更新
時間數列資料
DATA MINING
台中
新北 高雄
核心目標與動機 應用及展望
台中
新北
門診_年度感染數
急診_年度感染數
年度變化
insights:
各縣市門診&急診感染數母體差異大
1.
疫情期間門診&急診感染數皆降低
2.
視覺檢查,感染數據平穩;單位根檢驗,確認為平穩數據
3.
台北
DATA MINING
台中
新北 高雄
核心目標與動機 應用及展望
台中
新北
門診_年度感染數
急診_年度感染數
年度變化
insights:
各縣市門診&急診感染數母體差異大
1.
疫情期間門診&急診感染數皆降低
2.
視覺檢查,感染數據平穩;單位根檢驗,確認為平穩數據
3.
台北
DATA MINING
台中
新北 高雄
核心目標與動機 應用及展望
台中
新北
門診_年度感染數
急診_年度感染數
年度變化
insights:
各縣市門診&急診感染數母體差異大
1.
疫情期間門診&急診感染數皆降低
2.
視覺檢查,感染數據平穩;單位根檢驗,確認為平穩數據
3.
台北
DATA MINING
台中
新北 高雄
核心目標與動機 應用及展望
台中
新北
門診_年度感染數
急診_年度感染數
年度變化
insights:
各縣市門診&急診感染數母體差異大
1.
疫情期間門診&急診感染數皆降低
2.
視覺檢查,感染數據平穩;單位根檢驗,確認為平穩數據
3.
台北
門診&急診分別訓練
資料具平穩特性
DATA MINING 感染率
台東
新竹
宜蘭
感染率 =
健保就診總人次
類流感健保就診總人次
insights:
類流感就診的人次在各縣市佔比差異大
核心目標與動機 應用及展望
DATA MINING 感染率
台東
新竹
宜蘭
感染率 =
健保就診總人次
類流感健保就診總人次
insights:
類流感就診的人次在各縣市佔比差異大
‘縣市’需作為特徵
核心目標與動機 應用及展望
DATA MINING 周期變化
insights:
急診&門診感染數在冬季皆會增長
1.
冬季變化急診比門診更劇烈,需要分開訓練
2.
門診_每週感染數
急診_每週感染數
核心目標與動機 應用及展望
DATA MINING 周期變化
insights:
急診&門診感染數在冬季皆會增長
1.
冬季變化急診比門診更劇烈,需要分開訓練
2.
門診_每週感染數
急診_每週感染數
核心目標與動機 應用及展望
感染案件變化具季節規律性
DATA MINING
insights:
疫情期間的門診&急診總感染數大幅降低
1.
2022年冬季急診驗出類流感染數量增加
2.
推測防疫降低飛沫傳染感染數,觀察流感有相同變化趨勢
3.
門診_每週感染數
急診_每週感染數
疫情間變化
核心目標與動機 應用及展望
DATA MINING
insights:
疫情期間的門診&急診總感染數大幅降低
1.
2022年冬季急診驗出類流感染數量增加
2.
推測防疫降低飛沫傳染感染數,觀察流感有相同變化趨勢
3.
門診_每週感染數
急診_每週感染數
流感_每週感染數
疫情間變化
核心目標與動機 應用及展望
DATA MINING
insights:
疫情期間的門診&急診總感染數大幅降低
1.
2022年冬季急診驗出類流感染數量增加
2.
推測防疫降低飛沫傳染感染數,觀察流感有相同變化趨勢
3.
門診_每週感染數
急診_每週感染數
流感_每週感染數
疫情間變化
核心目標與動機 應用及展望
將疫情作為特徵訓練
核心目標與動機 應用及展望
Feature Engineering
城市特徵 標籤編碼 (Label Encoding)
疫情期間變化
季節週期變化
標籤編碼 (Label Encoding)
周期性特徵編碼
城市感染率 目標編碼 (Target Encoding)
類流感高峰期 標籤編碼 (Label Encoding)
(Cyclical Feature Encoding)
年齡特徵 標籤編碼 (Label Encoding)
機器學習模型訓練
𝒴
Model
𝒳1
𝒳2
𝒳3
.
.
.
𝒳n
ARIMA
RF
XGB
SVR
Ensemble
𝒴
Model
𝒳1
𝒳2
𝒳3
.
.
.
𝒳n
急診傳染病監測統計-類流感
健保門診及住院就診人次統計-類流感
未來四週感染人數
未來四週感染人數
核心目標與動機 應用及展望
觀察特徵權重&均方差(誤差)
急診
門診
核心目標與動機 應用及展望
年、週、年齡、縣市
MSE:53,303
MSE:3,615
觀察特徵權重&均方差(誤差)
急診
門診
核心目標與動機 應用及展望
年、週、年齡、縣市
MSE:53,303
MSE:3,615
MSE:42,058
年(週期性特徵)、
週(週期性特徵)、
年齡、縣市
MSE:3,506
觀察特徵權重&均方差(誤差)
急診
門診
核心目標與動機 應用及展望
年、週、年齡、縣市
MSE:53,303
MSE:3,615
MSE:42,058
年(週期性特徵)、
週(週期性特徵)、
年齡、縣市
MSE:3,506
年(週期性特徵)、
週(週期性特徵)、
年齡、縣市
縣市(目標編碼)
MSE:40,661
MSE:1,942
觀察特徵權重&均方差(誤差)
急診
門診
核心目標與動機 應用及展望
年、週、年齡、縣市
MSE:53,303
MSE:3,615
MSE:42,058
年(週期性特徵)、
週(週期性特徵)、
年齡、縣市
MSE:3,506
年(週期性特徵)、
週(週期性特徵)、
年齡、縣市
縣市(目標編碼)
MSE:40,661
MSE:1,942
年、週、
年齡、縣市、
縣市(目標編碼)、
疫情、流感
MSE:1,594
MSE:41,630
觀察特徵權重&均方差(誤差)
急診
門診
核心目標與動機 應用及展望
年、週、年齡、縣市
MSE:53,303
MSE:3,615
MSE:42,058
年(週期性特徵)、
週(週期性特徵)、
年齡、縣市
MSE:3,506
年(週期性特徵)、
週(週期性特徵)、
年齡、縣市
縣市(目標編碼)
MSE:40,661
MSE:1,942
年、週、
年齡、縣市、
縣市(目標編碼)、
疫情、流感
MSE:1,594
MSE:41,630
歷史感染數為重要特徵
核心目標與動機 應用及展望
1到5週的滯後值 讓模型考慮歷史感染數,對未來影響。
Feature Engineering II
核心目標與動機 應用及展望
5週內最大值&最小值 捕捉極端情況,幫助預測可能的波動幅度。
1到5週的滯後值 讓模型考慮歷史感染數,對未來影響。
Feature Engineering II
核心目標與動機 應用及展望
5週移動平均值 忽略小的噪音,專注於更穩定的長期趨勢。
5週動量指標 了解數據變化的方向&速度。
5週內最大值&最小值 捕捉極端情況,幫助預測可能的波動幅度。
1到5週的滯後值 讓模型考慮歷史感染數,對未來影響。
Feature Engineering II
核心目標與動機 應用及展望
平均成長率 識別長期趨勢走向。
各週之間的成長率 數據的變化速率和增長模式。
5週移動平均值 忽略小的噪音,專注於更穩定的長期趨勢。
5週動量指標 了解數據變化的方向&速度。
5週內最大值&最小值 捕捉極端情況,幫助預測可能的波動幅度。
1到5週的滯後值 讓模型考慮歷史感染數,對未來影響。
Feature Engineering II
機器學習模型訓練
'Year', 'Week', 'Age_Group_Label', 'City_Label',
'Week_Sin', 'Week_Cos', 'Year_sin', 'Year_cos'
'flu_week', 'Covid'
'MA_5Week', 'MTM_5',
'Lag_1', 'Lag_2', 'Lag_3', 'Lag_4', 'Lag_5',
'Lag_1_to_Lag_5_Max', 'Lag_1_to_Lag_5_Min',
'Lag2_to_Lag1_Growth', 'Lag3_to_Lag2_Growth', 'Lag4_to_Lag3_Growth',
'Lag5_to_Lag4_Growth',
'Lag5_to_Lag1_Avg_Growth',
𝒴
Model
𝒳1
𝒳2
𝒳3
.
.
.
𝒳n
ARIMA
RF
XGB
SVR
Ensemble
急診傳染病監測統計-類流感 未來四週感染人數
核心目標與動機 應用及展望
核心目標與動機 應用及展望
急診
門診
年、週、
年齡、縣市、
縣市(目標編碼)、
疫情期間、流感期間
MSE:1,594
MSE:40,661
MSE:419
MSE:6,019
年、週(循環編碼)
年齡、城市、
疫情期間、流感期間
滯後特徵、成長特徵
觀察特徵權重&均方差(誤差)
核心目標與動機 應用及展望
急診
門診
年、週、
年齡、縣市、
縣市(目標編碼)、
疫情期間、流感期間
MSE:1,594
MSE:40,661
MSE:419
MSE:6,019
年、週(循環編碼)
年齡、城市、
疫情期間、流感期間
滯後特徵、成長特徵
觀察特徵權重&均方差(誤差)
滯後特徵對於模型訓練很重要
核心目標與動機 應用及展望
衡量模型準確率
過去4週預測值 VS 實際值
核心目標與動機 應用及展望
衡量模型準確率
過去4週預測值 VS 實際值
核心目標與動機 應用及展望
Model 就診誤差率 趨勢走向正確率
ARIMA 3.37% 25%
RF 3.48% 50%
SVR 8.39% 25%
XGB 3.12% 25%
Ensemble 3.71% 50%
衡量模型準確率
過去4週預測值 VS 實際值 MAPE & Hit Rate
核心目標與動機 開發流程及架構 ‧ 模型訓練架構
模型框架
http://192.168.6.121:5000/0
核心目標與動機 開發流程及架構 ‧ 模型訓練架構
模型前端展示
原始資料外,需要了解"類流感"的相關資訊與特性,並進行特徵工程以提升模
型的精準度。
特徵工程/資訊了解準備越多,就越能提高我們的預測準確性。
FUTURE
CHALLENGE
核心目標與動機 開發流程及架構 ‧ 模型訓練架構
TEAM
關於我們
廖又春
系統開發、數據分析
陳育琳
商務開發、數據分析
李元銘
數據分析、統計

More Related Content

PPTX
0603 防疫資訊與open data之雲端應用發展
PDF
CfH 網路座談 201412 第一份簡報
PPTX
CDC 105年防疫雲政策公開說明會
PPTX
(Jcmit2015)台灣防疫雲發展政策、經驗分享與未來展望
PDF
新光 防疫雲建置經驗分享1040127 講議
PPT
北醫 防疫雲建置經驗分享1040127
PPT
厚生 公開說明會 實驗室傳染病自動通報-20150127-02
PDF
Cdc 104年防疫雲發展計畫公開說明會
0603 防疫資訊與open data之雲端應用發展
CfH 網路座談 201412 第一份簡報
CDC 105年防疫雲政策公開說明會
(Jcmit2015)台灣防疫雲發展政策、經驗分享與未來展望
新光 防疫雲建置經驗分享1040127 講議
北醫 防疫雲建置經驗分享1040127
厚生 公開說明會 實驗室傳染病自動通報-20150127-02
Cdc 104年防疫雲發展計畫公開說明會

More from IttrainingIttraining (20)

PPTX
AI 認得你,也認得照片的重複 - 智慧型圖片管理系統:結合人臉辨識與重複圖片偵測技術【艾鍗學院學員專題 】
PPTX
AI 個人造型顧問:結合 Stable Diffusion 與 CLIP 的 AI 虛擬穿搭推薦系統設計【艾鍗學院學員專題 】
PPTX
「熊出沒注意!」:結合 YOLOv8 的台灣黑熊即時預警系統設計【艾鍗學院學員專題 】
PPTX
BentoCal:食物熱量健康管理系統 - 結合 YOLOv8 的便當影像辨識與熱量推估系統【艾鍗學院學員專題 】
PPTX
AI 飆股預測:你的智慧投資夥伴-基於技術分析與基本面的 AI 股價預測系統【艾鍗學院學員專題 】
PPTX
Character Generation Master 角色生成大師【艾鍗學院】
PPTX
吉伊卡哇臉盲辨識器 - 艾鍗學院學員專題 [AI人工智慧與邊緣運算工程師班]
PPTX
AI 語音複製 X 翻譯 - 艾鍗學院學員專題 [AI人工智慧與邊緣運算工程師班]
PPTX
以人工智能打造企業內部知識管理系統以PCB板為例 - 艾鍗學院學員專題 [AI人工智慧與邊緣運算工程師班]
PPTX
Scratch遊戲設計 教學培訓課程Scratch Game【台灣程式教育協進會】
PPTX
Scratch AI應用與遊戲開發 教學培訓課程【台灣程式教育協進會】
PPTX
APCS程式設計 - C++程式語言觀念 (大學程式設計先修檢測)
PPTX
艾鍗學院課程節錄 - 自然語言處理與大型語言模型(NLP,LLM,Transformer)
PPTX
艾鍗學院學員AI專題 - 飛向Kaggle宇宙🚀🚀-系外行星之光譜與物質濃度分析
PPTX
艾鍗學院學員AI專題 - AI 熱量管理師
PPTX
艾鍗學院學員AI專題 - Kaggle貸款風險預測模型開發
PPTX
艾鍗學院學員AI專題 - 串流平台Netflix 熱門電影與節目特徵分析及排行上榜預測平台
PPT
C++程式設計Basic
PPTX
第五組_速速單字書 Quickly Collect Words
PDF
第四組_產品評論情緒分析系統
AI 認得你,也認得照片的重複 - 智慧型圖片管理系統:結合人臉辨識與重複圖片偵測技術【艾鍗學院學員專題 】
AI 個人造型顧問:結合 Stable Diffusion 與 CLIP 的 AI 虛擬穿搭推薦系統設計【艾鍗學院學員專題 】
「熊出沒注意!」:結合 YOLOv8 的台灣黑熊即時預警系統設計【艾鍗學院學員專題 】
BentoCal:食物熱量健康管理系統 - 結合 YOLOv8 的便當影像辨識與熱量推估系統【艾鍗學院學員專題 】
AI 飆股預測:你的智慧投資夥伴-基於技術分析與基本面的 AI 股價預測系統【艾鍗學院學員專題 】
Character Generation Master 角色生成大師【艾鍗學院】
吉伊卡哇臉盲辨識器 - 艾鍗學院學員專題 [AI人工智慧與邊緣運算工程師班]
AI 語音複製 X 翻譯 - 艾鍗學院學員專題 [AI人工智慧與邊緣運算工程師班]
以人工智能打造企業內部知識管理系統以PCB板為例 - 艾鍗學院學員專題 [AI人工智慧與邊緣運算工程師班]
Scratch遊戲設計 教學培訓課程Scratch Game【台灣程式教育協進會】
Scratch AI應用與遊戲開發 教學培訓課程【台灣程式教育協進會】
APCS程式設計 - C++程式語言觀念 (大學程式設計先修檢測)
艾鍗學院課程節錄 - 自然語言處理與大型語言模型(NLP,LLM,Transformer)
艾鍗學院學員AI專題 - 飛向Kaggle宇宙🚀🚀-系外行星之光譜與物質濃度分析
艾鍗學院學員AI專題 - AI 熱量管理師
艾鍗學院學員AI專題 - Kaggle貸款風險預測模型開發
艾鍗學院學員AI專題 - 串流平台Netflix 熱門電影與節目特徵分析及排行上榜預測平台
C++程式設計Basic
第五組_速速單字書 Quickly Collect Words
第四組_產品評論情緒分析系統
Ad

艾鍗學院學員AI專題 - 類流感預測