인공지능–빅데이터 응용 시스템
개발 방법론
1. 과제 배경
〮인체 건강을 심각하게 위협하는 이상기후 현상
이 잦아짐
〮이상기후에 의한 다양한 질병을 예측하고 대응
능력 강화를 위한 대책마련이 시급
〮날씨와 질병에 관한 기존의 연구 존재
- 선행연구는 사망자수 예측, 날씨와 질병의 상
관관계를 도출하여 리스크 관리의 필요성 주장
〮기후변화로 인한 환자수 예측 연구 부재
〮프로젝트 수행을 위한 전수 자료 존재
- 질병 발생현황(2001~2017년, 건강보험공단)
- 통계청사망원인통계(1983~2016년, 통계청)
- 온·습도, 체감온도, 강수량 등(1904~2018년, 기상
청)
〮빅데이터 분석을 위한 다양한 도구 존재
- 빅데이터 DB(구글 트렌드, 네이버 트렌드)
기후변화는
질병 발생의
중요한 요인
정보공개
확대와 분석
기법 고도화
환자수 예측의
중요성
폭염환자 연평균 1.7만명
진료비 5년 새 1.6배 증가 (한겨레,2018.08.02)
매서운 동장군에 한랭질환 급증
한 달 새 7명 숨져 (YTN,2018.01.10)
2. 과제 목표
 기존의 연구나 과제들이 단순히 질병과 기후의 관계를 보는 연구에 집중
되어 있다면, 본 연구는 이러한 질병과 기후 관계 뿐만 아니라 다양한 빅
데이터를 추가하여, 인공지능 및 머신러닝 방법으로 통한 독감, 폐렴, 수
족구 등과 같은 질병에 대한 실시간 예측 모델을 구축하고자 함
 이러한 모델을 통해 질병에 대해 기존 방식보다 빠르게 환자수를 예측할
수 있는 장점이 있고, 이에 대한 선제 대응이 가능하기 때문에 실시간 시
스템을 구축할 경우 조기경보, 사전 예방 관리할 수 있는 장점이 존재함
과제 단계별 목표
환자수 실시간 예측
모델 계획, 구축 및
활용방안 구상
빅데이터를 이용한
실시간 환자수 예측
모델 활용
질병 선제 대응
조기 경보 시스템 구축
1차 목표 2차 목표 기대효과
3. 과제 내용
Data
기상
자료
질병 관련
데이터
구글&
네이버
빅데이터
출처: 기상청
기간:
2016.01~현재
내용:기온,체감온도,
강수량,습도,
열지수 등
출처: 통계청
기간: 2016.01~현재
내용: 질병 발생현황
사망원인통계
출처: 구글 / 네이버
기간: 2016.01~현재
내용: 검색어 그래프,
CSV파일(검색량)
/ 성별, 연령 등
3.1. 질병 발생 현황 데이터 (통계청 자료)
 연령별, 성별, 지역별, 월별, 전염병 군별 등 발생·사망 현황 조회 가능
질병 발생 현황 연령별 예시
3.1. 사망원인 데이터 (통계청 자료)
 연령별, 성별, 연도별, 사망원인별 사망자수· 사망률 조회 가능
사망원인통계 예시
사망원인통계 예시
3.2. 기상청 데이터
 기상청은 기상자료개방포털을 통해 다양한 기상자료를 제공함
3.3. 빅데이터 수집(구글 트렌드)
3.3. 빅데이터 수집(네이버 트렌드)
4. 과제 추진 방법
관련 검색어, 기후인자, 각 질병에 대한 환자 데이터
수집
각 질병에 따라 새롭게 추가되어야 할 요인에 대한 탐
색과 변수 투입을 거친 알고리즘 개발 및 예측 모델
구축
독감 환자 예측 모델 예시
출처: 우종필 외(2018). 빅데이터를 이용한 독감, 폐렴 및 수족구 환자수 예측 모델. 한국경영정보학회 학술대회
모델의 구성
 보건의료 빅데이터 개방시스템에서 인플루엔자 환자수에 대한 월별 데이터
를 얻음 (2016년 부터 2017년 8월까지 학습 후, 현재까지 예측)
 이 데이터를 바탕으로 독감에 영향을 미칠 다양한 빅데이터를 네이버, 구글,
기상청에서 추출 한 후, 인공지능을 이용하여 환자수를 예측
 예측모델의 경우, 하나의 분석기법에 의존하지 않고 다양한 분석을 이용하
여 환자수를 예측하여 오차율을 최소화 함(구글 트렌드에서의 실패를 최소
화 하려 노력)
 월별 제공 데이터를 일별 환자수로 예측 가능한 수준으로 향상 시킴
 분석 툴: SPSS, Modeler
데이터 프로세스 과정
기존
독감환자 데이터
실시간 환자
예측 데이터
환자
알고리즘
환자 예측
IBM SPSS 예시
IBM SPSS (Modeler) 예시
Model 1 Random Forest
실제 환자 및 예측 환자수 예시
모델 가중치 예시(인공신경망)
모델 가중치 예시
Model 2 선형 AS
Model 3 LSVM
Total Models
O월 예측 환자수 예시
날짜 (O월 부분) 예측 환자수
2017-00-24 5380
2017-00-25 2230
2017-00-26 3690
2017-00-27 650
2017-00-28 3280
2017-00-29 3230
2017-00-30 1070
O월 예측 환자수 19,530
폐렴 환자 모델 예시
출처: 우종필 외(2018). 빅데이터를 이용한 독감, 폐렴 및 수족구 환자수 예측 모델. 한국경영정보학회 학술대회
Model 1 선형
실제 환자 및 예측 환자수 예시
Model 2 선형 회귀
Model 3($L1) 선형 AS
수족구 및 구내염 환자 모델 예시
출처: 우종필 외(2018). 빅데이터를 이용한 독감, 폐렴 및 수족구 환자수 예측 모델. 한국경영정보학회 학술대회
Model 1 인공신경망
실제 환자 및 예측 환자수 예시
Model ($L) 선형회귀
참고문헌
 Kelly H, Grant K (2009) Interim analysis of pandemic influenza (H1N1) 2009 in Australia:
surveillance trends, age of infection and effectiveness of seasonal vaccination. Euro Surveill.
14(31): pii=19288. Available:http://www.eurosurveillance.org/ViewArticle.aspx?ArticleId=19288.
 McMichael, A. J. (2003). Global climate change and health: an old story writ large. Climate
change and human health: Risks and responses. Geneva, Switzerland: World Health organization.
 Wilson N, Mason K, Tobias M, Peacey M, Huang QS, et al. (2009) Interpreting ‘‘GFT’’ Data for
Pandemic H1N1: The New Zealand Experience. EuroSurveill 14(44): pii = 19386. Available:
http://www.eurosurveillance.org/ViewArticle. aspx?ArticleId = 19386.
 김기연, 김언찬, 노상현, 임동욱, 정진우. (2017). 기상 기후 및 질병 빅데이터 기반의 질병 예측 및
건강 정보 어플리케이션의 구현. In Proceedings of KIIT Summer Conference, 496-497.
 김동환, 이동성, 문태훈, 정수영, 이경택, 채여라. (2016). 기후변화 대응역량 강화를 위한 시스템다
이내믹스 모델 개발. 사업보고서, 2016(0), 1-121.
 김오식. (2017). 기상기후 변화가 인간 질병에 미치는 영향. 환경과학기술, 63-79.
 배현주, 정다운, 간순영, 박주영, 임연희. (2017). 이상기온에 따른 건강영향 평가·예측을 통한 기후
변화 대응 전략 마련. 기후환경정책연구, 2017, 1-137.
 신호성, 정기혜, 윤시몬, 이수형. (2009). 기후변화와 식중독 발생 예측. 보건사회연구, 29(1), 143-
162.
 우종필, 이병욱, 이차민, 이지은, 김민성, 황재원. (2018). 빅데이터를 이용한 독감, 폐렴 및 수족구
환자수 예측 모델. 한국경영정보학회 학술대회, 333-348.
 채수미, 김동진, 윤석준, 신호성. (2014). 기온과 지역특성이 말라리아 발생에 미치는 영향. 보건사
회연구, 34(1), 436-455.
감사합니다. Q&A

More Related Content

PPTX
Big data2
PDF
병원 의료 및 제약 Bigdata 활용 마케팅전략
PPTX
170717_rnd Policy Trend in medical ai + bigdata_f
PDF
헬스케어 빅데이터 동향
PPTX
빅데이터
PDF
국내외 보건의료 빅데이터 현황 및 과제
PDF
국내외 보건의료 빅데이터 현황 및 과제
PPTX
재난안전위험 사회와 정보소통14
Big data2
병원 의료 및 제약 Bigdata 활용 마케팅전략
170717_rnd Policy Trend in medical ai + bigdata_f
헬스케어 빅데이터 동향
빅데이터
국내외 보건의료 빅데이터 현황 및 과제
국내외 보건의료 빅데이터 현황 및 과제
재난안전위험 사회와 정보소통14

Similar to [2018 Bigdata win-win conference] 3 (20)

PDF
미세먼지와 호흡기 질환의 연관관계 규명(제13회 SAS 분석챔피언십, 입상작)
PDF
연구자를 위한 국가과제 및 연구실 운영 소개
PDF
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
PPTX
재난안전위험 사회와 정보소통12
PDF
빅데이터의 다음 단계는 예측 분석이다
PDF
Health informaticssejioh july22_2018
PDF
20171129 medical ai medical device policy and healthcare industry in korea(h....
PDF
데이터과학의 정의와 대표과제 도출
PDF
Seoung-Ho Choi Introduction to medical deep learning
PDF
AI/빅데이터 기반 사회 현안 문제 해결 특허 사례 연구
PDF
[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향
PDF
4차산업혁명시대의 의과학교육
DOCX
예측 분석 산업별 사례 147
PPTX
빅데이터의 이해
PPTX
농업 빅데이터를 활용한 병해충 발생 예측 모형
PPTX
Big Data Analytics and Data Mining
PPTX
Src슬라이드(1총괄2세부) 오희석
PDF
제1부 전략과 분석 제3장 수요예측
PPTX
Src슬라이드(3총괄2세부) 유경상
PDF
privacy considerations for contact tracking and location disclosure
미세먼지와 호흡기 질환의 연관관계 규명(제13회 SAS 분석챔피언십, 입상작)
연구자를 위한 국가과제 및 연구실 운영 소개
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
재난안전위험 사회와 정보소통12
빅데이터의 다음 단계는 예측 분석이다
Health informaticssejioh july22_2018
20171129 medical ai medical device policy and healthcare industry in korea(h....
데이터과학의 정의와 대표과제 도출
Seoung-Ho Choi Introduction to medical deep learning
AI/빅데이터 기반 사회 현안 문제 해결 특허 사례 연구
[2016 데이터 그랜드 컨퍼런스] 6 4(전략,솔루션). 신테카바이오 insilico-임상연구동향
4차산업혁명시대의 의과학교육
예측 분석 산업별 사례 147
빅데이터의 이해
농업 빅데이터를 활용한 병해충 발생 예측 모형
Big Data Analytics and Data Mining
Src슬라이드(1총괄2세부) 오희석
제1부 전략과 분석 제3장 수요예측
Src슬라이드(3총괄2세부) 유경상
privacy considerations for contact tracking and location disclosure
Ad

More from ABRC_DATA (20)

PPTX
[2018 Bigdata win-win conference] 4
PDF
[2018 Bigdata win-win conference] 5
PDF
[2018 Bigdata win-win conference] 2
PDF
[2018 Bigdata win win conference] 1
PDF
[중소기업형 인공지능/빅데이터 기술 심포지엄] 온라인 고객 리뷰 빅데이터 신뢰도,방향성 분석 시스템
PDF
[중소기업형 인공지능/빅데이터 기술 심포지엄] 대용량 거래데이터 분석을 위한 서버인프라 활용 사례
PDF
[중소기업형 인공지능/빅데이터 기술 심포지엄] 머신러닝 기반 군 전력장비 수리부속/장비수요 예측시스템
PDF
[중소기업형 인공지능/빅데이터 기술 심포지엄] LSTM기반 가스 배관 안전도 예측 시스템
PDF
[중소기업형 인공지능/빅데이터 기술 심포지엄] 워드벡터를 활용한 관광지 리뷰 분석시스템
PDF
[중소기업형 인공지능/빅데이터 기술 심포지엄] 데이터 전처리 기법 및 도구
PDF
[중소기업형 인공지능/빅데이터 기술 심포지엄] 국내 인공지능-빅데이터 산업의 문제점 및 해결방안
PDF
빅데이터 윈윈 컨퍼런스-빅데이터생태계 확산전략
PDF
빅데이터 윈윈 컨퍼런스-데이터수집 및 정제
PDF
빅데이터 윈윈 컨퍼런스-4차 산업혁명 핵심:데이터 가공 플랫폼
PDF
빅데이터 윈윈 컨퍼런스-지능형 보험 부당청구탐지와 예측
PPTX
빅데이터 윈윈 컨퍼런스-장비지원 사례연구
PDF
빅데이터 윈윈 컨퍼런스_빅데이터 기반 지능형 도시가스 배관 위험 예측 기술 개발
PDF
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
PDF
빅데이터윈윈 컨퍼런스_대용량 데이터 분석 시스템 구축사례
PDF
빅데이터윈윈 컨퍼런스_데이터시각화자료
[2018 Bigdata win-win conference] 4
[2018 Bigdata win-win conference] 5
[2018 Bigdata win-win conference] 2
[2018 Bigdata win win conference] 1
[중소기업형 인공지능/빅데이터 기술 심포지엄] 온라인 고객 리뷰 빅데이터 신뢰도,방향성 분석 시스템
[중소기업형 인공지능/빅데이터 기술 심포지엄] 대용량 거래데이터 분석을 위한 서버인프라 활용 사례
[중소기업형 인공지능/빅데이터 기술 심포지엄] 머신러닝 기반 군 전력장비 수리부속/장비수요 예측시스템
[중소기업형 인공지능/빅데이터 기술 심포지엄] LSTM기반 가스 배관 안전도 예측 시스템
[중소기업형 인공지능/빅데이터 기술 심포지엄] 워드벡터를 활용한 관광지 리뷰 분석시스템
[중소기업형 인공지능/빅데이터 기술 심포지엄] 데이터 전처리 기법 및 도구
[중소기업형 인공지능/빅데이터 기술 심포지엄] 국내 인공지능-빅데이터 산업의 문제점 및 해결방안
빅데이터 윈윈 컨퍼런스-빅데이터생태계 확산전략
빅데이터 윈윈 컨퍼런스-데이터수집 및 정제
빅데이터 윈윈 컨퍼런스-4차 산업혁명 핵심:데이터 가공 플랫폼
빅데이터 윈윈 컨퍼런스-지능형 보험 부당청구탐지와 예측
빅데이터 윈윈 컨퍼런스-장비지원 사례연구
빅데이터 윈윈 컨퍼런스_빅데이터 기반 지능형 도시가스 배관 위험 예측 기술 개발
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
빅데이터윈윈 컨퍼런스_대용량 데이터 분석 시스템 구축사례
빅데이터윈윈 컨퍼런스_데이터시각화자료
Ad

[2018 Bigdata win-win conference] 3

  • 2. 1. 과제 배경 〮인체 건강을 심각하게 위협하는 이상기후 현상 이 잦아짐 〮이상기후에 의한 다양한 질병을 예측하고 대응 능력 강화를 위한 대책마련이 시급 〮날씨와 질병에 관한 기존의 연구 존재 - 선행연구는 사망자수 예측, 날씨와 질병의 상 관관계를 도출하여 리스크 관리의 필요성 주장 〮기후변화로 인한 환자수 예측 연구 부재 〮프로젝트 수행을 위한 전수 자료 존재 - 질병 발생현황(2001~2017년, 건강보험공단) - 통계청사망원인통계(1983~2016년, 통계청) - 온·습도, 체감온도, 강수량 등(1904~2018년, 기상 청) 〮빅데이터 분석을 위한 다양한 도구 존재 - 빅데이터 DB(구글 트렌드, 네이버 트렌드) 기후변화는 질병 발생의 중요한 요인 정보공개 확대와 분석 기법 고도화 환자수 예측의 중요성 폭염환자 연평균 1.7만명 진료비 5년 새 1.6배 증가 (한겨레,2018.08.02) 매서운 동장군에 한랭질환 급증 한 달 새 7명 숨져 (YTN,2018.01.10)
  • 3. 2. 과제 목표  기존의 연구나 과제들이 단순히 질병과 기후의 관계를 보는 연구에 집중 되어 있다면, 본 연구는 이러한 질병과 기후 관계 뿐만 아니라 다양한 빅 데이터를 추가하여, 인공지능 및 머신러닝 방법으로 통한 독감, 폐렴, 수 족구 등과 같은 질병에 대한 실시간 예측 모델을 구축하고자 함  이러한 모델을 통해 질병에 대해 기존 방식보다 빠르게 환자수를 예측할 수 있는 장점이 있고, 이에 대한 선제 대응이 가능하기 때문에 실시간 시 스템을 구축할 경우 조기경보, 사전 예방 관리할 수 있는 장점이 존재함
  • 4. 과제 단계별 목표 환자수 실시간 예측 모델 계획, 구축 및 활용방안 구상 빅데이터를 이용한 실시간 환자수 예측 모델 활용 질병 선제 대응 조기 경보 시스템 구축 1차 목표 2차 목표 기대효과
  • 5. 3. 과제 내용 Data 기상 자료 질병 관련 데이터 구글& 네이버 빅데이터 출처: 기상청 기간: 2016.01~현재 내용:기온,체감온도, 강수량,습도, 열지수 등 출처: 통계청 기간: 2016.01~현재 내용: 질병 발생현황 사망원인통계 출처: 구글 / 네이버 기간: 2016.01~현재 내용: 검색어 그래프, CSV파일(검색량) / 성별, 연령 등
  • 6. 3.1. 질병 발생 현황 데이터 (통계청 자료)  연령별, 성별, 지역별, 월별, 전염병 군별 등 발생·사망 현황 조회 가능
  • 7. 질병 발생 현황 연령별 예시
  • 8. 3.1. 사망원인 데이터 (통계청 자료)  연령별, 성별, 연도별, 사망원인별 사망자수· 사망률 조회 가능
  • 11. 3.2. 기상청 데이터  기상청은 기상자료개방포털을 통해 다양한 기상자료를 제공함
  • 14. 4. 과제 추진 방법 관련 검색어, 기후인자, 각 질병에 대한 환자 데이터 수집 각 질병에 따라 새롭게 추가되어야 할 요인에 대한 탐 색과 변수 투입을 거친 알고리즘 개발 및 예측 모델 구축
  • 15. 독감 환자 예측 모델 예시 출처: 우종필 외(2018). 빅데이터를 이용한 독감, 폐렴 및 수족구 환자수 예측 모델. 한국경영정보학회 학술대회
  • 16. 모델의 구성  보건의료 빅데이터 개방시스템에서 인플루엔자 환자수에 대한 월별 데이터 를 얻음 (2016년 부터 2017년 8월까지 학습 후, 현재까지 예측)  이 데이터를 바탕으로 독감에 영향을 미칠 다양한 빅데이터를 네이버, 구글, 기상청에서 추출 한 후, 인공지능을 이용하여 환자수를 예측  예측모델의 경우, 하나의 분석기법에 의존하지 않고 다양한 분석을 이용하 여 환자수를 예측하여 오차율을 최소화 함(구글 트렌드에서의 실패를 최소 화 하려 노력)  월별 제공 데이터를 일별 환자수로 예측 가능한 수준으로 향상 시킴  분석 툴: SPSS, Modeler
  • 17. 데이터 프로세스 과정 기존 독감환자 데이터 실시간 환자 예측 데이터 환자 알고리즘 환자 예측
  • 20. Model 1 Random Forest
  • 21. 실제 환자 및 예측 환자수 예시
  • 27. O월 예측 환자수 예시 날짜 (O월 부분) 예측 환자수 2017-00-24 5380 2017-00-25 2230 2017-00-26 3690 2017-00-27 650 2017-00-28 3280 2017-00-29 3230 2017-00-30 1070 O월 예측 환자수 19,530
  • 28. 폐렴 환자 모델 예시 출처: 우종필 외(2018). 빅데이터를 이용한 독감, 폐렴 및 수족구 환자수 예측 모델. 한국경영정보학회 학술대회
  • 30. 실제 환자 및 예측 환자수 예시
  • 31. Model 2 선형 회귀
  • 33. 수족구 및 구내염 환자 모델 예시 출처: 우종필 외(2018). 빅데이터를 이용한 독감, 폐렴 및 수족구 환자수 예측 모델. 한국경영정보학회 학술대회
  • 35. 실제 환자 및 예측 환자수 예시
  • 37. 참고문헌  Kelly H, Grant K (2009) Interim analysis of pandemic influenza (H1N1) 2009 in Australia: surveillance trends, age of infection and effectiveness of seasonal vaccination. Euro Surveill. 14(31): pii=19288. Available:http://www.eurosurveillance.org/ViewArticle.aspx?ArticleId=19288.  McMichael, A. J. (2003). Global climate change and health: an old story writ large. Climate change and human health: Risks and responses. Geneva, Switzerland: World Health organization.  Wilson N, Mason K, Tobias M, Peacey M, Huang QS, et al. (2009) Interpreting ‘‘GFT’’ Data for Pandemic H1N1: The New Zealand Experience. EuroSurveill 14(44): pii = 19386. Available: http://www.eurosurveillance.org/ViewArticle. aspx?ArticleId = 19386.  김기연, 김언찬, 노상현, 임동욱, 정진우. (2017). 기상 기후 및 질병 빅데이터 기반의 질병 예측 및 건강 정보 어플리케이션의 구현. In Proceedings of KIIT Summer Conference, 496-497.  김동환, 이동성, 문태훈, 정수영, 이경택, 채여라. (2016). 기후변화 대응역량 강화를 위한 시스템다 이내믹스 모델 개발. 사업보고서, 2016(0), 1-121.  김오식. (2017). 기상기후 변화가 인간 질병에 미치는 영향. 환경과학기술, 63-79.  배현주, 정다운, 간순영, 박주영, 임연희. (2017). 이상기온에 따른 건강영향 평가·예측을 통한 기후 변화 대응 전략 마련. 기후환경정책연구, 2017, 1-137.  신호성, 정기혜, 윤시몬, 이수형. (2009). 기후변화와 식중독 발생 예측. 보건사회연구, 29(1), 143- 162.  우종필, 이병욱, 이차민, 이지은, 김민성, 황재원. (2018). 빅데이터를 이용한 독감, 폐렴 및 수족구 환자수 예측 모델. 한국경영정보학회 학술대회, 333-348.  채수미, 김동진, 윤석준, 신호성. (2014). 기온과 지역특성이 말라리아 발생에 미치는 영향. 보건사 회연구, 34(1), 436-455.