SlideShare a Scribd company logo
2018년 04월
MS Azure ML Studio
신용카드 부정사용 검출 테스트
타임게이트 연구소
Agenda
• 신용카드 부정사용 테스트 데이터 (Kaggle)
• Azure Machine Learning Studio
• 신용카드 부정사용 검출 웹서비스 제작
• 결과 비교
• 웹서비스 배포 및 테스트
신용카드 부정사용 테스트 데이터
신용카드 사용 데이터 – 2010설립, 2017년 Google 인수
발췌 : https://www.kaggle.com/agpickersgill/credit-card-fraud-detection/data
• 유럽 카드사 2013년 9월 2일치 데이터
• 전체 284,807 건 중 부정사용 492건
• (Time, Amount, Class)를 제외한 필드를 PCA를
사용해 V1~V28 로 변형
• Label field 는 Class
신용카드 부정사용 데이터 – 유럽 카드사 2013년 2일치 데이터
발췌 : https://www.kaggle.com/agpickersgill/credit-card-fraud-detection/data
부정사용 여부
• 1 : 부정사용
• 0: 정상사용
Azure ML Studio
Azure Machine Learning – 애저 머신러닝 지원 도구
발췌 : https://docs.microsoft.com/ko-kr/azure/machine-learning/
데이터 탐색, 모델 개발,
배포를 손쉽게 관리할 수
있는 서비스 (Cloud/On-
Premise 지원)
Azure Machine Learning
웹서비스 개발 도구
DS(Data Science)용
가상머신 배포 서비스
Azure Machine Learning Stuido – GUI 기반 머신러닝 모델 개발툴
발췌 : https://docs.microsoft.com/ko-kr/azure/machine-learning/studio/studio-overview-diagram
Azure Machine Learning Studio– https://studio.azureml.net
발췌 : https://studio.azureml.net/
Azure
계정으로
로그인
부정사용 검출 웹서비스 제작
Machine Learning 모델 개발 절차
1. 데이터 Upload (Dataset 생성)
2. Experiment 생성
3. Machine Learning 모델 작성
① 데이터셋 블록 추가
② 데이터 전처리(정규화, 합산 필드 생성 등) 블록 추가
③ 데이터 분할(split – 훈련용, 테스트용) 블록 추가
④ Train 블록과 ML(Machine Learning) 모델 블록 추가
⑤ 채점 블록과 평가 블록 추가
4. 훈련된 모델 테스트 및 배포
부정사용 검출 웹서비스 제작 – 데이터 업로드
발췌 : https://studio.azureml.net/Home/ViewWorkspaceCached/4a4d4ddb45754e9ab86d77250ca0d12b#Workspace/Datasets/ListDatasets
생성하기
부정사용 검출 웹서비스 제작 – 데이터 업로드
데이터 셋 생성
발췌 : https://studio.azureml.net/Home/ViewWorkspaceCached/4a4d4ddb45754e9ab86d77250ca0d12b#Workspace/Datasets/ListDatasets
데이터 셋 파일 찾기
부정사용 검출 웹서비스 제작 – 데이터 업로드
데이터 파일 선택
발췌 : https://studio.azureml.net/Home/ViewWorkspaceCached/4a4d4ddb45754e9ab86d77250ca0d12b#Workspace/Datasets/ListDatasets
OK 버튼
부정사용 검출 웹서비스 제작 – 생성된 데이터셋
업로드된 데이터 셋
발췌 : https://studio.azureml.net/Home/ViewWorkspaceCached/4a4d4ddb45754e9ab86d77250ca0d12b#Workspace/Datasets/ListDatasets
부정사용 검출 웹서비스 제작 – experiment 생성
생성 버튼
부정사용 검출 웹서비스 제작 – Blank Experiment 생성
발췌 : https://www.kaggle.com/agpickersgill/credit-card-fraud-detection/data
부정사용 검출 웹서비스 제작 – Experiment 생성
Experiment 이름 입력
부정사용 검출 웹서비스 제작 – 데이터셋 선택
데이터셋 선택
Drag & Drop
부정사용 검출 웹서비스 제작 – 데이터 정규화 블록 추가
데이터 정규화 블록
블록 연결
정규화 방법 선택
정규화 대상 컬럼 선택
부정사용 검출 웹서비스 제작 – 데이터 분할 블록 추가
데이터 분할 블록
블록 연결
분할 비율 선택
(일반적으로 8:2 혹은 7:3)
부정사용 검출 웹서비스 제작 – Train Model 블록 추가
모델 훈련 블록
블록 연결
(연결점 확인 필요)
Label 컬럼 선택
부정사용 검출 웹서비스 제작 – ML 모델 블록 추가
ML(Machine Learning) 모델 블록
블록 연결
(연결점 위치 주목)
훈련 모델 매개변수 선택
부정사용 검출 웹서비스 제작 – 모델 채점 블록 추가
모델 채점 블록
블록 연결
(연결점 주목)
부정사용 검출 웹서비스 제작 – 비교 평가 블록 추가
비교평가 블록
블록 연결
부정사용 검출 웹서비스 제작 – 모델 훈련 수행
훈련 수행
결과 비교
머신러닝 정확도 측정 관련 용어
• Sensitivity(Recall) = TP/(TP+FN)
• Specificity = TN/(TN+FP)
• Precision = TP/(TP+ FP)
• Sensitivity 와 Specificity (반비례 관계)
 참/거짓 비율이 다를 경우
• Sensitivity와 Precision (반비례 관계)
 참/거짓 비율이 비슷할 경우
( 참, 거짓 비율이 차이가 크면, 예측의 집합의 비율은
해석에 문제가 생길 가능성)
• ROC(Receiver Operating Characteristic)
 오적중 확률에 따른 적중확률 변화
• Accuracy = (TP+TN)/(TP+TN+FP+FN)
• F1-score =
2*(Precision*Recall)/(Precision+Recall)
실제 True
(부정사용)
실제 False
(정상 사용)
예측 True
(예측 부정 사용)
TP
(True Positive)
FP
(False Positive)
예측 False
(예측 정상 사용)
FN
(False Negative)
TN
(True Negative)
블록 연결
결과 비교 – 평가 점수 확인
평가 스코어
• Sensitivity(Recall) = 0.771
• Accuracy = 0.999
• Precision = 0.955
• F1 = 0.853
• AUC = 0.940
결과 비교 – 평가 점수 확인
웹 서비스 배포 및 테스트
Predictive 웹서비스 생성
웹 서비스 배포 – 웹서비스 생성
생성된 웹서비스 모델
웹 서비스 배포 – 웹서비스 생성
웹서비스 테스트 수행
웹 서비스 배포 – 웹서비스 모델 검증을 위한 테스트 수행
웹서비스 테스트 수행 후 deploy
웹서비스 호출을 위한 API Key
웹 서비스 배포 – 생성된 웹서비스 테스트
웹서비스 테스트용 웹페이지
• 웹서비스 Request/Response 정보
• 샘플 클라이언트 코드
웹 서비스 배포 – 웹서비스 테스트 화면
웹 서비스 배포 – 웹서비스 Request/Response 확인
Address
서울특별시 성동구 아차산로 17
11층 (성수동 1가, 서울숲엘타워)
우편번호 04789
Telephone
Tel : (02)575-0409
Fax: (02)6003-1987

More Related Content

PDF
UiPath와 Python ML(Machine Learning) 모델 연동
PDF
스플렁크 Machine Learning Integration
PDF
Azure ml studio_fraud_detection
PPTX
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
PDF
[Paper] auto ml part 1
PDF
생체 광학 데이터 분석 AI 경진대회 1위 수상작
PPTX
K-Fashion 경진대회 1등 수상자 솔루션
PDF
파이썬 데이터 분석 3종세트
UiPath와 Python ML(Machine Learning) 모델 연동
스플렁크 Machine Learning Integration
Azure ml studio_fraud_detection
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
[Paper] auto ml part 1
생체 광학 데이터 분석 AI 경진대회 1위 수상작
K-Fashion 경진대회 1등 수상자 솔루션
파이썬 데이터 분석 3종세트

Similar to Azure ml studio_fraud_detection (20)

PPTX
타지키스탄 세관 신고 데이터 기반 위법물 탐지 서비스
PDF
발표자료 11장
PDF
01 linear regression
PDF
1 linear regression
PDF
3.neural networks
PDF
Spark & Zeppelin을 활용한 머신러닝 실전 적용기
PPTX
Machine learning linearregression
PDF
Amazon SageMaker를 이용한 예측 분석-남궁영환 솔루션즈 아키텍트, AWS
PDF
개발자를 위한 공감세미나 tensor-flow
PDF
Machine Learning with Apache Spark and Zeppelin
PDF
소프트웨어 2.0을 활용한 게임 어뷰징 검출
PDF
From maching learning to deep learning
PDF
파이썬(Python) 으로 나만의 딥러닝 API 만들기 강좌 (Feat. AutoAI )
PDF
AWS 기계 학습 솔루션을 활용한 온라인 사기·부정거래 감지 – 서지혜 AWS 스타트업 AIML 스페셜리스트:: AWS Cloud Week...
PDF
From maching learning to deep learning episode2
PDF
[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 3장. 분류
PDF
Azure AutoML 함께 실습하기
PDF
Understanding MLOps
PDF
Function approximation as supervised learning
타지키스탄 세관 신고 데이터 기반 위법물 탐지 서비스
발표자료 11장
01 linear regression
1 linear regression
3.neural networks
Spark & Zeppelin을 활용한 머신러닝 실전 적용기
Machine learning linearregression
Amazon SageMaker를 이용한 예측 분석-남궁영환 솔루션즈 아키텍트, AWS
개발자를 위한 공감세미나 tensor-flow
Machine Learning with Apache Spark and Zeppelin
소프트웨어 2.0을 활용한 게임 어뷰징 검출
From maching learning to deep learning
파이썬(Python) 으로 나만의 딥러닝 API 만들기 강좌 (Feat. AutoAI )
AWS 기계 학습 솔루션을 활용한 온라인 사기·부정거래 감지 – 서지혜 AWS 스타트업 AIML 스페셜리스트:: AWS Cloud Week...
From maching learning to deep learning episode2
[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 3장. 분류
Azure AutoML 함께 실습하기
Understanding MLOps
Function approximation as supervised learning
Ad

More from TIMEGATE (7)

PDF
OpenSource License
PDF
하이퍼레저 패브릭 실습자료
PDF
Ethereum 스마트 컨트랙트 보안
PDF
시계열분석의 이해
PDF
하이퍼레저 프로젝트 개요
PDF
마이크로소프트 QnA Maker를 이용한 챗봇 만들기
PDF
통계의 힘 (도서정리)
OpenSource License
하이퍼레저 패브릭 실습자료
Ethereum 스마트 컨트랙트 보안
시계열분석의 이해
하이퍼레저 프로젝트 개요
마이크로소프트 QnA Maker를 이용한 챗봇 만들기
통계의 힘 (도서정리)
Ad

Azure ml studio_fraud_detection

  • 1. 2018년 04월 MS Azure ML Studio 신용카드 부정사용 검출 테스트 타임게이트 연구소
  • 2. Agenda • 신용카드 부정사용 테스트 데이터 (Kaggle) • Azure Machine Learning Studio • 신용카드 부정사용 검출 웹서비스 제작 • 결과 비교 • 웹서비스 배포 및 테스트
  • 4. 신용카드 사용 데이터 – 2010설립, 2017년 Google 인수 발췌 : https://www.kaggle.com/agpickersgill/credit-card-fraud-detection/data • 유럽 카드사 2013년 9월 2일치 데이터 • 전체 284,807 건 중 부정사용 492건 • (Time, Amount, Class)를 제외한 필드를 PCA를 사용해 V1~V28 로 변형 • Label field 는 Class
  • 5. 신용카드 부정사용 데이터 – 유럽 카드사 2013년 2일치 데이터 발췌 : https://www.kaggle.com/agpickersgill/credit-card-fraud-detection/data 부정사용 여부 • 1 : 부정사용 • 0: 정상사용
  • 7. Azure Machine Learning – 애저 머신러닝 지원 도구 발췌 : https://docs.microsoft.com/ko-kr/azure/machine-learning/ 데이터 탐색, 모델 개발, 배포를 손쉽게 관리할 수 있는 서비스 (Cloud/On- Premise 지원) Azure Machine Learning 웹서비스 개발 도구 DS(Data Science)용 가상머신 배포 서비스
  • 8. Azure Machine Learning Stuido – GUI 기반 머신러닝 모델 개발툴 발췌 : https://docs.microsoft.com/ko-kr/azure/machine-learning/studio/studio-overview-diagram
  • 9. Azure Machine Learning Studio– https://studio.azureml.net 발췌 : https://studio.azureml.net/ Azure 계정으로 로그인
  • 11. Machine Learning 모델 개발 절차 1. 데이터 Upload (Dataset 생성) 2. Experiment 생성 3. Machine Learning 모델 작성 ① 데이터셋 블록 추가 ② 데이터 전처리(정규화, 합산 필드 생성 등) 블록 추가 ③ 데이터 분할(split – 훈련용, 테스트용) 블록 추가 ④ Train 블록과 ML(Machine Learning) 모델 블록 추가 ⑤ 채점 블록과 평가 블록 추가 4. 훈련된 모델 테스트 및 배포
  • 12. 부정사용 검출 웹서비스 제작 – 데이터 업로드 발췌 : https://studio.azureml.net/Home/ViewWorkspaceCached/4a4d4ddb45754e9ab86d77250ca0d12b#Workspace/Datasets/ListDatasets 생성하기
  • 13. 부정사용 검출 웹서비스 제작 – 데이터 업로드 데이터 셋 생성 발췌 : https://studio.azureml.net/Home/ViewWorkspaceCached/4a4d4ddb45754e9ab86d77250ca0d12b#Workspace/Datasets/ListDatasets 데이터 셋 파일 찾기
  • 14. 부정사용 검출 웹서비스 제작 – 데이터 업로드 데이터 파일 선택 발췌 : https://studio.azureml.net/Home/ViewWorkspaceCached/4a4d4ddb45754e9ab86d77250ca0d12b#Workspace/Datasets/ListDatasets OK 버튼
  • 15. 부정사용 검출 웹서비스 제작 – 생성된 데이터셋 업로드된 데이터 셋 발췌 : https://studio.azureml.net/Home/ViewWorkspaceCached/4a4d4ddb45754e9ab86d77250ca0d12b#Workspace/Datasets/ListDatasets
  • 16. 부정사용 검출 웹서비스 제작 – experiment 생성 생성 버튼
  • 17. 부정사용 검출 웹서비스 제작 – Blank Experiment 생성 발췌 : https://www.kaggle.com/agpickersgill/credit-card-fraud-detection/data
  • 18. 부정사용 검출 웹서비스 제작 – Experiment 생성 Experiment 이름 입력
  • 19. 부정사용 검출 웹서비스 제작 – 데이터셋 선택 데이터셋 선택 Drag & Drop
  • 20. 부정사용 검출 웹서비스 제작 – 데이터 정규화 블록 추가 데이터 정규화 블록 블록 연결 정규화 방법 선택 정규화 대상 컬럼 선택
  • 21. 부정사용 검출 웹서비스 제작 – 데이터 분할 블록 추가 데이터 분할 블록 블록 연결 분할 비율 선택 (일반적으로 8:2 혹은 7:3)
  • 22. 부정사용 검출 웹서비스 제작 – Train Model 블록 추가 모델 훈련 블록 블록 연결 (연결점 확인 필요) Label 컬럼 선택
  • 23. 부정사용 검출 웹서비스 제작 – ML 모델 블록 추가 ML(Machine Learning) 모델 블록 블록 연결 (연결점 위치 주목) 훈련 모델 매개변수 선택
  • 24. 부정사용 검출 웹서비스 제작 – 모델 채점 블록 추가 모델 채점 블록 블록 연결 (연결점 주목)
  • 25. 부정사용 검출 웹서비스 제작 – 비교 평가 블록 추가 비교평가 블록 블록 연결
  • 26. 부정사용 검출 웹서비스 제작 – 모델 훈련 수행 훈련 수행
  • 28. 머신러닝 정확도 측정 관련 용어 • Sensitivity(Recall) = TP/(TP+FN) • Specificity = TN/(TN+FP) • Precision = TP/(TP+ FP) • Sensitivity 와 Specificity (반비례 관계)  참/거짓 비율이 다를 경우 • Sensitivity와 Precision (반비례 관계)  참/거짓 비율이 비슷할 경우 ( 참, 거짓 비율이 차이가 크면, 예측의 집합의 비율은 해석에 문제가 생길 가능성) • ROC(Receiver Operating Characteristic)  오적중 확률에 따른 적중확률 변화 • Accuracy = (TP+TN)/(TP+TN+FP+FN) • F1-score = 2*(Precision*Recall)/(Precision+Recall) 실제 True (부정사용) 실제 False (정상 사용) 예측 True (예측 부정 사용) TP (True Positive) FP (False Positive) 예측 False (예측 정상 사용) FN (False Negative) TN (True Negative)
  • 29. 블록 연결 결과 비교 – 평가 점수 확인
  • 30. 평가 스코어 • Sensitivity(Recall) = 0.771 • Accuracy = 0.999 • Precision = 0.955 • F1 = 0.853 • AUC = 0.940 결과 비교 – 평가 점수 확인
  • 31. 웹 서비스 배포 및 테스트
  • 32. Predictive 웹서비스 생성 웹 서비스 배포 – 웹서비스 생성
  • 33. 생성된 웹서비스 모델 웹 서비스 배포 – 웹서비스 생성
  • 34. 웹서비스 테스트 수행 웹 서비스 배포 – 웹서비스 모델 검증을 위한 테스트 수행 웹서비스 테스트 수행 후 deploy
  • 35. 웹서비스 호출을 위한 API Key 웹 서비스 배포 – 생성된 웹서비스 테스트 웹서비스 테스트용 웹페이지 • 웹서비스 Request/Response 정보 • 샘플 클라이언트 코드
  • 36. 웹 서비스 배포 – 웹서비스 테스트 화면
  • 37. 웹 서비스 배포 – 웹서비스 Request/Response 확인
  • 38. Address 서울특별시 성동구 아차산로 17 11층 (성수동 1가, 서울숲엘타워) 우편번호 04789 Telephone Tel : (02)575-0409 Fax: (02)6003-1987