SlideShare a Scribd company logo
2
Most read
4
Most read
12
Most read
이윤희
다짜고짜 배워보는
인과추론
Product
Analytics
Playground
안녕하세요 ☺
한국신용데이터에서
CEO Staff로 일하는 이윤희 입니다.
안녕하세요 ☺
한국신용데이터에서
CEO Staff로 일하는 이윤희 입니다.
= 조직의 목표 달성과 CEO 의사결정을
지원하기 위해 필요한 모든 일을 하는 사람
(프로젝트 관리, 지표 관리, 신규 사업 Growth)
[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론
제러널리스트로서…
- 새로운 일, 처음 보는 개념에 열린 마음
- 빠르게 배우기
- 쉽게 설명하기
(저도 방금까지 몰랐던 내용이니까요!)
인과추론 떡밥 뿌리기
앞으로 10분 동안…
인과추론, 빙산의 일각만 배워보아요!
- 인과추론이란 무엇일까요?
- 인과추론을 위한 통계 지식
- 현실에서 이렇게 쓰입니다!
인과추론(Causal Inference)이란
무엇일까요?
상관관계 vs. 인과관계
맥도날드 점포가 많아진다 물가가 상승한다x
맥도날드 점포가 많아졌기 때문에, 물가가 상승했다 !?
상관관계
인과관계
상관관계는 인과관계가 아니다!
- 다른 요인이 맥도날드 점포 수와 물가
지수에 동시에 영향을 미쳤을 가능성
- 예시) 수요 증가 / 공급 감소, 생산비
원자재 가격 상승, 유통 구조 등
다른 요인이 영향을 미쳤을 수도.. 인과관계가 반대일 수도..
- 물가가 상승했기 때문에, 맥도날드 점포
수가 늘어났을 가능성
예측 vs. 추론 (feat. 충성고객)
예측
추론
어떤 사람이 충성 고객이 될까? 그 사람을 타깃해보자!
➡ 결과 맞추기, 오차를 최소화 하는 게 중요해요!
사용자에게 무엇을 해주면 충성고객이 될까? 포인트를 쌓는
게 좋을지, 배송비 무료 쿠폰을 주는 게 좋을지 고민 돼 😵
➡ 원인과 결과 사이의 관계 알아내기
인과추론이 쓸모 있는 이유
인과추론은 Actionable 하다!
인과추론을 위한
(어렵지 않은) 통계 지식
인과관계 입증에 있어 중요한 관점
개입을 받은 집단
예시) 타이레놀을 복용한 사람들이 모인 그룹
개입을 받지 않은 집단 (= 대조군, 통제군)
예시) 타이레놀을 복용하지 않은 사람들이 모인 그룹
개입 효과
Treatment Effect
현실에서 인과관계를 입증하기 어려운 이유
세상에는 통제할 수 없는 것이 너무 많아 😭
- Treatment를 명확히 정의 할 수 없다.
오프라인 매장의 매출을 증감 요인 9,999+가지
- Control Group의 결과를 알 수 없다.
메뉴 가격 상승과 매출 간의 인과관계를 본다면?
- Group에 무작위로 배정되지 않는다.
멤버십 가입에 따른 객단가를 분석한다면?
(선택에 의해서 배정 ➡ Self-Selection Bias)
한 눈에 보는 인과추론 방법론
��
Source) Jiyong Park. “Korea Summer Session on Causal Inference 2021”. https://youtu.be/kr-7PXLefyc
한 눈에 보는 인과추론 방법론
종합 선물셋트 🎁
무작위 비교 실험 A/B Test
통제 환경을 가정
통제 환경을 가정하기 어려울 때
회귀분석 - 개정판
회귀분석 y = f(x) + e
도구변수
준 실험
Source) Jiyong Park. “Korea Summer Session on Causal Inference 2021”. https://youtu.be/kr-7PXLefyc
데이터에 경계선이 있다면, RD 디자인 Regression Discontinuity
Source) Prof. Eric Dunford. “Accelerated Statistics for Public Policy” .McCourt School of Public Policy.
http://ericdunford.com/ppol561/Lectures/week_08/week08-regression-discontinuity-ppol561.html#1
Control
Group
Treatment
Group
RD 디자인 적용 사례
Source 1) Srikanth Kadiyala and Erin Strumpf. 2014. “How Effective is Population-Based Cancer Screening”. Forum for Health Economics and Policy
Source 2) Hoekstra, Mark. 2009. “The Effect of Attending the Flagship State University on Earnings: A Discontinuity-Based Approach”. Review of
Economics and Statistics 91 (4): 717–24.
현실에서 이렇게 쓰입니다!
왜 A/B 테스트가 아닌 준 실험을 활용할까?
Source 1) Colin McFarland, Michael Pow, Julia Glick. 2018. “Quasi Experimentation at Netflix”.
https://netflixtechblog.com/quasi-experimentation-at-netflix-566b57d2e362
- 기술적으로 개별 사용자를 대상으로 무작위 배정을 시행할 수 없는 경우
- 기술적으로는 가능하지만, 다른 변수가 개입할 여지가 있는 경우
(대중매체 노출, 개인화된 추천 시스템, 사용자 사이의 소문 등)
(사례) 옥외광고를 통한 가입 효과 분석
Source 1) Colin McFarland, Michael Pow, Julia Glick. 2018. “Quasi Experimentation at Netflix”.
https://netflixtechblog.com/quasi-experimentation-at-netflix-566b57d2e362
인과추론,
더 알고 싶다면?
🙌 또 만나요!
이윤희
leeyunhee12@gamil.com | 이메일
https://medium.com/@connect2yh | 블로그
https://www.linkedin.com/in/connect2yh | 링크드인

More Related Content

PDF
[팝콘 시즌1] 최보경 : 실무자를 위한 인과추론 활용 - Best Practices
PDF
[PAP] 실무자를 위한 인과추론 활용 : Best Practices
PDF
A/B 테스트를 적용하기 어려울 때, 이벤트 효과 추정하기 (2020-01-18 잔디콘)
PDF
Causal Inference : Primer (2019-06-01 잔디콘)
PDF
신뢰할 수 있는 A/B 테스트를 위해 알아야 할 것들
PDF
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트
PDF
텐서플로우로 배우는 딥러닝
PDF
Digital Transformation Strategy & Framework | By ex-McKinsey
[팝콘 시즌1] 최보경 : 실무자를 위한 인과추론 활용 - Best Practices
[PAP] 실무자를 위한 인과추론 활용 : Best Practices
A/B 테스트를 적용하기 어려울 때, 이벤트 효과 추정하기 (2020-01-18 잔디콘)
Causal Inference : Primer (2019-06-01 잔디콘)
신뢰할 수 있는 A/B 테스트를 위해 알아야 할 것들
프로덕트를 빠르게 개선하기 위한 베이지안 A/B 테스트
텐서플로우로 배우는 딥러닝
Digital Transformation Strategy & Framework | By ex-McKinsey

What's hot (20)

PDF
[Causal Inference KR] 스타트업에서의 인과추론
PDF
[PAP] 팝콘 시즌 1 컨퍼런스 사전 QnA
PDF
[팝콘 시즌1] 박동혁 : 마케터에게 필요한 Data Literacy
PDF
실무에서 활용하는 A/B테스트
PDF
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
PDF
올바른 분석을 방해하는 함정 카드 피해가기
PDF
오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA)
PDF
Data Engineering 101
PDF
데이터 분석에 필요한 기본 개념: 지표, Funnel 등 데이터를 이해하기 위한 멘탈 모델(Mental Model)
PDF
화성에서 온 개발자, 금성에서 온 기획자
PDF
[팝콘 시즌1] 허현 : 닭이 먼저 달걀이 먼저? 그래인저 인과검정
PDF
대용량 로그분석 Bigquery로 간단히 사용하기 (20170215 T아카데미)
PDF
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
PPTX
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
PDF
데이터는 차트가 아니라 돈이 되어야 한다.
PDF
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
PDF
서비스 기획자의 데이터 분석
PDF
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
PDF
데이터 분석가는 어떤 SKILLSET을 가져야 하는가? - 데이터 분석가 되기
PDF
스타트업 데이터분석 - 퍼널분석과 코호트분석
[Causal Inference KR] 스타트업에서의 인과추론
[PAP] 팝콘 시즌 1 컨퍼런스 사전 QnA
[팝콘 시즌1] 박동혁 : 마케터에게 필요한 Data Literacy
실무에서 활용하는 A/B테스트
스타트업은 데이터를 어떻게 바라봐야 할까? (개정판)
올바른 분석을 방해하는 함정 카드 피해가기
오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA)
Data Engineering 101
데이터 분석에 필요한 기본 개념: 지표, Funnel 등 데이터를 이해하기 위한 멘탈 모델(Mental Model)
화성에서 온 개발자, 금성에서 온 기획자
[팝콘 시즌1] 허현 : 닭이 먼저 달걀이 먼저? 그래인저 인과검정
대용량 로그분석 Bigquery로 간단히 사용하기 (20170215 T아카데미)
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
실전 스타트업 데이터분석: 소셜데이팅 이음은 이렇게 한다
데이터는 차트가 아니라 돈이 되어야 한다.
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
서비스 기획자의 데이터 분석
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
데이터 분석가는 어떤 SKILLSET을 가져야 하는가? - 데이터 분석가 되기
스타트업 데이터분석 - 퍼널분석과 코호트분석
Ad

Similar to [팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론 (20)

PDF
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
PPTX
[TOC for Education] Approaches to Problem Solving
PDF
그로스해킹 세미나 #1
PDF
캡스톤설계1(설문분석)2013-1
PPTX
Matrix에 오신 것을_환영합니다!
PDF
안.전.제.일. 강화학습!
PDF
데이터를 비즈니스에 활용하기 왜 어려울까?
PDF
MongoDB in Banksalad [Rainist]
PDF
[Causal Inference Workshop 2022] Applications of Causal Inference in Product ...
PDF
분석 현장에서 요구되는 데이터과학자의 역량과 자질
PDF
Learning dataanalyst 2020oct_yonsei
PDF
Digital transformation era, role and competencies of hr
PDF
People Analytics.170420
PDF
관리하지 말고 경영하라! 데이터접목활용을 통한 Hr 성과사례 - 원...
PPT
조선비즈 경제아카데미
PDF
Ux멘토스쿨3기 3조 보담 최종본
PDF
장기기증 중간발표
PDF
장기기증조 중간발표
PPT
韩国Ppt高手收集的ppt图表素材[免积分下载]
PDF
2018 06-11-active-question-answering
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
[TOC for Education] Approaches to Problem Solving
그로스해킹 세미나 #1
캡스톤설계1(설문분석)2013-1
Matrix에 오신 것을_환영합니다!
안.전.제.일. 강화학습!
데이터를 비즈니스에 활용하기 왜 어려울까?
MongoDB in Banksalad [Rainist]
[Causal Inference Workshop 2022] Applications of Causal Inference in Product ...
분석 현장에서 요구되는 데이터과학자의 역량과 자질
Learning dataanalyst 2020oct_yonsei
Digital transformation era, role and competencies of hr
People Analytics.170420
관리하지 말고 경영하라! 데이터접목활용을 통한 Hr 성과사례 - 원...
조선비즈 경제아카데미
Ux멘토스쿨3기 3조 보담 최종본
장기기증 중간발표
장기기증조 중간발표
韩国Ppt高手收集的ppt图表素材[免积分下载]
2018 06-11-active-question-answering
Ad

[팝콘 시즌1] 이윤희 : 다짜고짜 배워보는 인과추론

  • 3. 안녕하세요 ☺ 한국신용데이터에서 CEO Staff로 일하는 이윤희 입니다. = 조직의 목표 달성과 CEO 의사결정을 지원하기 위해 필요한 모든 일을 하는 사람 (프로젝트 관리, 지표 관리, 신규 사업 Growth)
  • 5. 제러널리스트로서… - 새로운 일, 처음 보는 개념에 열린 마음 - 빠르게 배우기 - 쉽게 설명하기 (저도 방금까지 몰랐던 내용이니까요!)
  • 6. 인과추론 떡밥 뿌리기 앞으로 10분 동안… 인과추론, 빙산의 일각만 배워보아요! - 인과추론이란 무엇일까요? - 인과추론을 위한 통계 지식 - 현실에서 이렇게 쓰입니다!
  • 8. 상관관계 vs. 인과관계 맥도날드 점포가 많아진다 물가가 상승한다x 맥도날드 점포가 많아졌기 때문에, 물가가 상승했다 !? 상관관계 인과관계
  • 9. 상관관계는 인과관계가 아니다! - 다른 요인이 맥도날드 점포 수와 물가 지수에 동시에 영향을 미쳤을 가능성 - 예시) 수요 증가 / 공급 감소, 생산비 원자재 가격 상승, 유통 구조 등 다른 요인이 영향을 미쳤을 수도.. 인과관계가 반대일 수도.. - 물가가 상승했기 때문에, 맥도날드 점포 수가 늘어났을 가능성
  • 10. 예측 vs. 추론 (feat. 충성고객) 예측 추론 어떤 사람이 충성 고객이 될까? 그 사람을 타깃해보자! ➡ 결과 맞추기, 오차를 최소화 하는 게 중요해요! 사용자에게 무엇을 해주면 충성고객이 될까? 포인트를 쌓는 게 좋을지, 배송비 무료 쿠폰을 주는 게 좋을지 고민 돼 😵 ➡ 원인과 결과 사이의 관계 알아내기
  • 11. 인과추론이 쓸모 있는 이유 인과추론은 Actionable 하다!
  • 13. 인과관계 입증에 있어 중요한 관점 개입을 받은 집단 예시) 타이레놀을 복용한 사람들이 모인 그룹 개입을 받지 않은 집단 (= 대조군, 통제군) 예시) 타이레놀을 복용하지 않은 사람들이 모인 그룹 개입 효과 Treatment Effect
  • 14. 현실에서 인과관계를 입증하기 어려운 이유 세상에는 통제할 수 없는 것이 너무 많아 😭 - Treatment를 명확히 정의 할 수 없다. 오프라인 매장의 매출을 증감 요인 9,999+가지 - Control Group의 결과를 알 수 없다. 메뉴 가격 상승과 매출 간의 인과관계를 본다면? - Group에 무작위로 배정되지 않는다. 멤버십 가입에 따른 객단가를 분석한다면? (선택에 의해서 배정 ➡ Self-Selection Bias)
  • 15. 한 눈에 보는 인과추론 방법론 �� Source) Jiyong Park. “Korea Summer Session on Causal Inference 2021”. https://youtu.be/kr-7PXLefyc
  • 16. 한 눈에 보는 인과추론 방법론 종합 선물셋트 🎁 무작위 비교 실험 A/B Test 통제 환경을 가정 통제 환경을 가정하기 어려울 때 회귀분석 - 개정판 회귀분석 y = f(x) + e 도구변수 준 실험 Source) Jiyong Park. “Korea Summer Session on Causal Inference 2021”. https://youtu.be/kr-7PXLefyc
  • 17. 데이터에 경계선이 있다면, RD 디자인 Regression Discontinuity Source) Prof. Eric Dunford. “Accelerated Statistics for Public Policy” .McCourt School of Public Policy. http://ericdunford.com/ppol561/Lectures/week_08/week08-regression-discontinuity-ppol561.html#1 Control Group Treatment Group
  • 18. RD 디자인 적용 사례 Source 1) Srikanth Kadiyala and Erin Strumpf. 2014. “How Effective is Population-Based Cancer Screening”. Forum for Health Economics and Policy Source 2) Hoekstra, Mark. 2009. “The Effect of Attending the Flagship State University on Earnings: A Discontinuity-Based Approach”. Review of Economics and Statistics 91 (4): 717–24.
  • 20. 왜 A/B 테스트가 아닌 준 실험을 활용할까? Source 1) Colin McFarland, Michael Pow, Julia Glick. 2018. “Quasi Experimentation at Netflix”. https://netflixtechblog.com/quasi-experimentation-at-netflix-566b57d2e362 - 기술적으로 개별 사용자를 대상으로 무작위 배정을 시행할 수 없는 경우 - 기술적으로는 가능하지만, 다른 변수가 개입할 여지가 있는 경우 (대중매체 노출, 개인화된 추천 시스템, 사용자 사이의 소문 등)
  • 21. (사례) 옥외광고를 통한 가입 효과 분석 Source 1) Colin McFarland, Michael Pow, Julia Glick. 2018. “Quasi Experimentation at Netflix”. https://netflixtechblog.com/quasi-experimentation-at-netflix-566b57d2e362
  • 23. 🙌 또 만나요! 이윤희 leeyunhee12@gamil.com | 이메일 https://medium.com/@connect2yh | 블로그 https://www.linkedin.com/in/connect2yh | 링크드인