SlideShare a Scribd company logo
Big Data Analysis Process
권정민
(cojette@gmail.com)
Open Cloud & Big Data 2012
Data Science
R & big data analysis 20120531
There is nothing new
under the sun
Data Engineering
(출처: http://embedded.eecs.berkeley.edu/Alumni/wray/data-eng.html)
Last updated Mon Jan 27 09:26:36 PST 1997
R & big data analysis 20120531
R & big data analysis 20120531
R & big data analysis 20120531
Why ?
muggle wizard
muggle wizard……
……
Limits
- Environment
- Functions
- Money
Free
- Environment
- Functions
- Money
R & big data analysis 20120531
Rhadoop / Rhipe
Oracle R Enterprise
Rhive
Rhadoop / Rhipe
R & big data analysis 20120531
R & big data analysis 20120531
Oracle R Enterprise
R & big data analysis 20120531
R & big data analysis 20120531
RHive
R & big data analysis 20120531
R & big data analysis 20120531
Big Data Analysis
with R
클라우드 로그 분석 시스템
클라우드 로그 분석 시스템
CDR 분석
Data
raw data summary size
(raw 1 yr +sum2 yrs)1 Month 1 Month
Wireless
Unrated CDR
(VOICE, Data, SMS, MMS)
3.7 2.5 104
Rated CDR 1.5 0.2 22
Wi-Fi 0.4 0.3 12
Wibro 1.5 1.0 42
Wireline Rated CDR 1.5 1.5 55
IPDR IP-TV 1.5 0.1 19
Total 10 5.6 254
Unit : TB[ KT CDR(Call Detail Record) ]
[분석 항목]
• 고객 Segmentation
• 위치 기반 통화 품질 분석
• SNA 분석
• Anomaly Detection
R & big data analysis 20120531

More Related Content

PPTX
IOT Paris Seminar 2015 - intro by Yann Aubry
PDF
Green material, encryption and gate in Ark Load
PDF
MongoDB Solution for Internet of Things and Big Data
PPTX
Reproducible Project Workflow in R (with ProjectTemplate)
PDF
잉여의 잉여력 관리
PPTX
Lean Analytics_cojette
PDF
Command Line으로 분석하는 사용자 패턴
PDF
METRIC - 린 분석의 데이터 사용법
IOT Paris Seminar 2015 - intro by Yann Aubry
Green material, encryption and gate in Ark Load
MongoDB Solution for Internet of Things and Big Data
Reproducible Project Workflow in R (with ProjectTemplate)
잉여의 잉여력 관리
Lean Analytics_cojette
Command Line으로 분석하는 사용자 패턴
METRIC - 린 분석의 데이터 사용법

Viewers also liked (20)

PPTX
Measuring the benefit effect for customers with Bayesian predictive modeling
PDF
Offering 효과 분석-시계열 예측 모델 활용
PDF
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
PDF
데이터는 차트가 아니라 돈이 되어야 한다.
PPTX
실리콘 밸리 데이터 사이언티스트의 하루
PDF
권정민 4차혁명과교육
PDF
데이터로 바라본 응답하라1988
PDF
[Research] deploying predictive models with the actor framework - Brian Gawalt
PDF
Big wins with small data. PredictionIO in ecommerce - David Jones
PDF
통계분석연구회 2016년 여름 맞이 추천 도서와 영상
PDF
Doing data science chap11
PDF
원스토어 프로젝트 및 통합개발자센터 안내
DOCX
[통계분석연구회] 2016년 겨울 맞이 추천 도서와 영상
PDF
데이터 사이언티스트 키노트 Pt 20141008
PDF
[week6] 데이터읽어주는남자
PDF
Cloud 기반 Big Data 분석 엔진 서비스
PDF
소셜커머스 애플리케이션의 모바일 접근성 및 개선 방안
PDF
T스토어-올레마켓-U+스토어 통합개발자센터 설명회
PDF
Snusv/인사이더스 서울대 창업동아리 강의 자료
PDF
꿈꾸는 데이터 디자이너 시즌2 교육설명회
Measuring the benefit effect for customers with Bayesian predictive modeling
Offering 효과 분석-시계열 예측 모델 활용
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
데이터는 차트가 아니라 돈이 되어야 한다.
실리콘 밸리 데이터 사이언티스트의 하루
권정민 4차혁명과교육
데이터로 바라본 응답하라1988
[Research] deploying predictive models with the actor framework - Brian Gawalt
Big wins with small data. PredictionIO in ecommerce - David Jones
통계분석연구회 2016년 여름 맞이 추천 도서와 영상
Doing data science chap11
원스토어 프로젝트 및 통합개발자센터 안내
[통계분석연구회] 2016년 겨울 맞이 추천 도서와 영상
데이터 사이언티스트 키노트 Pt 20141008
[week6] 데이터읽어주는남자
Cloud 기반 Big Data 분석 엔진 서비스
소셜커머스 애플리케이션의 모바일 접근성 및 개선 방안
T스토어-올레마켓-U+스토어 통합개발자센터 설명회
Snusv/인사이더스 서울대 창업동아리 강의 자료
꿈꾸는 데이터 디자이너 시즌2 교육설명회
Ad

Recently uploaded (20)

PDF
Systems Analysis and Design, 12th Edition by Scott Tilley Test Bank.pdf
PPTX
Pilar Kemerdekaan dan Identi Bangsa.pptx
PDF
OneRead_20250728_1808.pdfhdhddhshahwhwwjjaaja
PPTX
IMPACT OF LANDSLIDE.....................
PPTX
STERILIZATION AND DISINFECTION-1.ppthhhbx
PPTX
AI Strategy room jwfjksfksfjsjsjsjsjfsjfsj
PDF
Votre score augmente si vous choisissez une catégorie et que vous rédigez une...
PPT
Predictive modeling basics in data cleaning process
PPTX
A Complete Guide to Streamlining Business Processes
PDF
Data Engineering Interview Questions & Answers Batch Processing (Spark, Hadoo...
PDF
Data Engineering Interview Questions & Answers Cloud Data Stacks (AWS, Azure,...
PPTX
(Ali Hamza) Roll No: (F24-BSCS-1103).pptx
PDF
REAL ILLUMINATI AGENT IN KAMPALA UGANDA CALL ON+256765750853/0705037305
PDF
Tetra Pak Index 2023 - The future of health and nutrition - Full report.pdf
PPTX
Leprosy and NLEP programme community medicine
PPTX
SAP 2 completion done . PRESENTATION.pptx
PPTX
Microsoft-Fabric-Unifying-Analytics-for-the-Modern-Enterprise Solution.pptx
PPTX
Topic 5 Presentation 5 Lesson 5 Corporate Fin
PDF
Transcultural that can help you someday.
PPTX
DS-40-Pre-Engagement and Kickoff deck - v8.0.pptx
Systems Analysis and Design, 12th Edition by Scott Tilley Test Bank.pdf
Pilar Kemerdekaan dan Identi Bangsa.pptx
OneRead_20250728_1808.pdfhdhddhshahwhwwjjaaja
IMPACT OF LANDSLIDE.....................
STERILIZATION AND DISINFECTION-1.ppthhhbx
AI Strategy room jwfjksfksfjsjsjsjsjfsjfsj
Votre score augmente si vous choisissez une catégorie et que vous rédigez une...
Predictive modeling basics in data cleaning process
A Complete Guide to Streamlining Business Processes
Data Engineering Interview Questions & Answers Batch Processing (Spark, Hadoo...
Data Engineering Interview Questions & Answers Cloud Data Stacks (AWS, Azure,...
(Ali Hamza) Roll No: (F24-BSCS-1103).pptx
REAL ILLUMINATI AGENT IN KAMPALA UGANDA CALL ON+256765750853/0705037305
Tetra Pak Index 2023 - The future of health and nutrition - Full report.pdf
Leprosy and NLEP programme community medicine
SAP 2 completion done . PRESENTATION.pptx
Microsoft-Fabric-Unifying-Analytics-for-the-Modern-Enterprise Solution.pptx
Topic 5 Presentation 5 Lesson 5 Corporate Fin
Transcultural that can help you someday.
DS-40-Pre-Engagement and Kickoff deck - v8.0.pptx
Ad

R & big data analysis 20120531