SlideShare a Scribd company logo
DW
데이터 웨어하우스를위한
데이터 수집 및 저장
분산 컴퓨팅 프로젝트
201210909 윤준하
AWS 빅데이터 빌딩 블록
https://www.slideshare.net/awskorea/amazon-redshift-for-massive-cost-effective-dw-channy
기존 서비스 확장
http://reviewus.ga/
기존 서비스 확장
http://reviewus.ga/
이미지 출처: 구글 웹 로그 분석
• 웹 로그를 실시간으로 전송
기존 서비스 확장
저장소
또는
분석 서비스
AWS
Lambda
데이터 수집
AWS API
Gateway
AWS
Kinesis
규모가 커지면
(대용량 스트리밍의 경우)
예상보다 많은 비용이 부담
* Bluehole – AWS와 Tajo를 이용한 테라 렉 로그 분석 (2015.12.07)
• 어떤 서비스를 이용해야 하는가
• Amazon Kinesis Streams를 사용하면 특수 요구에 맞게 스트리밍 데이터를
처리 또는 분석하는 커스텀 애플리케이션을 구축할 수 있습니다.
• 수많은 소스에서 시간당 몇 테라바이트 규모의 데이터를 계속해서 캡처하고 저장할
수 있습니다.
그런 다음 Amazon Kinesis Streams의 데이터를 사용하여 실시간 대시보드를 지원하
고,
경보를 생성하며, 동적 요금 및 광고를 구현하는 애플리케이션을 구축할 수 있습니
• Kinesis Client Library(KCL), Apache Storm, Apache Spark Streaming을 비롯해서
원하는 스트림 처리 프레임워크를 사용할 수 있습니다.
AWS Kinesis Streams
• 생산자
• Amazon Kinesis Streams에 레코드를 넣습니다.
예를 들어, 스트림에 로그 데이터를 보내는 웹 서버가 생산자입니다.
• 소비자
• Amazon Kinesis Streams에서 레코드를 가져와 처리합니다.
이 소비자를 Amazon Kinesis Streams Application이라고 합니다.
• Amazon Kinesis Streams Application
• EC2 인스턴스의 플릿에서 공통적으로 실행되는 스트림의 소비자
• Kinesis Client Library 또는 Kinesis Streams API를 사용하여 개발할 수 있습니다.
AWS Kinesis Streams
Data Processing/Streaming
• Kinesis Streams 상위 수준 아키텍처
데이터 수집
S3Kinesis
streams
EC2
Kinesis Produce Library Kinesis Client Library
• 생산자와 소비자를 설정하여 데이터를 수집하고 저장할 수 있다.
이슈 발생
S3Kinesis
streams
EC2
Kinesis Produce Library KCL
AWS Kinesis Firehose
AWS Kinesis Firehose
kinesis stream kinesis firehoseStream Producer
(KPL)
application
로그 포맷
로그 생성을 위한 봇
Random Request
약 250.0KB/h 정도의 속도
AWS Kinesis Firehose
kinesis
stream
kinesis firehose
Stream Producer
(KPL)
application
S3
AWS Kinesis Firehose
Kinesis Streams Pricing
요금
샤드 시간(초당 1MB 수신, 초당 2MB 송신) $0.0185
PUT 페이로드 유닛, 1백만 개 유닛당 $0.0204
데이터 보존 기간 연장(최대 7일), 샤드 시간당 $0.0247
샤드 시간 = 샤드 1개 * 시간당 0.0185 * 24시간 = 0.444 USD / 1일
초당 50개의 레코드, 각 레코드가 20KB일 때 데이터 입력 속도: 1.0MB/초
PUT 페이로드 = 0.0204 * 하루 4,320,000개의 레코드 = 0.088 USD / 1일
= 하루에 0.532 USD = 약 600원
* 아시아 태평양(서울) 기준
* 24시간을 초과하여 보존 기간을 설정하면 스트림에 추가 요금이 적용
AWS S3
reviewus-site/logs/Django/YYYY/MM/DD/HH/<delivery-name>-..
AWS Athena
• S3 와 QuickSight/Redshift 등의 사이에서 Data Pipeline 역할
AWS Athena
s3://reviewus-site/logs/Django/*
• 의미있는 정보 추출 가능
AWS Athena
count of user gent
popular page URL
Amazon QuickSight
• 쉽고 빠른 비즈니스 분석툴
• 다양한 데이터 셋에서 가져오기 가능
S3 Analytics, S3, Athena, RDS,
Redshift, MySQL, PostgreSQL, Aurora,
Spark 등 지원
(2017.12. US-West/Oregon 기준)
Amazon QuickSight
• 시간대별 사용자 페이지 뷰
오후 2시경 peek
그 외에도
• RedShift나 EMR, ElasticSearch 등으로 스트리밍하여 분석 가능
Architecture
IAM
S3
Kinesis
streams
EC2
KPL
Kinesis
firehose
Athena QuickSight
수집
저장
Query & Visualize
Query & Visualize
Regions
IAM
S3
Kinesis
streams
EC2
KPL
Kinesis
firehose
Athena QuickSight
수집
저장
서울
도쿄 오레곤
Billing on Data Transfer
서울 도쿄 리전 사이에서 데이터 이동 비용 (ec2 to kinesis)
Billing on Kinesis
Billing on S3
Streaming to Anywhere
• Kinesis Stream과 Firehose로 쉽게 스트리밍
kinesis
stream
kinesis
firehose
Stream Producer
(KPL)
application

More Related Content

PDF
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
PDF
민첩하고 비용효율적인 Data Lake 구축 - 문종민 솔루션즈 아키텍트, AWS
PDF
AWS Elastic Beanstalk(初心者向け 超速マスター編)JAWSUG大阪
PDF
AWS Black Belt Online Seminar 2017 AWS Storage Gateway
PDF
Lake Formation, 데이터레이크 관리와 운영을 하나로 :: 이재성 - AWS Community Day 2019
PDF
20180221 AWS Black Belt Online Seminar AWS Lambda@Edge
PDF
20180704(20190520 Renewed) AWS Black Belt Online Seminar Amazon Elastic File ...
PDF
AWS 6월 웨비나 | Amazon VPC Deep Dive (김상필 솔루션즈아키텍트)
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...
민첩하고 비용효율적인 Data Lake 구축 - 문종민 솔루션즈 아키텍트, AWS
AWS Elastic Beanstalk(初心者向け 超速マスター編)JAWSUG大阪
AWS Black Belt Online Seminar 2017 AWS Storage Gateway
Lake Formation, 데이터레이크 관리와 운영을 하나로 :: 이재성 - AWS Community Day 2019
20180221 AWS Black Belt Online Seminar AWS Lambda@Edge
20180704(20190520 Renewed) AWS Black Belt Online Seminar Amazon Elastic File ...
AWS 6월 웨비나 | Amazon VPC Deep Dive (김상필 솔루션즈아키텍트)

What's hot (20)

PDF
AWS Black Belt online seminar 2017 Snowball
PPTX
글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)
PDF
AWS를 통한 빅데이터 활용 고객 분석 및 캠페인 시스템 구축 사례 - 임혁용 매니저, AWS / 윤성준 차장, 현대백화점 :: AWS S...
PDF
Presto ベースのマネージドサービス Amazon Athena
PDF
AWS 기반 클라우드 아키텍처 모범사례 - 삼성전자 개발자 포털/개발자 워크스페이스 - 정영준 솔루션즈 아키텍트, AWS / 유현성 수석,...
PDF
AWS Backup을 이용한 데이터베이스의 백업 자동화와 편리한 복구방법
PDF
AWS X-Rayによるアプリケーションの分析とデバッグ
PDF
20190130 AWS Black Belt Online Seminar AWS Identity and Access Management (AW...
PDF
서버리스 앱 배포 자동화 (김필중, AWS 솔루션즈 아키텍트) :: AWS DevDay2018
PDF
AWS Black Belt Online Seminar 2017 Amazon DynamoDB
PDF
AWS Summit Seoul 2023 | 성공적인 AWS RDS 마이그레이션을 위한 여정과 필수 고려사항
PDF
Amazon EMR과 SageMaker를 이용하여 데이터를 준비하고 머신러닝 모델 개발 하기
PDF
AWS Black Belt Techシリーズ 2015 Amazon Elastic Block Store (EBS)
PDF
[2017 Windows on AWS] AWS 를 활용한 Active Directory 연동 및 이관 방안
PDF
20190730 AWS Black Belt Online Seminar Amazon CloudFrontの概要
PPTX
AWS Storage Gateway
PDF
롯데이커머스의 마이크로 서비스 아키텍처 진화와 비용 관점의 운영 노하우-나현길, 롯데이커머스 클라우드플랫폼 팀장::AWS 마이그레이션 A ...
PDF
효율적인 빅데이터 분석 및 처리를 위한 Glue, EMR 활용 - 김태현 솔루션즈 아키텍트, AWS :: AWS Summit Seoul 2019
PDF
AWS Black Belt Online Seminar 2017 Auto Scaling
PDF
20190806 AWS Black Belt Online Seminar AWS Glue
AWS Black Belt online seminar 2017 Snowball
글로벌 기업들의 효과적인 데이터 분석을 위한 Data Lake 구축 및 분석 사례 - 김준형 (AWS 솔루션즈 아키텍트)
AWS를 통한 빅데이터 활용 고객 분석 및 캠페인 시스템 구축 사례 - 임혁용 매니저, AWS / 윤성준 차장, 현대백화점 :: AWS S...
Presto ベースのマネージドサービス Amazon Athena
AWS 기반 클라우드 아키텍처 모범사례 - 삼성전자 개발자 포털/개발자 워크스페이스 - 정영준 솔루션즈 아키텍트, AWS / 유현성 수석,...
AWS Backup을 이용한 데이터베이스의 백업 자동화와 편리한 복구방법
AWS X-Rayによるアプリケーションの分析とデバッグ
20190130 AWS Black Belt Online Seminar AWS Identity and Access Management (AW...
서버리스 앱 배포 자동화 (김필중, AWS 솔루션즈 아키텍트) :: AWS DevDay2018
AWS Black Belt Online Seminar 2017 Amazon DynamoDB
AWS Summit Seoul 2023 | 성공적인 AWS RDS 마이그레이션을 위한 여정과 필수 고려사항
Amazon EMR과 SageMaker를 이용하여 데이터를 준비하고 머신러닝 모델 개발 하기
AWS Black Belt Techシリーズ 2015 Amazon Elastic Block Store (EBS)
[2017 Windows on AWS] AWS 를 활용한 Active Directory 연동 및 이관 방안
20190730 AWS Black Belt Online Seminar Amazon CloudFrontの概要
AWS Storage Gateway
롯데이커머스의 마이크로 서비스 아키텍처 진화와 비용 관점의 운영 노하우-나현길, 롯데이커머스 클라우드플랫폼 팀장::AWS 마이그레이션 A ...
효율적인 빅데이터 분석 및 처리를 위한 Glue, EMR 활용 - 김태현 솔루션즈 아키텍트, AWS :: AWS Summit Seoul 2019
AWS Black Belt Online Seminar 2017 Auto Scaling
20190806 AWS Black Belt Online Seminar AWS Glue
Ad

Similar to Kinesis를 이용한 데이터 수집 (20)

PDF
AWS 신규 데이터 분석 서비스 - QuickSight, Kinesis Firehose 등 (양승도) :: re:Invent re:Cap ...
PPTX
AWS Kinesis
PDF
게임 서비스 품질 향상을 위한 데이터 분석 활용하기 - 김필중 솔루션즈 아키텍트:: AWS Cloud Track 3 Gaming
PDF
AWS 서버리스 컴퓨팅-김필중 :: 2015 리인벤트 리캡 게이밍
PDF
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
PDF
클라우드 기반 실시간 데이터 분석 및 예측 - 윤석찬 테크 에반젤리스트:: AWS Cloud Track 2 Advanced
PDF
성공적인 게임 런칭을 위한 비밀의 레시피 #3
PDF
실시간 스트리밍 분석 Kinesis Data Analytics Deep Dive
PDF
AWS 기반의 대용량 실시간 스트리밍 데이터 분석 아키텍처 패턴::김필중::AWS Summit Seoul 2018
PDF
AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석
PDF
Amazon kinesis와 elasticsearch service로 만드는 실시간 데이터 분석 플랫폼 :: 박철수 :: AWS Summi...
PDF
20140528 AWS Meister BlackBelt - Amazon Kinesis (Korean)
PDF
Amazon Redshift로 데이터웨어하우스(DW) 구축하기
PDF
30분만에 만드는 AWS 기반 빅데이터 분석 애플리케이션::안효빈::AWS Summit Seoul 2018
PDF
AWS에서 빅데이터 프로젝트 시작하기 - 이종화 솔루션즈 아키텍트, AWS
PDF
AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017
PDF
AWS를 활용한 게임 데이터 분석 퀘스트 깨기::안효빈::AWS Summit Seoul 2018
PDF
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
PDF
AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017
PDF
Ad-Tech on AWS 세미나 | AWS와 데이터 분석
AWS 신규 데이터 분석 서비스 - QuickSight, Kinesis Firehose 등 (양승도) :: re:Invent re:Cap ...
AWS Kinesis
게임 서비스 품질 향상을 위한 데이터 분석 활용하기 - 김필중 솔루션즈 아키텍트:: AWS Cloud Track 3 Gaming
AWS 서버리스 컴퓨팅-김필중 :: 2015 리인벤트 리캡 게이밍
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...
클라우드 기반 실시간 데이터 분석 및 예측 - 윤석찬 테크 에반젤리스트:: AWS Cloud Track 2 Advanced
성공적인 게임 런칭을 위한 비밀의 레시피 #3
실시간 스트리밍 분석 Kinesis Data Analytics Deep Dive
AWS 기반의 대용량 실시간 스트리밍 데이터 분석 아키텍처 패턴::김필중::AWS Summit Seoul 2018
AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석
Amazon kinesis와 elasticsearch service로 만드는 실시간 데이터 분석 플랫폼 :: 박철수 :: AWS Summi...
20140528 AWS Meister BlackBelt - Amazon Kinesis (Korean)
Amazon Redshift로 데이터웨어하우스(DW) 구축하기
30분만에 만드는 AWS 기반 빅데이터 분석 애플리케이션::안효빈::AWS Summit Seoul 2018
AWS에서 빅데이터 프로젝트 시작하기 - 이종화 솔루션즈 아키텍트, AWS
AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017
AWS를 활용한 게임 데이터 분석 퀘스트 깨기::안효빈::AWS Summit Seoul 2018
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017
Ad-Tech on AWS 세미나 | AWS와 데이터 분석
Ad

More from Joona Yoon (10)

PDF
원주율은 정말 모든 수를 담고 있을까. (Does pi have all positive numbers in it?)
PDF
2019 cnupc solution
PDF
2017 cupc solution
PDF
2018 cnupc solution
PDF
Speech translator
PDF
Jcloud.ssh.linux.cli
PDF
Jcloud.creating.instance.student.2019.v2
PDF
Jcloud.ssh.xshell2
PDF
Jcloud.ssh.putty
PDF
3d mine sweeper with unity 3d
원주율은 정말 모든 수를 담고 있을까. (Does pi have all positive numbers in it?)
2019 cnupc solution
2017 cupc solution
2018 cnupc solution
Speech translator
Jcloud.ssh.linux.cli
Jcloud.creating.instance.student.2019.v2
Jcloud.ssh.xshell2
Jcloud.ssh.putty
3d mine sweeper with unity 3d

Kinesis를 이용한 데이터 수집

Editor's Notes

  • #3: 데이터 웨어하우스(data warehouse)란 사용자의 의사 결정에 도움을 주기 위하여, 기간시스템의 데이터베이스에 축적된 데이터를 공통의 형식으로 변환해서 관리하는 데이터베이스
  • #10: 생산자가 계속해서 Kinesis Streams에 데이터를 푸시하고 소비자가 실시간으로 데이터를 처리합니다.