SlideShare a Scribd company logo
Big Data & Hadoop
김태우
fb.com/taewoo.kim.3910829
taewook1124@gmail.com
Definition of Big Data (1)
• From Wikipedia
>> 기존의 DBMS 로 관리할 수 없는 대
량의 정형 또는 비정형 데이터 집합
>> 위와 같은 데이터로부터 가치를 추
출한 뒤 결과를 분석하는 기술
Definition of Big Data (2)
• From Udacity
>> it's data that‘s too big to be
processed on a single
machine.
• The 3 Vs
>> Volume : 데이터의 크기
>> Variety : 데이터의 다양성
>> Velocity : 데이터의 생성 및 처리
속도
Definition of Hadoop
• From Wikipedia
>> 대량의 자료를 처리할 수 있는 큰 컴퓨
터
클러스터에서 동작하는 분산 응용 프로그램
을
지원하는 오픈 소스 프레임워크
Core Hadoop
MapMap
ReduceReduce
Store
In
HDFS
Process
With
Map Reduce
Hadoop Distributed File System
BLK_2
BLK_1
BLK_3
File
Chunk 단위로 분할
NameNode
DataNode
Cluster
Map Reduce
Mappers
Index 를 통해서 Key – value 형태의
intermediate record 를 생성
Shuffle and
Sort
Reducers
Result
intermediate record 를
Reducers 에게 전달
Key 값과 Key 에 해당하는
모든 value 를 가짐
What I’ll do
• Do tutorial
>> Set up
>> Examples run
• And more...
>> Udacity.com
>> github

More Related Content

PPT
빅데이터 기본개념
PDF
THE THINGS AROUND BIG DATA
PDF
[SSA] 01.bigdata database technology (2014.02.05)
PDF
[중소기업형 인공지능/빅데이터 기술 심포지엄] 데이터 전처리 기법 및 도구
PDF
[중소기업형 인공지능/빅데이터 기술 심포지엄] 대용량 거래데이터 분석을 위한 서버인프라 활용 사례
PDF
빅데이터 플랫폼 새로운 미래
PDF
Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강
PDF
2012 빅데이터 big data 발표자료
빅데이터 기본개념
THE THINGS AROUND BIG DATA
[SSA] 01.bigdata database technology (2014.02.05)
[중소기업형 인공지능/빅데이터 기술 심포지엄] 데이터 전처리 기법 및 도구
[중소기업형 인공지능/빅데이터 기술 심포지엄] 대용량 거래데이터 분석을 위한 서버인프라 활용 사례
빅데이터 플랫폼 새로운 미래
Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강
2012 빅데이터 big data 발표자료

What's hot (20)

PDF
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개
PDF
Daum내부 Hadoop 활용 사례 | Devon 2012
PPT
Pag 빅데이터-한국에도필요한가
PDF
3 빅데이터기반비정형데이터의실시간처리방법 원종석
PDF
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 온라인 컨텐츠 서비스를 위한 빅데이터 구축 사례
PPT
Big Data Overview
PPTX
하둡 시스템에 대한 10분 소개
PPTX
Druid+superset
PDF
Daum’s Business Analytics Use-cases based on Bigdata technology (2012)
PPTX
빅데이터와 로봇 (Big Data in Robotics)
PDF
분산데이터 저장 기술
PDF
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 보안 로그 분석을 위한 빅데이터 시스템 구축 사례
PDF
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
PDF
Introduction to ankus(data mining and machine learning open source)
PDF
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 인터넷 쇼핑몰의 실시간 분석 플랫폼 구축 사례
PPT
구글의 공룡화
PDF
빅데이터, big data
PDF
MelOn 빅데이터 플랫폼과 Tajo 이야기
PDF
빅데이터 인공지능 전략 및 로드맵
PPT
Google2
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개
Daum내부 Hadoop 활용 사례 | Devon 2012
Pag 빅데이터-한국에도필요한가
3 빅데이터기반비정형데이터의실시간처리방법 원종석
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 온라인 컨텐츠 서비스를 위한 빅데이터 구축 사례
Big Data Overview
하둡 시스템에 대한 10분 소개
Druid+superset
Daum’s Business Analytics Use-cases based on Bigdata technology (2012)
빅데이터와 로봇 (Big Data in Robotics)
분산데이터 저장 기술
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 보안 로그 분석을 위한 빅데이터 시스템 구축 사례
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
Introduction to ankus(data mining and machine learning open source)
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 인터넷 쇼핑몰의 실시간 분석 플랫폼 구축 사례
구글의 공룡화
빅데이터, big data
MelOn 빅데이터 플랫폼과 Tajo 이야기
빅데이터 인공지능 전략 및 로드맵
Google2
Ad

Viewers also liked (16)

PPTX
Real-time Video Analysis System
PPTX
Advanced operation system
PPTX
Streaming join & lesson 4.
PPTX
One Week Project #1
PPT
Apache Storm by Skidmarkii
PPTX
[Taewoo Kim] Real-Time Analytics with Apache Storm
PPTX
Real-Time Analytics with Apache Storm
PPTX
Storm - parallel and distributed
PPTX
Storm - understand by coding
PDF
스톰 미리보기
PDF
Storm begins
PDF
[김태우] Simplechat using firebase
PDF
PDF
PDF
Hive pdf
PDF
Storm 훑어보기
Real-time Video Analysis System
Advanced operation system
Streaming join & lesson 4.
One Week Project #1
Apache Storm by Skidmarkii
[Taewoo Kim] Real-Time Analytics with Apache Storm
Real-Time Analytics with Apache Storm
Storm - parallel and distributed
Storm - understand by coding
스톰 미리보기
Storm begins
[김태우] Simplechat using firebase
Hive pdf
Storm 훑어보기
Ad

Similar to Big Data & Hadoop by Skidmarkii (20)

PPTX
Big data application architecture 요약2
PDF
MS 빅데이터 서비스 및 게임사 PoC 사례 소개
PDF
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
PDF
DB관점에서 본 빅데이터 (2019년 8월)
PDF
Daum 내부 빅데이터 및 클라우드 기술 활용 사례- 윤석찬 (2012)
PDF
빅데이터 처리기술의 이해
PPSX
네트워크 가상화를 통한 효율적인 빅데이터 처리
PDF
Docker기반 분산 플랫폼
PDF
실시간 빅 데이터 기술 현황 및 Daum 활용 사례 소개 (2013)
PPTX
[경북] I'mcloud information
PDF
Big data 20111203_배포판
PDF
빅데이터 기술 현황과 시장 전망(2014)
PDF
데이터드리븐 DX 추진방안_202306.pdf
PPTX
DeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun Kim
PDF
[웨비나] 우리가 데이터 메시에 주목해야 할 이유
PPTX
2017 주요 기술 흐름 및 개요
PDF
Hadoop 제주대
PDF
[Retail & CPG Day 2019] Amazon.com의 무중단, 대용량 DB패턴과 국내사례 (Lotte e-commerce) - ...
PDF
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
PDF
2017 Ad-Tech on AWS 세미나ㅣAWS에서의 빅데이터와 분석
Big data application architecture 요약2
MS 빅데이터 서비스 및 게임사 PoC 사례 소개
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
DB관점에서 본 빅데이터 (2019년 8월)
Daum 내부 빅데이터 및 클라우드 기술 활용 사례- 윤석찬 (2012)
빅데이터 처리기술의 이해
네트워크 가상화를 통한 효율적인 빅데이터 처리
Docker기반 분산 플랫폼
실시간 빅 데이터 기술 현황 및 Daum 활용 사례 소개 (2013)
[경북] I'mcloud information
Big data 20111203_배포판
빅데이터 기술 현황과 시장 전망(2014)
데이터드리븐 DX 추진방안_202306.pdf
DeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun Kim
[웨비나] 우리가 데이터 메시에 주목해야 할 이유
2017 주요 기술 흐름 및 개요
Hadoop 제주대
[Retail & CPG Day 2019] Amazon.com의 무중단, 대용량 DB패턴과 국내사례 (Lotte e-commerce) - ...
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
2017 Ad-Tech on AWS 세미나ㅣAWS에서의 빅데이터와 분석

More from Taewoo Kim (6)

PDF
[김태우] 한국의 태초마을 유람기
PDF
[김태우] Soscon 후기
PPTX
Eclipse 4 RCP - 2nd Week
PPTX
Eclipse rcp - first week
PDF
Operating system #1
PPTX
I know - Chrome and Plugin
[김태우] 한국의 태초마을 유람기
[김태우] Soscon 후기
Eclipse 4 RCP - 2nd Week
Eclipse rcp - first week
Operating system #1
I know - Chrome and Plugin

Big Data & Hadoop by Skidmarkii

  • 1. Big Data & Hadoop 김태우 fb.com/taewoo.kim.3910829 taewook1124@gmail.com
  • 2. Definition of Big Data (1) • From Wikipedia >> 기존의 DBMS 로 관리할 수 없는 대 량의 정형 또는 비정형 데이터 집합 >> 위와 같은 데이터로부터 가치를 추 출한 뒤 결과를 분석하는 기술
  • 3. Definition of Big Data (2) • From Udacity >> it's data that‘s too big to be processed on a single machine. • The 3 Vs >> Volume : 데이터의 크기 >> Variety : 데이터의 다양성 >> Velocity : 데이터의 생성 및 처리 속도
  • 4. Definition of Hadoop • From Wikipedia >> 대량의 자료를 처리할 수 있는 큰 컴퓨 터 클러스터에서 동작하는 분산 응용 프로그램 을 지원하는 오픈 소스 프레임워크
  • 6. Hadoop Distributed File System BLK_2 BLK_1 BLK_3 File Chunk 단위로 분할 NameNode DataNode Cluster
  • 7. Map Reduce Mappers Index 를 통해서 Key – value 형태의 intermediate record 를 생성 Shuffle and Sort Reducers Result intermediate record 를 Reducers 에게 전달 Key 값과 Key 에 해당하는 모든 value 를 가짐
  • 8. What I’ll do • Do tutorial >> Set up >> Examples run • And more... >> Udacity.com >> github

Editor's Notes

  • #3: >> 위와 같은 데이터로부터 가치를 추출한 뒤 결과를 분석하는 기술
  • #4: 즉, 스톰은 특정한 '도구'
  • #5: 즉, 스톰은 특정한 '도구'
  • #6: 즉, 스톰은 특정한 '도구'