Legacy in Eco
Lee Tae Young
NDEX
1 Perspective
2 Legacy

3 Confusion
1 Perspective
Infra

Data

APP
Application
DATA
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
I
FILE

LOG

DB

WAS

WEB
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
BIG DATA
FILE

LOG

DB

WAS

WEB
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
FTP, SFTP, Rsync

ETL Process
SQL, PL/SQL

수집

LOG, WebPage

ETL Process
Pig & Script Lang

Data Mining(SAS) Data Mining(MH,R)
DW (R,Hive)
DW (EMC)
RDBMS (Oralce,
DB2,MSSQL)

 데이터 클리닝
 데이터 요약
 데이터 기초통계
 데이터 탐색

처리

분석 검증
 모델

 데이터 마이닝
 텍스트 마이닝
 보고서
 데이터 시각화
 서비스 데이터
 상품추천
 유사아이템

Map Reduce
No SQL

RDBMS (Oralce,
DB2,MSSQL)

 데이터 연동
 데이터 변환

RDBMS (Oralce,MySql)
No SQL (Mongo)

제공
FILE

LOG

DB

WAS

WEB
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
Velocity

Data

Cleansing

Value

Conversion
Variety
Chukwa
CEP

Storm

Flume

Nutch

Node
JQuery

In-Mem

Velocity

BZIP2
VelocityLZOP

Esper

Variety

Sqoop
Data
Value
Cleansing

Cleansing

Value

Conversion

MongoDB
Value
4

5

9

•Map과 Reduce 간 셔플의
한계
–merge sort
->hashing
->merge sort
•Job 간의 데이터 교환 오버
헤드
•관계형 데이터에 부적합
•고정된 data flow
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
* 빅데이터 추출 및 분석
- MongoDB의 Map/Reduce 기능을 이용한 빅데이터 추출
- Javascript function으로 구현
- Aggregation Framework 를 이용해서 기본적인 추출 가능
- MongoDB 와 Hadoop을 연동한 데이터 처리
Nagios

Ganglia

Tunning Point
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
2 Legacy
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
Point of Concept
• 현재 DBMS에 자산화 되지 않은 데이터 중 의사결정에 참고하는 데이터가 있는가?
있다면 왜 자산화 하지 않고 있는가?
• 서비스 하고 있는 데이터 중 비용효율 문제로 제한된 기간에만 저장 및 서비 스 하
고 있는 업무가 있는가?

• 기존 업무 중 대량의 비정형 데이터를 대상으로 검색해야 하는 업무가 있는가?
• 내부 데이터 중에서 외부 데이터와 연계 시 추가적인 가치를 가지는 것이 있는가?
• 개별 요건들을 전사 관점에서 통합할 수 있는 항목이 존재하는가?
• 이러한 업무들이 우리 조직의 예산범위에서 기존 기술(DBMS, BI) 구현 및 개선이
가능한가? 가능하지 않다면 기술적 대안은 어떤 것이 있는가?
• 기존 In-House 기반 Hadoop 인프라 구축 시 많은 시간과 인력 소모.(누가?, 시간
은?)
• 인프라 구축은 전문 벤더가 고객은 어떤 Big Data를 가지고 어떤 Value를 창출할
지 고민 필요.
3 Confusion
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
Spring
RDB

Sqoop

JQuery
MR

Server LOG

Flume

Mahout

HDFS
HIVE

Web Data

PIG

Flotr2.js
Node.js
Ajax
Bootstrap.js

HBASE (Zookeeper)

Nutch
Meta Store
Oozie

BZIP2
LZOP

HCatalog
Avro

Snappy
Monitoring Tool

Nagios

Ganglia

R
RHive
RHadoop
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
Web

Nutch

Use
r

MR

HDFS
HBAS
E

HIVE

RHIVE
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
Legacy

Legacy
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
Legacy System에 BigData적용하기 (DevOn발표자료_1027)
Q&A
Thank You

More Related Content

PDF
[Pgday.Seoul 2018] PostgreSQL Authentication with FreeIPA
PDF
줌인터넷 빅데이터 활용사례 김우승
PDF
[Pgday.Seoul 2018] replacing oracle with edb postgres
PPTX
대용량 분산 아키텍쳐 설계 #2 대용량 분산 시스템 아키텍쳐 디자인 패턴
PPTX
Gruter TECHDAY 2014 MelOn BigData
PDF
Amazon Redshift의 이해와 활용 (김용우) - AWS DB Day
PDF
[Pgday.Seoul 2019] AppOS 고성능 I/O 확장 모듈로 성능 10배 향상시키기
PDF
Big data analysis with R and Apache Tajo (in Korean)
[Pgday.Seoul 2018] PostgreSQL Authentication with FreeIPA
줌인터넷 빅데이터 활용사례 김우승
[Pgday.Seoul 2018] replacing oracle with edb postgres
대용량 분산 아키텍쳐 설계 #2 대용량 분산 시스템 아키텍쳐 디자인 패턴
Gruter TECHDAY 2014 MelOn BigData
Amazon Redshift의 이해와 활용 (김용우) - AWS DB Day
[Pgday.Seoul 2019] AppOS 고성능 I/O 확장 모듈로 성능 10배 향상시키기
Big data analysis with R and Apache Tajo (in Korean)

What's hot (7)

PDF
DynamoDB의 안과밖 - 정민영 (비트패킹 컴퍼니)
PDF
RUCK 2017 R로 API 서버를 만드는 4가지 방법(은 삽질기)
PPTX
빅데이터 구축 사례
PDF
Apache hbase overview (20160427)
PDF
Daum 내부 빅데이터 및 클라우드 기술 활용 사례- 윤석찬 (2012)
PDF
AWS CLOUD 2017 - Amazon Aurora를 통한 고성능 데이터베이스 운용하기 (박선용 솔루션즈 아키텍트)
PDF
Cloud dw benchmark using tpd-ds( Snowflake vs Redshift vs EMR Hive )
DynamoDB의 안과밖 - 정민영 (비트패킹 컴퍼니)
RUCK 2017 R로 API 서버를 만드는 4가지 방법(은 삽질기)
빅데이터 구축 사례
Apache hbase overview (20160427)
Daum 내부 빅데이터 및 클라우드 기술 활용 사례- 윤석찬 (2012)
AWS CLOUD 2017 - Amazon Aurora를 통한 고성능 데이터베이스 운용하기 (박선용 솔루션즈 아키텍트)
Cloud dw benchmark using tpd-ds( Snowflake vs Redshift vs EMR Hive )
Ad

Viewers also liked (20)

PDF
SK플래닛 M&C부문 D-spark #6 Social TV
PDF
D spark Season2 3rd_뭐든지 인식하는 recognition 기술
PDF
SK플래닛 M&C부문 D-spark #5 Digital Attraction, Digital Themepark
PDF
SK플래닛 M&C부문 D-spark #9 “디지털・소셜 시대, 컨텐츠 마케팅 째려보기”
PDF
Apache kafka intro_20150313_springloops
KEY
[H3 2012] 꽃보다 Scala
PDF
D spark Season2 2nd적정기술과비즈니스
PDF
D spark Season2 4th_retail이 technology를 만났을 때
PPTX
15. 생각의 탄생 생각도구 13 통합
PDF
PPTX
5. 생각의 탄생 생각도구 3 추상화
PPTX
3. 생각의 탄생 생각도구 1 관찰
PDF
알고 쓰자! HBase | Devon 2012
PPTX
about hadoop yes
PPTX
Apache ZooKeeper 로
 분산 서버 만들기
PDF
스사모 테크톡 - Apache Flink 둘러보기
PPTX
스사모 테크톡 - GraphX
PDF
Zookeeper 소개
PDF
지금 핫한 Real-time In-memory Stream Processing 이야기
PDF
TeraStream for ETL
SK플래닛 M&C부문 D-spark #6 Social TV
D spark Season2 3rd_뭐든지 인식하는 recognition 기술
SK플래닛 M&C부문 D-spark #5 Digital Attraction, Digital Themepark
SK플래닛 M&C부문 D-spark #9 “디지털・소셜 시대, 컨텐츠 마케팅 째려보기”
Apache kafka intro_20150313_springloops
[H3 2012] 꽃보다 Scala
D spark Season2 2nd적정기술과비즈니스
D spark Season2 4th_retail이 technology를 만났을 때
15. 생각의 탄생 생각도구 13 통합
5. 생각의 탄생 생각도구 3 추상화
3. 생각의 탄생 생각도구 1 관찰
알고 쓰자! HBase | Devon 2012
about hadoop yes
Apache ZooKeeper 로
 분산 서버 만들기
스사모 테크톡 - Apache Flink 둘러보기
스사모 테크톡 - GraphX
Zookeeper 소개
지금 핫한 Real-time In-memory Stream Processing 이야기
TeraStream for ETL
Ad

Similar to Legacy System에 BigData적용하기 (DevOn발표자료_1027) (20)

PDF
2012 빅데이터 big data 발표자료
PDF
신규 시장 개척과 클라우드 Offering을 위한 AWS 데이터베이스 서비스 이해 (최유정 데이터베이스 솔루션즈 아키텍트, AWS) :: ...
PDF
BigData Overview
PPTX
엔지니어 관점에서 바라본 데이터시각화
PDF
제2회 사내기술세미나-no sql(배표용)-d-hankim-2013-4-30
PDF
제2회 사내기술세미나-no sql(배표용)-d-hankim-2013-4-30
PDF
[Retail & CPG Day 2019] Amazon.com의 무중단, 대용량 DB패턴과 국내사례 (Lotte e-commerce) - ...
PDF
Expanding Your Data Warehouse with Tajo
PDF
Expanding Your Data Warehouse with Tajo
PDF
Daum내부 Hadoop 활용 사례 | Devon 2012
PDF
MariaDB 마이그레이션 - 네오클로바
PDF
Zeppelin(Spark)으로 데이터 분석하기
PDF
Linked Data 기반 데이터 검색 서비스의 현황과 과제 (KSWC2010)
PDF
나에게 맞는 AWS 데이터베이스 서비스 선택하기 :: 양승도 :: AWS Summit Seoul 2016
PPTX
대용량 분산 아키텍쳐 설계 #3 대용량 분산 시스템 아키텍쳐
PDF
AWS로 사용자 천만 명 서비스 만들기 (윤석찬)- 클라우드 태권 2015
PDF
관계형 데이터베이스의 새로운 패러다임 Amazon Aurora :: 김상필 :: AWS Summit Seoul 2016
PPTX
Mongodb and spatial
PDF
Pg day seoul 2016 session_02_v1.0_ff
PDF
Spark은 왜 이렇게 유명해지고 있을까?
2012 빅데이터 big data 발표자료
신규 시장 개척과 클라우드 Offering을 위한 AWS 데이터베이스 서비스 이해 (최유정 데이터베이스 솔루션즈 아키텍트, AWS) :: ...
BigData Overview
엔지니어 관점에서 바라본 데이터시각화
제2회 사내기술세미나-no sql(배표용)-d-hankim-2013-4-30
제2회 사내기술세미나-no sql(배표용)-d-hankim-2013-4-30
[Retail & CPG Day 2019] Amazon.com의 무중단, 대용량 DB패턴과 국내사례 (Lotte e-commerce) - ...
Expanding Your Data Warehouse with Tajo
Expanding Your Data Warehouse with Tajo
Daum내부 Hadoop 활용 사례 | Devon 2012
MariaDB 마이그레이션 - 네오클로바
Zeppelin(Spark)으로 데이터 분석하기
Linked Data 기반 데이터 검색 서비스의 현황과 과제 (KSWC2010)
나에게 맞는 AWS 데이터베이스 서비스 선택하기 :: 양승도 :: AWS Summit Seoul 2016
대용량 분산 아키텍쳐 설계 #3 대용량 분산 시스템 아키텍쳐
AWS로 사용자 천만 명 서비스 만들기 (윤석찬)- 클라우드 태권 2015
관계형 데이터베이스의 새로운 패러다임 Amazon Aurora :: 김상필 :: AWS Summit Seoul 2016
Mongodb and spatial
Pg day seoul 2016 session_02_v1.0_ff
Spark은 왜 이렇게 유명해지고 있을까?

More from Tae Young Lee (20)

PDF
DeepSeek를 통해 본 Trend (Faculty Tae Young Lee)
PDF
Transitioning from the Era of Big Data to LLMs_Deriving Insights
PDF
Facebook Meta's technical direction in Large Language Models (LLMs)
PDF
MultiModal Embedding integrates various data types, like images, text, and au...
PDF
Review of the Paper on Capabilities of Gemini Models in Medicine
PDF
A future that integrates LLMs and LAMs (Symposium)
PDF
LLMs Service that provides what users want to know
PDF
Exploring Deep Learning Acceleration Technology Embedded in LLMs
PDF
LLM 모델 기반 서비스 실전 가이드
PDF
Recommendation System History
PDF
검색엔진에 적용된 ChatGPT
PDF
검색엔진에 적용된 딥러닝 모델 방법론
PDF
PaLM Paper Review
PDF
The Deep Learning Compiler
PDF
History of Vision AI
PDF
Aws architecture
PDF
Enhanced ai platform
PDF
Nvidia architecture
PDF
Ai based on gpu
PDF
Real estate trust solution
DeepSeek를 통해 본 Trend (Faculty Tae Young Lee)
Transitioning from the Era of Big Data to LLMs_Deriving Insights
Facebook Meta's technical direction in Large Language Models (LLMs)
MultiModal Embedding integrates various data types, like images, text, and au...
Review of the Paper on Capabilities of Gemini Models in Medicine
A future that integrates LLMs and LAMs (Symposium)
LLMs Service that provides what users want to know
Exploring Deep Learning Acceleration Technology Embedded in LLMs
LLM 모델 기반 서비스 실전 가이드
Recommendation System History
검색엔진에 적용된 ChatGPT
검색엔진에 적용된 딥러닝 모델 방법론
PaLM Paper Review
The Deep Learning Compiler
History of Vision AI
Aws architecture
Enhanced ai platform
Nvidia architecture
Ai based on gpu
Real estate trust solution

Legacy System에 BigData적용하기 (DevOn발표자료_1027)