SlideShare a Scribd company logo
© 2013 Gruter. All rights reserved.
보안 로그 분석을 위한
빅데이터 시스템
구축 사례
2013.08.29
장정식 수석 연구원
© 2013 Gruter. All rights reserved.2
Contents
• 보안: Why Big Data?
– Co-work model & Deliverables
– Data life cycle overview
– Data collection
– Storage
– Analysis
– Search on Hadoop
– Detection
– A full picture: qoobah & common
© 2013 Gruter. All rights reserved.3
Why Big Data?
• 전수 데이터
- <> Sample 데이터
- Big Data = no more sampling
- 비용 구조 개선: 더 이상 비용 때문에 확률에 의존하지
않아도 됨
• 통합 데이터
- <> 단편적인 데이터
- 다양한 정보에 대한 360도 insight 필요
- 전사 차원에서의 정보 자산 공유 및 활용
© 2013 Gruter. All rights reserved.4
Co-work model and interaction
보안
분석 전문가
분석 시스템
데이터
프로세스
수집 시스템
빅데이터
운영 팀
모니터링
및 관리
툴
저장 시스템
데이터
빅데이터
기술 팀
기술 교육
© 2013 Gruter. All rights reserved.5
Deliverables
빅데이터 운영
데이터
보안 분석 전문가
분석 시스템
데이터
프로세스
수집 시스템
모니터링 및
관리 툴
저장 시스템
빅데이터
기술 팀
운영 및 기술
교육
© 2013 Gruter. All rights reserved.6
Data life cycle: basic idea
• 데이터를 수집해서
• 통합 저장소에 저장한 다음
• 분석을 통해서 보안 위협을 찾아내고
• 모델을 만들어서
• 실시간 감지 및 대응 시스템에 적용해서
• 보안 공격에 대비한다
• 이 과정을 지속적으로 반복하면서 더 강력하고
지능적인 모델을 만들어서 변화하는 보안 위협에
대응한다
© 2013 Gruter. All rights reserved.7
Data collection
• 다양한 데이터 발생원 = 유연한 수집 시스템
• 실시간 수집 = 이벤트 스트리밍
• 다양한 프로세싱 = pluggable pipeline 구조
• scalability, reliability, extensibility, manageability
• Flume
agent collector
data
storage
data
agent collector
... ...
© 2013 Gruter. All rights reserved.8
Storage
• Main storage
- 확장성 + 안정성 + 배치 분석을 위한 M/R 지원
• 실시간 분석 결과 저장
• 검색용 index 저장소
• Hive (Hadoop)
• elasticsearch
• Hbase
© 2013 Gruter. All rights reserved.9
Analysis
• 종합적인 분석 = 다양한 데이터 ad-hoc 분석
• 시계열 분석 = archiving 된 대용량 데이터 분석
• 실시간 full text 분석
• Hive
• elasticsearch
• cloustream
• Mahout
• Tajo is coming
© 2013 Gruter. All rights reserved.10
HDFS
Search on Hadoop
• Full text 검색
• Hadoop level scalability for search
• Fresh and fast/old and slow; tiered 아키텍쳐
Search engine
ElasticSearch Index
Search engine
ElasticSearch
Index Index Index
…
Data feeding
Index
query for old dataquery for fresh data
Search proxy
periodical move
© 2013 Gruter. All rights reserved.11
Detection
• 실시간/준실시간 스트리밍 프로세싱
• clouStream
• Esper (CEP engine) +Flume
Collector
Realtime
분석 결과 저장소
데이터 Source 데이터 Sink
스트리밍
프로세싱 엔진
Rule Manager
ARM
UI (실시간 분석/관제)
© 2013 Gruter. All rights reserved.12
Qoobah – Big Data Platform
Data source/collector
(various log data)
Data Source
(Web Server)
Flume
Agent
Thrift
Source
Thrift
Sink
Temporary
Data collector/ real-time analysis
Flume Collector
Logical Node
Thrift
Source
Pipeline-Sink
Hadoop
NoSQL
(HBase)
Search
Real-time
Analysis
primary storage(File/Structured), near real-time analysis
Hadoop
DataNode
HBase
RegionServer
Cluster coordinator
Search engine
ElasticSearch
Semi-
Structured
Origin File
Index
Real-time analysis result
storage (File/Structured)
Hadoop
DataNode
HBase
RegionServer
Semi-
Structured
Origin File
Cluster Monitoring
Batch analysis/storage
Hadoop
MapReduce
Origin File
Cloustream
Hive
Hadoop
DataNode
Analysis
Result
Near real-time
analysis
Batch analysis
Data source/collector
(standard protocols
such as FTP, HTTP)
Data Source
Flume
Agent
FTP/
HTTP
Thrift
Sink
Temporary
Oracle/MySQL RDB
Cloumon
Rule Manager
ARMZookeeper
© 2013 Gruter. All rights reserved.13
Cloumon – Monitoring & Management Tools
GRUTER: YOUR PARTNER
IN THE BIG DATA REVOLUTION
Phone +82-70-8129-2950
Fax +82-70-8129-2952
E-mail contact@gruter.com
Web www.gruter.com
© 2013 Gruter. All rights reserved.
Gruter, Inc.
5F Sehwa Office Building 889-70 Daechi-dong, Gangnam-gu, Seoul, South Korea 135-839

More Related Content

PDF
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: Bioinformatics Data를 위한 Hadoop기반...
PDF
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: SNS 서비스 아키텍쳐 구축 사례
PDF
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 온라인 컨텐츠 서비스를 위한 빅데이터 구축 사례
PDF
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 인터넷 쇼핑몰의 실시간 분석 플랫폼 구축 사례
PDF
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개
PDF
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: Tajo와 SQL-on-Hadoop
PDF
234 deview2013 김형준
PDF
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: Bioinformatics Data를 위한 Hadoop기반...
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: SNS 서비스 아키텍쳐 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 온라인 컨텐츠 서비스를 위한 빅데이터 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 인터넷 쇼핑몰의 실시간 분석 플랫폼 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: GRUTER의 빅데이터 플랫폼 및 전략 소개
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: Tajo와 SQL-on-Hadoop
234 deview2013 김형준
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개

What's hot (20)

PPTX
Io t에서 big data를 통합하는 통합 빅데이터 플랫폼 flamingo_클라우다인_김병곤 대표이사
PDF
Daum내부 Hadoop 활용 사례 | Devon 2012
PPTX
DeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun Kim
PPTX
SQL-on-Hadoop with Apache Tajo, and application case of SK Telecom
PPTX
빅데이터 구축 사례
PPTX
[경북] I'mcloud information
PDF
Tajo TPC-H Benchmark Test on AWS
PDF
실시간 빅 데이터 기술 현황 및 Daum 활용 사례 소개 (2013)
PDF
[Open Technet Summit 2014] 쓰기 쉬운 Hadoop 기반 빅데이터 플랫폼 아키텍처 및 활용 방안
PDF
빅데이터 기술 현황과 시장 전망(2014)
PDF
빅데이터, big data
PPTX
Gpdb best practices v a01 20150313
PDF
Expanding Your Data Warehouse with Tajo
PPTX
Introduction to Hadoop, Big Data, Training, Use Cases
PDF
2012 빅데이터 big data 발표자료
PDF
3 빅데이터기반비정형데이터의실시간처리방법 원종석
PDF
스타트업사례로 본 로그 데이터분석 : Tajo on AWS
PPTX
Introduction to Apache Tajo
PDF
하둡 알아보기(Learn about Hadoop basic), NetApp FAS NFS Connector for Hadoop
PDF
Big data analysis with R and Apache Tajo (in Korean)
Io t에서 big data를 통합하는 통합 빅데이터 플랫폼 flamingo_클라우다인_김병곤 대표이사
Daum내부 Hadoop 활용 사례 | Devon 2012
DeView2013 Big Data Platform Architecture with Hadoop - Hyeong-jun Kim
SQL-on-Hadoop with Apache Tajo, and application case of SK Telecom
빅데이터 구축 사례
[경북] I'mcloud information
Tajo TPC-H Benchmark Test on AWS
실시간 빅 데이터 기술 현황 및 Daum 활용 사례 소개 (2013)
[Open Technet Summit 2014] 쓰기 쉬운 Hadoop 기반 빅데이터 플랫폼 아키텍처 및 활용 방안
빅데이터 기술 현황과 시장 전망(2014)
빅데이터, big data
Gpdb best practices v a01 20150313
Expanding Your Data Warehouse with Tajo
Introduction to Hadoop, Big Data, Training, Use Cases
2012 빅데이터 big data 발표자료
3 빅데이터기반비정형데이터의실시간처리방법 원종석
스타트업사례로 본 로그 데이터분석 : Tajo on AWS
Introduction to Apache Tajo
하둡 알아보기(Learn about Hadoop basic), NetApp FAS NFS Connector for Hadoop
Big data analysis with R and Apache Tajo (in Korean)
Ad

Viewers also liked (15)

PDF
Cloumon enterprise
PDF
빅데이터와 보안
PDF
보안사고의 이면
PPTX
화요일 설찬수유태혁오진주123
PDF
자동인식&스마트SCM(MONTHLY AIDC+SMART SCM) 2013년 10월호
PDF
oVirt introduction
PDF
보안과 빅데이터의 올바른 접목
PPTX
Logstash, ElasticSearch, Kibana
PDF
XECon+PHPFest2014 발표자료 - ElasticSearch를 이용한 통합검색 구축방법 - 김훈민
PDF
스마트폰 App 기획 사업 전략
PDF
엘라스틱서치, 로그스태시, 키바나
PDF
모바일 서비스 기획 시작하기
PPTX
20140915 (주)우노플러스 회사소개서
PPT
서비스모델별 표준화요소 Final
PDF
# Startup building process liftup
Cloumon enterprise
빅데이터와 보안
보안사고의 이면
화요일 설찬수유태혁오진주123
자동인식&스마트SCM(MONTHLY AIDC+SMART SCM) 2013년 10월호
oVirt introduction
보안과 빅데이터의 올바른 접목
Logstash, ElasticSearch, Kibana
XECon+PHPFest2014 발표자료 - ElasticSearch를 이용한 통합검색 구축방법 - 김훈민
스마트폰 App 기획 사업 전략
엘라스틱서치, 로그스태시, 키바나
모바일 서비스 기획 시작하기
20140915 (주)우노플러스 회사소개서
서비스모델별 표준화요소 Final
# Startup building process liftup
Ad

Similar to GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 보안 로그 분석을 위한 빅데이터 시스템 구축 사례 (20)

PDF
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
PDF
Big data 20111203_배포판
PDF
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
PPT
Big Data Overview
PPT
빅데이터 기본개념
PPTX
Big data application architecture 요약2
PPTX
Big data
PPTX
An introduction to hadoop
PDF
OpenSource Big Data Platform : Flamingo Project
PDF
OpenSource Big Data Platform - Flamingo v7
PDF
Flamingo project v4
PDF
OpenSource Big Data Platform - Flamingo 소개와 활용
PPTX
[경북] I'mcloud opensight
PDF
데이터폭발시대의실시간데이터분석
PDF
빅데이터 처리기술의 이해
PDF
AWS 기반 데이터 레이크(Datalake) 구축 및 분석 - 김민성 (AWS 솔루션즈아키텍트) : 8월 온라인 세미나
PPTX
Apache spark 소개 및 실습
PDF
[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...
PDF
Rankwave MOMENT™ (Korean)
PDF
MS 빅데이터 서비스 및 게임사 PoC 사례 소개
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
Big data 20111203_배포판
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
Big Data Overview
빅데이터 기본개념
Big data application architecture 요약2
Big data
An introduction to hadoop
OpenSource Big Data Platform : Flamingo Project
OpenSource Big Data Platform - Flamingo v7
Flamingo project v4
OpenSource Big Data Platform - Flamingo 소개와 활용
[경북] I'mcloud opensight
데이터폭발시대의실시간데이터분석
빅데이터 처리기술의 이해
AWS 기반 데이터 레이크(Datalake) 구축 및 분석 - 김민성 (AWS 솔루션즈아키텍트) : 8월 온라인 세미나
Apache spark 소개 및 실습
[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...
Rankwave MOMENT™ (Korean)
MS 빅데이터 서비스 및 게임사 PoC 사례 소개

More from Gruter (20)

PDF
MelOn 빅데이터 플랫폼과 Tajo 이야기
PDF
Introduction to Apache Tajo: Future of Data Warehouse
PDF
Expanding Your Data Warehouse with Tajo
PDF
Introduction to Apache Tajo: Data Warehouse for Big Data
PDF
What's New Tajo 0.10 and Its Beyond
PDF
Efficient In­‐situ Processing of Various Storage Types on Apache Tajo
PDF
Data analysis with Tajo
PDF
Gruter TECHDAY 2014 Realtime Processing in Telco
PPTX
Gruter TECHDAY 2014 MelOn BigData
PDF
Gruter_TECHDAY_2014_04_TajoCloudHandsOn (in Korean)
PPTX
Gruter_TECHDAY_2014_03_ApacheTajo (in Korean)
PDF
Gruter_TECHDAY_2014_01_SearchEngine (in Korean)
PPTX
Apache Tajo - BWC 2014
PPTX
Elastic Search Performance Optimization - Deview 2014
PPTX
Hadoop security DeView 2014
PPTX
Vectorized processing in_a_nutshell_DeView2014
PPTX
Big Data Camp LA 2014 - Apache Tajo: A Big Data Warehouse System on Hadoop
PPTX
Hadoop Summit 2014: Query Optimization and JIT-based Vectorized Execution in ...
PDF
Cloumon sw제품설명회 발표자료
PPTX
Tajo and SQL-on-Hadoop in Tech Planet 2013
MelOn 빅데이터 플랫폼과 Tajo 이야기
Introduction to Apache Tajo: Future of Data Warehouse
Expanding Your Data Warehouse with Tajo
Introduction to Apache Tajo: Data Warehouse for Big Data
What's New Tajo 0.10 and Its Beyond
Efficient In­‐situ Processing of Various Storage Types on Apache Tajo
Data analysis with Tajo
Gruter TECHDAY 2014 Realtime Processing in Telco
Gruter TECHDAY 2014 MelOn BigData
Gruter_TECHDAY_2014_04_TajoCloudHandsOn (in Korean)
Gruter_TECHDAY_2014_03_ApacheTajo (in Korean)
Gruter_TECHDAY_2014_01_SearchEngine (in Korean)
Apache Tajo - BWC 2014
Elastic Search Performance Optimization - Deview 2014
Hadoop security DeView 2014
Vectorized processing in_a_nutshell_DeView2014
Big Data Camp LA 2014 - Apache Tajo: A Big Data Warehouse System on Hadoop
Hadoop Summit 2014: Query Optimization and JIT-based Vectorized Execution in ...
Cloumon sw제품설명회 발표자료
Tajo and SQL-on-Hadoop in Tech Planet 2013

GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 보안 로그 분석을 위한 빅데이터 시스템 구축 사례

  • 1. © 2013 Gruter. All rights reserved. 보안 로그 분석을 위한 빅데이터 시스템 구축 사례 2013.08.29 장정식 수석 연구원
  • 2. © 2013 Gruter. All rights reserved.2 Contents • 보안: Why Big Data? – Co-work model & Deliverables – Data life cycle overview – Data collection – Storage – Analysis – Search on Hadoop – Detection – A full picture: qoobah & common
  • 3. © 2013 Gruter. All rights reserved.3 Why Big Data? • 전수 데이터 - <> Sample 데이터 - Big Data = no more sampling - 비용 구조 개선: 더 이상 비용 때문에 확률에 의존하지 않아도 됨 • 통합 데이터 - <> 단편적인 데이터 - 다양한 정보에 대한 360도 insight 필요 - 전사 차원에서의 정보 자산 공유 및 활용
  • 4. © 2013 Gruter. All rights reserved.4 Co-work model and interaction 보안 분석 전문가 분석 시스템 데이터 프로세스 수집 시스템 빅데이터 운영 팀 모니터링 및 관리 툴 저장 시스템 데이터 빅데이터 기술 팀 기술 교육
  • 5. © 2013 Gruter. All rights reserved.5 Deliverables 빅데이터 운영 데이터 보안 분석 전문가 분석 시스템 데이터 프로세스 수집 시스템 모니터링 및 관리 툴 저장 시스템 빅데이터 기술 팀 운영 및 기술 교육
  • 6. © 2013 Gruter. All rights reserved.6 Data life cycle: basic idea • 데이터를 수집해서 • 통합 저장소에 저장한 다음 • 분석을 통해서 보안 위협을 찾아내고 • 모델을 만들어서 • 실시간 감지 및 대응 시스템에 적용해서 • 보안 공격에 대비한다 • 이 과정을 지속적으로 반복하면서 더 강력하고 지능적인 모델을 만들어서 변화하는 보안 위협에 대응한다
  • 7. © 2013 Gruter. All rights reserved.7 Data collection • 다양한 데이터 발생원 = 유연한 수집 시스템 • 실시간 수집 = 이벤트 스트리밍 • 다양한 프로세싱 = pluggable pipeline 구조 • scalability, reliability, extensibility, manageability • Flume agent collector data storage data agent collector ... ...
  • 8. © 2013 Gruter. All rights reserved.8 Storage • Main storage - 확장성 + 안정성 + 배치 분석을 위한 M/R 지원 • 실시간 분석 결과 저장 • 검색용 index 저장소 • Hive (Hadoop) • elasticsearch • Hbase
  • 9. © 2013 Gruter. All rights reserved.9 Analysis • 종합적인 분석 = 다양한 데이터 ad-hoc 분석 • 시계열 분석 = archiving 된 대용량 데이터 분석 • 실시간 full text 분석 • Hive • elasticsearch • cloustream • Mahout • Tajo is coming
  • 10. © 2013 Gruter. All rights reserved.10 HDFS Search on Hadoop • Full text 검색 • Hadoop level scalability for search • Fresh and fast/old and slow; tiered 아키텍쳐 Search engine ElasticSearch Index Search engine ElasticSearch Index Index Index … Data feeding Index query for old dataquery for fresh data Search proxy periodical move
  • 11. © 2013 Gruter. All rights reserved.11 Detection • 실시간/준실시간 스트리밍 프로세싱 • clouStream • Esper (CEP engine) +Flume Collector Realtime 분석 결과 저장소 데이터 Source 데이터 Sink 스트리밍 프로세싱 엔진 Rule Manager ARM UI (실시간 분석/관제)
  • 12. © 2013 Gruter. All rights reserved.12 Qoobah – Big Data Platform Data source/collector (various log data) Data Source (Web Server) Flume Agent Thrift Source Thrift Sink Temporary Data collector/ real-time analysis Flume Collector Logical Node Thrift Source Pipeline-Sink Hadoop NoSQL (HBase) Search Real-time Analysis primary storage(File/Structured), near real-time analysis Hadoop DataNode HBase RegionServer Cluster coordinator Search engine ElasticSearch Semi- Structured Origin File Index Real-time analysis result storage (File/Structured) Hadoop DataNode HBase RegionServer Semi- Structured Origin File Cluster Monitoring Batch analysis/storage Hadoop MapReduce Origin File Cloustream Hive Hadoop DataNode Analysis Result Near real-time analysis Batch analysis Data source/collector (standard protocols such as FTP, HTTP) Data Source Flume Agent FTP/ HTTP Thrift Sink Temporary Oracle/MySQL RDB Cloumon Rule Manager ARMZookeeper
  • 13. © 2013 Gruter. All rights reserved.13 Cloumon – Monitoring & Management Tools
  • 14. GRUTER: YOUR PARTNER IN THE BIG DATA REVOLUTION Phone +82-70-8129-2950 Fax +82-70-8129-2952 E-mail contact@gruter.com Web www.gruter.com © 2013 Gruter. All rights reserved. Gruter, Inc. 5F Sehwa Office Building 889-70 Daechi-dong, Gangnam-gu, Seoul, South Korea 135-839