SlideShare a Scribd company logo
채용 설명회 | DEVSISTERS 박주홍
데이터 엔지니어는 무슨 일을 하나요?
J.Park@devsisters.com
2007 KAIST 입학
2013 DEVSISTERS
• Server Engineer
• Data Engineer
• KAIST 데이터 연구, CHI LBW 발표
• Data Science & Infrastructure 팀장
2007 KAIST 입학
2013 DEVSISTERS
• Server Engineer
• Data Engineer
• KAIST 데이터 연구, CHI LBW 발표
• Data Science & Infrastructure 팀장
입학 후에 강산이 한번 바뀌고
2016 KAIST 수리과학과 졸업
01 빅데이터가 뭔가요?
V3
Volume
Variety
Velocity
V4
Volume
Variety
Velocity
Value
V5
Volume
Variety
Velocity
Value
Veracity
VX
Volume
Variety
Velocity
Value
Veracity
V…
V…
V…
V…
V…
VX Plus
Volume
Variety
Velocity
Value
Veracity
V…
V…
V…
V…
V…
+…
그것보다
Real World 에서 느끼는
빅데이터란
Single Server
Single Server
Out of Memory
Single Server
Disk Full
Big Data > Single Server
02 그러면 데이터 엔지니어는 뭘 하나요?
Big Data > Single Server
Single Server → Multi Server
Big Data < Multi Server
Server Cluster
Server Cluster
Cluster Management
Parallel Computing
Load Balancing
데이터 엔지니어는 빅데이터를 처리합니다.
빅데이터를 처리하기 위해 서버 클러스터를 사용합니다.
서버 클러스터로 빅데이터를 처리하면서 발생하는 다양한
Cluster Management
Parallel Computing
Load Balancing
문제를 해결합니다.
03 데브시스터즈에서는 어떻게 문제를 해결하나요?
Server Cluster
Server Cluster
Which
Where
[KAIST 채용설명회] 데이터 엔지니어는 무슨 일을 하나요?
Reference: www.jenunderwood.com
• 분산 처리 클러스터 엔진
• 메모리 기반의 빠른 분석 지원
• SQL, DataFrame 지원
[KAIST 채용설명회] 데이터 엔지니어는 무슨 일을 하나요?
EC2 S3
EC2
• Cloud Server
• 원하는 때 원하는 만큼 서버 생성
• 사용한 만큼 비용 지불
• Cloud Storage
• 병렬 업로드, 병렬 다운로드 지원
• 저장한 만큼 비용 지불
S3
[KAIST 채용설명회] 데이터 엔지니어는 무슨 일을 하나요?
EC2 Cluster
S3
EC2 Cluster
S3
EC2 Cluster
S3
EC2 Cluster
Two More Things
S3
EC2 Cluster
S3
EC2 Cluster
S3
EC2 Cluster
Airflow
[KAIST 채용설명회] 데이터 엔지니어는 무슨 일을 하나요?
New York 에서 진행된
Spark Summit 에 출장가서
Flintrock 개발자와 미팅
[KAIST 채용설명회] 데이터 엔지니어는 무슨 일을 하나요?
DEVSISTSERS 로
Flintrock 개발자를 초청해서
필요한 기능을 공동개발
[KAIST 채용설명회] 데이터 엔지니어는 무슨 일을 하나요?
S3
EC2 Cluster
Airflow
04 DEVSISTERS 는 어떤 데이터 엔지니어를 뽑나요?
1TB 이상 빅데이터를 처리해보신분
Reference: tvN 알바트로스
데이터 엔지니어 신입의 경우
빅데이터를 1TB 이상 구할 수 없거나
빅데이터를 다룰 서버 클러스터가 없기 때문에
사실상 빅데이터를 다룬 경력이 있을 수가 없다.
그래서 빅데이터 기술보다는
전산학 기본기와
데이터 엔지니어에게 필요한 자질을
중점으로 평가합니다.
Python
Linux
Python
Linux
Data Structure
System Engineering
테스트를 확실하게 진행하는 꼼꼼함
실전에서 지속적으로 제품을 개선하는 책임감
Python
Linux
Data Structure
System Engineering
빅데이터 세션은
일어서서 보는 정도가 아니라
강의장 밖에서도 본다.
데이터 엔지니어로 성장하고 싶다면
막강한 권한과 자유로 기회를 제공하는
그렇지만 막중한 책임과 기대에 부응해야 하는
DEVSISTERS 로 오십시오.
빅데이터 전투력 1024TB 을 넘겨보고 싶으신 분
빅데이터 전투력 측정기 폭발시키고 싶으신 분!
환영합니다
J.Park@devsisters.com

More Related Content

PPTX
Data pipeline and data lake
PDF
Spark + S3 + R3를 이용한 데이터 분석 시스템 만들기
PDF
Little Big Data #1. 바닥부터 시작하는 데이터 인프라
PDF
[236] 카카오의데이터파이프라인 윤도영
PDF
Data Engineering 101
PDF
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
PDF
webservice scaling for newbie
PPTX
[DevGround] 린하게 구축하는 스타트업 데이터파이프라인
Data pipeline and data lake
Spark + S3 + R3를 이용한 데이터 분석 시스템 만들기
Little Big Data #1. 바닥부터 시작하는 데이터 인프라
[236] 카카오의데이터파이프라인 윤도영
Data Engineering 101
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
webservice scaling for newbie
[DevGround] 린하게 구축하는 스타트업 데이터파이프라인

What's hot (20)

PDF
BigQuery의 모든 것(기획자, 마케터, 신입 데이터 분석가를 위한) 입문편
PPTX
로그 기깔나게 잘 디자인하는 법
PDF
대용량 로그분석 Bigquery로 간단히 사용하기 (20170215 T아카데미)
PDF
How to build massive service for advance
PDF
YugabyteDBを使ってみよう(NewSQL/分散SQLデータベースよろず勉強会 #1 発表資料)
PDF
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유 (2부)
PDF
Presto ベースのマネージドサービス Amazon Athena
PDF
そんなトランザクションマネージャで大丈夫か?
PPTX
Bigquery와 airflow를 이용한 데이터 분석 시스템 구축 v1 나무기술(주) 최유석 20170912
PDF
파이썬 생존 안내서 (자막)
PDF
Massive service basic
PDF
성장을 좋아하는 사람이, 성장하고 싶은 사람에게
PDF
[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축
PDF
Spark 의 핵심은 무엇인가? RDD! (RDD paper review)
PDF
고려대학교 컴퓨터학과 특강 - 대학생 때 알았더라면 좋았을 것들
PDF
데이터가 흐르는 조직 만들기 - 마이리얼트립
PDF
At least onceってぶっちゃけ問題の先送りだったよね #kafkajp
PDF
EC2のストレージどう使う? -Instance Storageを理解して高速IOを上手に活用!-
PDF
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
PDF
쿠키런: 킹덤 대규모 인프라 및 서버 운영 사례 공유 [데브시스터즈 - 레벨 200] - 발표자: 용찬호, R&D 엔지니어, 데브시스터즈 ...
BigQuery의 모든 것(기획자, 마케터, 신입 데이터 분석가를 위한) 입문편
로그 기깔나게 잘 디자인하는 법
대용량 로그분석 Bigquery로 간단히 사용하기 (20170215 T아카데미)
How to build massive service for advance
YugabyteDBを使ってみよう(NewSQL/分散SQLデータベースよろず勉強会 #1 発表資料)
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유 (2부)
Presto ベースのマネージドサービス Amazon Athena
そんなトランザクションマネージャで大丈夫か?
Bigquery와 airflow를 이용한 데이터 분석 시스템 구축 v1 나무기술(주) 최유석 20170912
파이썬 생존 안내서 (자막)
Massive service basic
성장을 좋아하는 사람이, 성장하고 싶은 사람에게
[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축
Spark 의 핵심은 무엇인가? RDD! (RDD paper review)
고려대학교 컴퓨터학과 특강 - 대학생 때 알았더라면 좋았을 것들
데이터가 흐르는 조직 만들기 - 마이리얼트립
At least onceってぶっちゃけ問題の先送りだったよね #kafkajp
EC2のストレージどう使う? -Instance Storageを理解して高速IOを上手に活用!-
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
쿠키런: 킹덤 대규모 인프라 및 서버 운영 사례 공유 [데브시스터즈 - 레벨 200] - 발표자: 용찬호, R&D 엔지니어, 데브시스터즈 ...
Ad

Similar to [KAIST 채용설명회] 데이터 엔지니어는 무슨 일을 하나요? (20)

PDF
data direct소개__DB 미들웨어
PDF
03 바이소프트
PDF
AWS Summit Seoul 2015 - 엔터프라이즈에서의 하이브리드 환경 전략
PDF
Azure Databases for PostgreSQL MYSQL and MariaDB
PPTX
CDNetowks MariaDB 5.5 Upgrade Case Study
PDF
[DEVIEW 2021] 1000만 글로벌 유저를 지탱하는 기술과 사람들
PDF
Internet Scale Service Arichitecture
PDF
레코벨의 추천 서비스 고군 분투기 - AWS Summit Seoul 2017
PDF
Scalable webservice
PDF
빅데이터 인공지능 전략 및 로드맵
PDF
SQL Server to Azure SQL Database Migration
PDF
변화와 혁신을 위한 클라우드 마이그레이션 – 김진우 AWS 어카운트 매니저, 이아영 네오위즈 가버너스팀 팀장, 박주희 우아한형제들 시스템신...
PDF
KOSTA 소프트웨어 재직자 교육과정 수강안내 브로셔 A4_20250701.pdf
PDF
20181108 HBSmith에서는 이렇게 AWS IaC로 배포한다
PDF
[PAG 비즈니스 플랫폼데이] 쉽고 빠른 IoT 클라우드 서비스
PPT
QlikView ppt
PDF
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
PDF
SK플래닛_README_마이크로서비스 아키텍처로 개발하기
PDF
re:Invent 2015 이모저모 - 키노트 요약 (윤석찬) :: re:Invent re:Cap 2015 웨비나
PPTX
마이크로서비스 아키텍처로 개발하기
data direct소개__DB 미들웨어
03 바이소프트
AWS Summit Seoul 2015 - 엔터프라이즈에서의 하이브리드 환경 전략
Azure Databases for PostgreSQL MYSQL and MariaDB
CDNetowks MariaDB 5.5 Upgrade Case Study
[DEVIEW 2021] 1000만 글로벌 유저를 지탱하는 기술과 사람들
Internet Scale Service Arichitecture
레코벨의 추천 서비스 고군 분투기 - AWS Summit Seoul 2017
Scalable webservice
빅데이터 인공지능 전략 및 로드맵
SQL Server to Azure SQL Database Migration
변화와 혁신을 위한 클라우드 마이그레이션 – 김진우 AWS 어카운트 매니저, 이아영 네오위즈 가버너스팀 팀장, 박주희 우아한형제들 시스템신...
KOSTA 소프트웨어 재직자 교육과정 수강안내 브로셔 A4_20250701.pdf
20181108 HBSmith에서는 이렇게 AWS IaC로 배포한다
[PAG 비즈니스 플랫폼데이] 쉽고 빠른 IoT 클라우드 서비스
QlikView ppt
[DDC 2018] Metatron 오픈소스화 및 생태계 구축 (SKT 이정룡, 김지호)
SK플래닛_README_마이크로서비스 아키텍처로 개발하기
re:Invent 2015 이모저모 - 키노트 요약 (윤석찬) :: re:Invent re:Cap 2015 웨비나
마이크로서비스 아키텍처로 개발하기
Ad

[KAIST 채용설명회] 데이터 엔지니어는 무슨 일을 하나요?