빅데이터 ~ 머신(딥)러닝
실무로 배우는 빅데이터 기술
 스쿱(Sqoop)-Import 활용
☆ 확장하기 - 2편 ☆
김강원
스쿱-Import 는?
Hadoop에서 RDBMS의 대용량 데이터셋을 Import 하는 기능
※ Sqoop의 기본 개념과 기능들은 구글링을 통해 확인 하세요!
파일럿 프로젝트 확장 (1/2)
책 360 페이지 중에서… (개정판)
스쿱 – Import 활용
파일럿 프로젝트 확장 (2/2)
확장편 실습
스쿱 – Import 활용
 Server01 접속
 DB Driver 복사
$ cp /opt/cloudera/parcels/CDH/jars/postgresql-9.0-801.jdbc4.jar
/opt/cloudera/parcels/CDH/lib/sqoop/lib
Step-1
 PostgreSQL의 접속 계정/비번 확인
$ cat /var/lib/cloudera-scm-server-db/data/generated_password.txt
Step-2
 PostgreSQL 접속
$ psql -U cloudera-scm -p 7432 -h localhost -d postgres
Step-3
 Import 할 데이터 확인
postgres=# select * from smartcar_symptom_info;
Step-4
 PostgreSQL  HDFS로 가져오기(Import) 실행
$ sqoop import --connect jdbc:postgresql://127.0.0.1:7432/postgres --username cloudera-scm --
password Cw1zSFSFy6 --target-dir /pilot-pjt/collect/sqoop/car-symptom --query "select * from
smartcar_symptom_info where $CONDITIONS AND speed_p_symptom = '비정상'" --num-
mappers 1
Step-5
 Hue에서 데이터 확인
http://server02.hadoop.com:8888
Step-6
실무로 배우는 빅데이터 기술
확장하기 2편 – Sqoop Import 활용
[ 강의자료 ]
 동 영 상: 유튜브 www.youtube.com
 실습문서: 슬라이드쉐어 www.slideshare.net

More Related Content

PDF
6. Application - NiFi
PDF
1. Application - Pig
PDF
7. Application - Hive Bucket
PDF
9. Application - WebHDFS
PDF
5. Install - NiFi
PDF
17. Application - Nutch + Solr
PDF
16. Install - Nutch
PDF
4. Application - Oozie Fork
6. Application - NiFi
1. Application - Pig
7. Application - Hive Bucket
9. Application - WebHDFS
5. Install - NiFi
17. Application - Nutch + Solr
16. Install - Nutch
4. Application - Oozie Fork

What's hot (20)

PDF
18. Install - Spark Streaming Env.
PDF
19. Application - Spark Streaming 1
PDF
10. Install - Phoenix
PDF
11. Application - Phoenix
PDF
3. Install - Tensorflow
PDF
[온라인교육시리즈] 네이버 클라우드 플랫폼 init script 활용법 소개(정낙수 클라우드 솔루션 아키텍트)
PDF
15. Application - Solr Indexing & Searching
PPTX
구글Fin
PDF
[온라인교육시리즈] Jupyter를 이용한 분석 환경 구축하기 - 허창현 클라우드 솔루션 아키텍트
PDF
Airflow introduce
PDF
Grafana Review
PDF
Custom DevOps Monitoring System in MelOn (with InfluxDB + Telegraf + Grafana)
PDF
RUCK 2017 - 강병엽 - Spark와 R을 연동한 빅데이터 분석
KEY
Data URI Scheme
PPSX
CUBRIDInside_5th_CUBRID_Migration Process_DHLee
PDF
[Pgday.Seoul 2017] 1. PostGIS의 사례로 본 PostgreSQL 확장 - 장병진
PDF
하둡-맵리듀스 튜닝 방법
PPTX
Ubuntu & C9(node.js) with AWS
PPTX
좌충우돌 CLOUD 학습기(이동민)
PDF
Zeppelin and Open Source Ecosystem and Silicon Valley
18. Install - Spark Streaming Env.
19. Application - Spark Streaming 1
10. Install - Phoenix
11. Application - Phoenix
3. Install - Tensorflow
[온라인교육시리즈] 네이버 클라우드 플랫폼 init script 활용법 소개(정낙수 클라우드 솔루션 아키텍트)
15. Application - Solr Indexing & Searching
구글Fin
[온라인교육시리즈] Jupyter를 이용한 분석 환경 구축하기 - 허창현 클라우드 솔루션 아키텍트
Airflow introduce
Grafana Review
Custom DevOps Monitoring System in MelOn (with InfluxDB + Telegraf + Grafana)
RUCK 2017 - 강병엽 - Spark와 R을 연동한 빅데이터 분석
Data URI Scheme
CUBRIDInside_5th_CUBRID_Migration Process_DHLee
[Pgday.Seoul 2017] 1. PostGIS의 사례로 본 PostgreSQL 확장 - 장병진
하둡-맵리듀스 튜닝 방법
Ubuntu & C9(node.js) with AWS
좌충우돌 CLOUD 학습기(이동민)
Zeppelin and Open Source Ecosystem and Silicon Valley
Ad

Similar to 2. Application - Sqoop Import (15)

PDF
Apache sqoop
PDF
Hadoop발표자료
PDF
Spark_Overview_qna
PPTX
An introduction to hadoop
PPT
Big Data Overview
PPTX
하둡 시스템에 대한 10분 소개
PPTX
Hadoop 기반 빅데이터 이해
PDF
빅데이터 분석을 위한 스파크 2 프로그래밍 : 대용량 데이터 처리부터 머신러닝까지
PDF
Cloudera session seoul - Spark bootcamp
PPT
빅데이터 기본개념
PDF
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
PDF
빅데이터 기술 현황과 시장 전망(2014)
PDF
서울 하둡 사용자 모임 발표자료
PPTX
[D2 COMMUNITY] Spark User Group - 스파크를 통한 딥러닝 이론과 실제
PDF
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
Apache sqoop
Hadoop발표자료
Spark_Overview_qna
An introduction to hadoop
Big Data Overview
하둡 시스템에 대한 10분 소개
Hadoop 기반 빅데이터 이해
빅데이터 분석을 위한 스파크 2 프로그래밍 : 대용량 데이터 처리부터 머신러닝까지
Cloudera session seoul - Spark bootcamp
빅데이터 기본개념
201210 그루터 빅데이터_플랫폼_아키텍쳐_및_솔루션_소개
빅데이터 기술 현황과 시장 전망(2014)
서울 하둡 사용자 모임 발표자료
[D2 COMMUNITY] Spark User Group - 스파크를 통한 딥러닝 이론과 실제
Hadoop과 SQL-on-Hadoop (A short intro to Hadoop and SQL-on-Hadoop)
Ad

2. Application - Sqoop Import

  • 1. 빅데이터 ~ 머신(딥)러닝 실무로 배우는 빅데이터 기술  스쿱(Sqoop)-Import 활용 ☆ 확장하기 - 2편 ☆ 김강원
  • 2. 스쿱-Import 는? Hadoop에서 RDBMS의 대용량 데이터셋을 Import 하는 기능 ※ Sqoop의 기본 개념과 기능들은 구글링을 통해 확인 하세요!
  • 4. 책 360 페이지 중에서… (개정판) 스쿱 – Import 활용 파일럿 프로젝트 확장 (2/2)
  • 6.  Server01 접속  DB Driver 복사 $ cp /opt/cloudera/parcels/CDH/jars/postgresql-9.0-801.jdbc4.jar /opt/cloudera/parcels/CDH/lib/sqoop/lib Step-1  PostgreSQL의 접속 계정/비번 확인 $ cat /var/lib/cloudera-scm-server-db/data/generated_password.txt Step-2  PostgreSQL 접속 $ psql -U cloudera-scm -p 7432 -h localhost -d postgres Step-3
  • 7.  Import 할 데이터 확인 postgres=# select * from smartcar_symptom_info; Step-4  PostgreSQL  HDFS로 가져오기(Import) 실행 $ sqoop import --connect jdbc:postgresql://127.0.0.1:7432/postgres --username cloudera-scm -- password Cw1zSFSFy6 --target-dir /pilot-pjt/collect/sqoop/car-symptom --query "select * from smartcar_symptom_info where $CONDITIONS AND speed_p_symptom = '비정상'" --num- mappers 1 Step-5  Hue에서 데이터 확인 http://server02.hadoop.com:8888 Step-6
  • 8. 실무로 배우는 빅데이터 기술 확장하기 2편 – Sqoop Import 활용 [ 강의자료 ]  동 영 상: 유튜브 www.youtube.com  실습문서: 슬라이드쉐어 www.slideshare.net