SlideShare a Scribd company logo
박이삭
2019-09-03
BigQuery With Python
• Query 조회
• 배치 자동화
• 기계학습
Python with Bigquery BigQuery with Python
• Storage Upload
• 테이블 생성 자동화
pip install --upgrade google-auth
pip install --upgrade google-cloud-bigquery
pip install pandas-gbq
2019-08-23 기준 Anaconda에서 잘 작동됨.
Connect Bigquery with python
• 빅쿼리에서 다운받은 key파일
• 이후 예시부터는 공식 홈페이지에 있는 예시를 이용했습니다.
from google.oauth2 import service_account
from google.cloud import bigquery
import pandas_gbq
cred_path = 'D:데이터분석BigQuerybigquery_IAM_key.json'
credentials = service_account.Credentials.from_service_account_file(cred_path)
client = bigquery.Client(credentials= credentials, project='프로젝트 이름')
sample_qry = '''
SELECT name FROM `bigquery-public-data.usa_names.usa_1910_2013`
WHERE state = "TX"
LIMIT 100
'''
df = client.query(sample_qry).to_dataframe()
df.head()
방법 1
방법 2
df_pandas = pandas_gbq.read_gbq(query=sample_qry,
project_id="프로젝트 이름",
credentials= credentials)
방법 3 – 변수 활용
def var_qry(state):
qry = f'''
SELECT name FROM `bigquery-public-data.usa_names.usa_1910_2013`
WHERE state = "{state}"
LIMIT 100
'''
return qry
df_pandas_var = pandas_gbq.read_gbq(query=var_qry(state='TX'),
project_id="프로젝트 이름",
credentials= credentials)

More Related Content

PDF
[236] 카카오의데이터파이프라인 윤도영
PDF
手作業なしの安定環境実現に向けたZabbix活用方法紹介+Zabbix2.4最新機能紹介
PDF
PUBG: Battlegrounds 라이브 서비스 EKS 전환 사례 공유 [크래프톤 - 레벨 300] - 발표자: 김정헌, PUBG Dev...
PDF
脆弱性検査ツールってどうよ
PPTX
クラウドでも非機能要求グレードは必要だよね
PDF
JenkinsとCodeBuildとCloud Buildと私
PDF
Amazon ElastiCacheのはじめ方
PPTX
API Gateway - ヘッダー/クエリー変換、認証・認可機能詳細
[236] 카카오의데이터파이프라인 윤도영
手作業なしの安定環境実現に向けたZabbix活用方法紹介+Zabbix2.4最新機能紹介
PUBG: Battlegrounds 라이브 서비스 EKS 전환 사례 공유 [크래프톤 - 레벨 300] - 발표자: 김정헌, PUBG Dev...
脆弱性検査ツールってどうよ
クラウドでも非機能要求グレードは必要だよね
JenkinsとCodeBuildとCloud Buildと私
Amazon ElastiCacheのはじめ方
API Gateway - ヘッダー/クエリー変換、認証・認可機能詳細

What's hot (20)

PDF
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
PDF
Docker道場「Dockerの基本概念」0825インフラ勉強会資料
PDF
Dockerfile を書くためのベストプラクティス解説編
PDF
OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)
PPTX
AWSで作る分析基盤
PPTX
Power BI をアプリに埋め込みたい? ならば Power BI Embedded だ!
PDF
Kongの概要と導入事例
PDF
AWS Black Belt Techシリーズ Amazon WorkDocs / Amazon WorkMail
PDF
パッケージソフトウェアを簡単にSaaS化!?既存の資産を使ったSaaS化手法のご紹介
PDF
3分でわかるAzureでのService Principal
PDF
서버리스 기반 데이터베이스 모델링 및 운영 노하우 알아보기 - 변규현 SW 엔지니어, 당근마켓 / 김선형 CTO, 티클 :: AWS Sum...
PDF
20201118 AWS Black Belt Online Seminar 形で考えるサーバーレス設計 サーバーレスユースケースパターン解説
PDF
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
PPTX
로그 기깔나게 잘 디자인하는 법
PPTX
MLOpsはバズワード
PDF
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
PDF
20190911 AWS Black Belt Online Seminar AWS Batch
PDF
새해 일어난 일
PDF
Active Directory 侵害と推奨対策
PPTX
kubernetes初心者がKnative Lambda Runtime触ってみた(Kubernetes Novice Tokyo #13 発表資料)
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
Docker道場「Dockerの基本概念」0825インフラ勉強会資料
Dockerfile を書くためのベストプラクティス解説編
OpenLineage による Airflow のデータ来歴の収集と可視化(Airflow Meetup Tokyo #3 発表資料)
AWSで作る分析基盤
Power BI をアプリに埋め込みたい? ならば Power BI Embedded だ!
Kongの概要と導入事例
AWS Black Belt Techシリーズ Amazon WorkDocs / Amazon WorkMail
パッケージソフトウェアを簡単にSaaS化!?既存の資産を使ったSaaS化手法のご紹介
3分でわかるAzureでのService Principal
서버리스 기반 데이터베이스 모델링 및 운영 노하우 알아보기 - 변규현 SW 엔지니어, 당근마켓 / 김선형 CTO, 티클 :: AWS Sum...
20201118 AWS Black Belt Online Seminar 形で考えるサーバーレス設計 サーバーレスユースケースパターン解説
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
로그 기깔나게 잘 디자인하는 법
MLOpsはバズワード
AWS기반 서버리스 데이터레이크 구축하기 - 김진웅 (SK C&C) :: AWS Community Day 2020
20190911 AWS Black Belt Online Seminar AWS Batch
새해 일어난 일
Active Directory 侵害と推奨対策
kubernetes初心者がKnative Lambda Runtime触ってみた(Kubernetes Novice Tokyo #13 発表資料)
Ad

Similar to Connect Bigquery with python (20)

PDF
SPARK SQL
PDF
대용량 로그분석 Bigquery로 간단히 사용하기 20160930
PDF
대용량 로그분석 Bigquery로 간단히 사용하기 (20170215 T아카데미)
PPTX
Bigquery와 airflow를 이용한 데이터 분석 시스템 구축 v1 나무기술(주) 최유석 20170912
PDF
12. Application - Python + Pandas
PDF
7. Application - Hive Bucket
PDF
Big query at GDG Korea Cloud meetup
PDF
이벤트: 구글 빅쿼리 완벽 가이드
PDF
RHive tutorial supplement 2: RHive 튜토리얼 부록 2 - Hive 설치
PDF
Hive Authorization
PPTX
[D2 COMMUNITY] Spark User Group - 스파크를 통한 딥러닝 이론과 실제
PDF
Apache hive
PPTX
레거시 시스템에 Django 들이밀기
PDF
Pycon2017 이성용 Dances with the Last Samurai
PDF
Hive 입문 발표 자료
PPTX
Python+numpy pandas 3편
PDF
[GS네오텍] Google BigQuery
PPTX
Python+numpy pandas 4편
PPTX
Python 활용: 이미지 처리와 데이터 분석
PPTX
Python 웹 프로그래밍
SPARK SQL
대용량 로그분석 Bigquery로 간단히 사용하기 20160930
대용량 로그분석 Bigquery로 간단히 사용하기 (20170215 T아카데미)
Bigquery와 airflow를 이용한 데이터 분석 시스템 구축 v1 나무기술(주) 최유석 20170912
12. Application - Python + Pandas
7. Application - Hive Bucket
Big query at GDG Korea Cloud meetup
이벤트: 구글 빅쿼리 완벽 가이드
RHive tutorial supplement 2: RHive 튜토리얼 부록 2 - Hive 설치
Hive Authorization
[D2 COMMUNITY] Spark User Group - 스파크를 통한 딥러닝 이론과 실제
Apache hive
레거시 시스템에 Django 들이밀기
Pycon2017 이성용 Dances with the Last Samurai
Hive 입문 발표 자료
Python+numpy pandas 3편
[GS네오텍] Google BigQuery
Python+numpy pandas 4편
Python 활용: 이미지 처리와 데이터 분석
Python 웹 프로그래밍
Ad

Connect Bigquery with python

  • 2. • Query 조회 • 배치 자동화 • 기계학습 Python with Bigquery BigQuery with Python • Storage Upload • 테이블 생성 자동화
  • 3. pip install --upgrade google-auth pip install --upgrade google-cloud-bigquery pip install pandas-gbq 2019-08-23 기준 Anaconda에서 잘 작동됨.
  • 5. • 빅쿼리에서 다운받은 key파일 • 이후 예시부터는 공식 홈페이지에 있는 예시를 이용했습니다.
  • 6. from google.oauth2 import service_account from google.cloud import bigquery import pandas_gbq cred_path = 'D:데이터분석BigQuerybigquery_IAM_key.json' credentials = service_account.Credentials.from_service_account_file(cred_path) client = bigquery.Client(credentials= credentials, project='프로젝트 이름') sample_qry = ''' SELECT name FROM `bigquery-public-data.usa_names.usa_1910_2013` WHERE state = "TX" LIMIT 100 '''
  • 8. 방법 2 df_pandas = pandas_gbq.read_gbq(query=sample_qry, project_id="프로젝트 이름", credentials= credentials)
  • 9. 방법 3 – 변수 활용 def var_qry(state): qry = f''' SELECT name FROM `bigquery-public-data.usa_names.usa_1910_2013` WHERE state = "{state}" LIMIT 100 ''' return qry df_pandas_var = pandas_gbq.read_gbq(query=var_qry(state='TX'), project_id="프로젝트 이름", credentials= credentials)