SlideShare a Scribd company logo
株式会社ブレインパッド 前田友樹
ETL(ELT)処理を簡易作成できるアプ
リケーションフレームワークcliboa
1
©2017 BrainPad Inc. 2
● 自己紹介
● ETL(ELT)処理とは
● ETL(ELT)処理をどうやって作ってますか?
● cliboa(クリボア)とは
○ 概要
○ 特徴
● cliboaクイックスタート
○ インストール
○ 作業ディレクトリ・プロジェクト作成
○ scenairo.yml作成・実行
● 最後に
● Q&A
目次
©2017 BrainPad Inc. 3
● 名前: 前田友樹
● 所属: 株式会社ブレインパッド (https://www.brainpad.co.jp)
● ロール: SWD, PjM
● GitHub: https://github.com/cocoa-maemae
● Twitter: https://twitter.com/cocoa_maemae
自己紹介
©2017 BrainPad Inc. 4
● Extract, Transform, Loadを略してETL
○ Extractは何らかのシステムからデータを抽出すること
○ Transformは抽出したデータを加工すること
○ Loadはデータを目的地に対してアップロード、保存すること
ETL(ELT)処理とは
● ELT処理はETL処理と処理の順番が異なる
extract transform load
extract transform
load
©2017 BrainPad Inc. 5
ETL(ELT)処理をどうやって作ってますか?
零
Ichi
● 実装工数大
● スパゲッティコード量産
● 学習コスト中〜大
● 実装工数中
● 学習コスト小
● 実装工数小
©2017 BrainPad Inc. 6
● ETL(ELT)処理用アプリケーションフレームワーク
● GitHub: https://github.com/BrainPad/cliboa
● PyPI: https://pypi.org/project/cliboa/
cliboa(クリボア)とは ~概要~
©2017 BrainPad Inc. 7
YamlファイルでETL(ELT)処理を
定義・動作させることが可能
cliboaとは ~特徴~
全てPythonで実装
PythonでETL処理を
拡張実装することが可能
©2017 BrainPad Inc. 8
クイックスタート ~インストール~
https://github.com/BrainPad/cliboa#quick-start
©2017 BrainPad Inc. 9
クイックスタート 作業ディレクトリ・プロジェクト作成
https://github.com/BrainPad/cliboa#quick-start
©2017 BrainPad Inc. 10
クイックスタート ~scenario.yml作成、実行~
https://github.com/BrainPad/cliboa#quick-start
scenario.ymlの例 実行
©2017 BrainPad Inc. 11
関連ドキュメント
● マニュアルはGitHubのREADMEのみ
https://github.com/BrainPad/cliboa/blob/master/README.md
● 標準で利用可能なETLモジュール
https://github.com/BrainPad/cliboa/blob/master/docs/default_etl_modules.md
● Qiita記事
○ https://qiita.com/cocoa-maemae/items/503fd107191647a616f7
○ https://qiita.com/cocoa-maemae/items/46cf73ae2cd3cccde474
©2017 BrainPad Inc. 12
● ブレインパッドではエンジニア、データサイエンティストを
積極採用中です
○ 自社プロダクト開発エンジニア
○ システムエンジニア
○ 機械学習エンジニア
○ データサイエンティスト
● ご応募お待ちしています!
○ https://www.brainpad.co.jp/recruit/
最後に

More Related Content

PDF
機械学習システムを受託開発 する時に気をつけておきたい事
PDF
れこめん道~とあるエンジニアの苦闘の日々
PDF
機械学習システム開発案件の事例紹介
PDF
Tier Ⅳ Tech Meetup #2 - 自動運転を作るのはCloudシステムの集合体?? 活用技術を大解剖 -
PPTX
自動運転技術を活用した運転技能教習システムのご紹介
PPTX
自動運転技術を活用した運転技能教習システムの開発
PDF
Self-Driving System with IoT
PPTX
自動運転の会社でなぜデータ基盤が必要なのか?そこで今やっていること
機械学習システムを受託開発 する時に気をつけておきたい事
れこめん道~とあるエンジニアの苦闘の日々
機械学習システム開発案件の事例紹介
Tier Ⅳ Tech Meetup #2 - 自動運転を作るのはCloudシステムの集合体?? 活用技術を大解剖 -
自動運転技術を活用した運転技能教習システムのご紹介
自動運転技術を活用した運転技能教習システムの開発
Self-Driving System with IoT
自動運転の会社でなぜデータ基盤が必要なのか?そこで今やっていること

What's hot (20)

ODP
名古屋アジャイル勉強会トヨタ生産方式に学ぶカイゼン
PDF
Azure On-site Seminar: AI 最新技術と Microsoft AI Platform
PDF
35歳無名のシステムエンジニアが1年半でフロントエンジニアになるために行った3つの成長戦略
PDF
AIがビジネスを変える!​ ゑびやなど事例から学ぶマイクロソフトのAI技術とビジネスでの活用​
PDF
Unity x 自動運転シミュレーション、自動運転におけるGame Engineの役割
PDF
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析
PDF
Unity x 自動運転シミュレーション、自動運転におけるGame Engineの役割
PDF
2018.08.21-機械学習工学研究会 現場を交えた勉強会発表資料
PDF
機械学習システムの品質保証に向けた課題とコンソーシアム活動
PDF
エンタープライズとHTML5〜エンタープライズでHTML5って本当に必要なのか?〜
PDF
vCenter Operations Management Suite 検証支援プログラム結果報告とその後
PDF
Business utilization of real estate image classification system using deep le...
PDF
機械学習品質管理・保証の動向と取り組み
PPTX
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析
PPTX
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
PDF
Mki2014公開用
PDF
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
PDF
5分で解るocp
PDF
自動運転サービスの認証認可
PDF
「アジャイルコーチの7つ道具」の使い方
名古屋アジャイル勉強会トヨタ生産方式に学ぶカイゼン
Azure On-site Seminar: AI 最新技術と Microsoft AI Platform
35歳無名のシステムエンジニアが1年半でフロントエンジニアになるために行った3つの成長戦略
AIがビジネスを変える!​ ゑびやなど事例から学ぶマイクロソフトのAI技術とビジネスでの活用​
Unity x 自動運転シミュレーション、自動運転におけるGame Engineの役割
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析
Unity x 自動運転シミュレーション、自動運転におけるGame Engineの役割
2018.08.21-機械学習工学研究会 現場を交えた勉強会発表資料
機械学習システムの品質保証に向けた課題とコンソーシアム活動
エンタープライズとHTML5〜エンタープライズでHTML5って本当に必要なのか?〜
vCenter Operations Management Suite 検証支援プログラム結果報告とその後
Business utilization of real estate image classification system using deep le...
機械学習品質管理・保証の動向と取り組み
開発者のための機械学習入門:Azure Machine Learning Studioで構造化データから予測分析
エンジニア勉強会資料_⑥エンジニアが主導する組織マネジメントや開発体制の継続的改善
Mki2014公開用
エンジニア勉強会資料_⑤広告プロダクトとプラットフォームの開発
5分で解るocp
自動運転サービスの認証認可
「アジャイルコーチの7つ道具」の使い方
Ad

Similar to Oss LT会_20210203 (20)

PPTX
OSC 2020 August
PDF
Openstack kolla 20171025 josug v3
PPTX
CDH4->5 update苦労話
PDF
OCaml でデータ分析
PDF
MySQLインストールのお作法
PDF
Eclipse PDT + MakeGoodによるPHPコードのテスト
PPT
Intalio Cloud Workshop
PDF
[db analytics showcase Sapporo 2018] A33 AI社内実装の試み~ソニーNNCを非技術者に使わせてみる~
PDF
5分でわかる!ownCloudアドオンの作り方
PPTX
オープンソースカンファレンス OSC 2015 Tokyo/Spring 最新レポート!ownCloud8とMroongaを使った日本語全文検索アプリのご紹介
PDF
Openstack ceph 20171115 vtj
PDF
TripleO Deep Dive 1.1
PPTX
ELK ではじめる自宅ネットワーク監視
PDF
Pentaho ETL
PDF
OpenStack Summit Vancouver YVR Ops
PDF
Lambda: A Peek Under The Hood [Java Day Tokyo 2015 6-3]
PDF
【ヒカ☆ラボ】株式会社エアー様~ETLツール活用法について~
PDF
オンプレエンジニアがクラウドエンジニアを夢見て。じっと手を見る。
PDF
Machine learning 15min TensorFlow hub
PDF
AIの力で障害検知・解析をサポート!Loom(ログ解析ソリューション)のご紹介 - OpenStack最新情報セミナー 2017年7月
OSC 2020 August
Openstack kolla 20171025 josug v3
CDH4->5 update苦労話
OCaml でデータ分析
MySQLインストールのお作法
Eclipse PDT + MakeGoodによるPHPコードのテスト
Intalio Cloud Workshop
[db analytics showcase Sapporo 2018] A33 AI社内実装の試み~ソニーNNCを非技術者に使わせてみる~
5分でわかる!ownCloudアドオンの作り方
オープンソースカンファレンス OSC 2015 Tokyo/Spring 最新レポート!ownCloud8とMroongaを使った日本語全文検索アプリのご紹介
Openstack ceph 20171115 vtj
TripleO Deep Dive 1.1
ELK ではじめる自宅ネットワーク監視
Pentaho ETL
OpenStack Summit Vancouver YVR Ops
Lambda: A Peek Under The Hood [Java Day Tokyo 2015 6-3]
【ヒカ☆ラボ】株式会社エアー様~ETLツール活用法について~
オンプレエンジニアがクラウドエンジニアを夢見て。じっと手を見る。
Machine learning 15min TensorFlow hub
AIの力で障害検知・解析をサポート!Loom(ログ解析ソリューション)のご紹介 - OpenStack最新情報セミナー 2017年7月
Ad

More from BrainPad Inc. (20)

PDF
ブレインパッドにおける機械学習プロジェクトの進め方
PDF
機械学習システムのアーキテクチャアラカルト
PDF
DMPの分析機能を実現する技術
PDF
システム開発素人が深層学習を用いた画像認識で麻雀点数計算するLINEbotを作ったハナシ
PDF
Python研修の作り方 - teaching-is_learning-
PDF
2018 builderscon airflowを用いて、 複雑大規模なジョブフロー管理 に立ち向かう
PDF
GKEとgRPCで実装する多言語対応・スケーラブルな内部API
PDF
実証実験報告セミナー資料 20180328(抜粋版)
PDF
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
PDF
エンジニア勉強会資料_③Rtoasterの11年
PDF
エンジニア勉強会資料_②エンジニア・デザイナ・プロダクトオーナーが推薦するプロトタイプドリブン開発
PDF
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
PDF
Big Data Analytics Tokyo講演資料
PDF
DeltaCubeにおけるユニークユーザー集計高速化(実践編)
PDF
DeltaCubeにおけるユニークユーザー集計高速化(理論編)
PDF
Developpers Summit2015 Autumn 講演資料
PDF
Python twitter data_150709
PDF
Sparkストリーミング検証
PDF
Sparkパフォーマンス検証
PDF
Apache Sparkについて
ブレインパッドにおける機械学習プロジェクトの進め方
機械学習システムのアーキテクチャアラカルト
DMPの分析機能を実現する技術
システム開発素人が深層学習を用いた画像認識で麻雀点数計算するLINEbotを作ったハナシ
Python研修の作り方 - teaching-is_learning-
2018 builderscon airflowを用いて、 複雑大規模なジョブフロー管理 に立ち向かう
GKEとgRPCで実装する多言語対応・スケーラブルな内部API
実証実験報告セミナー資料 20180328(抜粋版)
エンジニア勉強会資料_④Rtoaster×Myndエンジンによる興味キーワード分析機能開発事例
エンジニア勉強会資料_③Rtoasterの11年
エンジニア勉強会資料_②エンジニア・デザイナ・プロダクトオーナーが推薦するプロトタイプドリブン開発
エンジニア勉強会資料_①ブレインパッドの中で僕たちは何を開発しているのか?
Big Data Analytics Tokyo講演資料
DeltaCubeにおけるユニークユーザー集計高速化(実践編)
DeltaCubeにおけるユニークユーザー集計高速化(理論編)
Developpers Summit2015 Autumn 講演資料
Python twitter data_150709
Sparkストリーミング検証
Sparkパフォーマンス検証
Apache Sparkについて

Oss LT会_20210203

  • 2. ©2017 BrainPad Inc. 2 ● 自己紹介 ● ETL(ELT)処理とは ● ETL(ELT)処理をどうやって作ってますか? ● cliboa(クリボア)とは ○ 概要 ○ 特徴 ● cliboaクイックスタート ○ インストール ○ 作業ディレクトリ・プロジェクト作成 ○ scenairo.yml作成・実行 ● 最後に ● Q&A 目次
  • 3. ©2017 BrainPad Inc. 3 ● 名前: 前田友樹 ● 所属: 株式会社ブレインパッド (https://www.brainpad.co.jp) ● ロール: SWD, PjM ● GitHub: https://github.com/cocoa-maemae ● Twitter: https://twitter.com/cocoa_maemae 自己紹介
  • 4. ©2017 BrainPad Inc. 4 ● Extract, Transform, Loadを略してETL ○ Extractは何らかのシステムからデータを抽出すること ○ Transformは抽出したデータを加工すること ○ Loadはデータを目的地に対してアップロード、保存すること ETL(ELT)処理とは ● ELT処理はETL処理と処理の順番が異なる extract transform load extract transform load
  • 5. ©2017 BrainPad Inc. 5 ETL(ELT)処理をどうやって作ってますか? 零 Ichi ● 実装工数大 ● スパゲッティコード量産 ● 学習コスト中〜大 ● 実装工数中 ● 学習コスト小 ● 実装工数小
  • 6. ©2017 BrainPad Inc. 6 ● ETL(ELT)処理用アプリケーションフレームワーク ● GitHub: https://github.com/BrainPad/cliboa ● PyPI: https://pypi.org/project/cliboa/ cliboa(クリボア)とは ~概要~
  • 7. ©2017 BrainPad Inc. 7 YamlファイルでETL(ELT)処理を 定義・動作させることが可能 cliboaとは ~特徴~ 全てPythonで実装 PythonでETL処理を 拡張実装することが可能
  • 8. ©2017 BrainPad Inc. 8 クイックスタート ~インストール~ https://github.com/BrainPad/cliboa#quick-start
  • 9. ©2017 BrainPad Inc. 9 クイックスタート 作業ディレクトリ・プロジェクト作成 https://github.com/BrainPad/cliboa#quick-start
  • 10. ©2017 BrainPad Inc. 10 クイックスタート ~scenario.yml作成、実行~ https://github.com/BrainPad/cliboa#quick-start scenario.ymlの例 実行
  • 11. ©2017 BrainPad Inc. 11 関連ドキュメント ● マニュアルはGitHubのREADMEのみ https://github.com/BrainPad/cliboa/blob/master/README.md ● 標準で利用可能なETLモジュール https://github.com/BrainPad/cliboa/blob/master/docs/default_etl_modules.md ● Qiita記事 ○ https://qiita.com/cocoa-maemae/items/503fd107191647a616f7 ○ https://qiita.com/cocoa-maemae/items/46cf73ae2cd3cccde474
  • 12. ©2017 BrainPad Inc. 12 ● ブレインパッドではエンジニア、データサイエンティストを 積極採用中です ○ 自社プロダクト開発エンジニア ○ システムエンジニア ○ 機械学習エンジニア ○ データサイエンティスト ● ご応募お待ちしています! ○ https://www.brainpad.co.jp/recruit/ 最後に