SlideShare a Scribd company logo
No.
Date
Hadoop Ops & fabric
@shoe116 20150627
No.
Date
エンジニアリングでお金を稼いで、音
楽とアイドルにお金を使っています。
twitter
@shoe116
blog
http://shoe116.hatenablog.com/
soundcloud
@shoe116
about me ①
No.
Date
エンジニア&データサイエンス
mapreduceとかHiveQLを書く
hadoopのシステム開発(batchとか)
dev/ops(リリースとか脆弱性とか)
Impalaとかpythonでデータ分析
言語とか
python > C++ > php > English > Java
お仕事の話
No.
Date
- 本質的な複雑さは単純に(1)
- 付随的な複雑さは取り除く(1)
- Don't repeat yourself (2)
お仕事のポリシーとミッション
(1)ニール・フォード著
「ソフトウェアアーキテクトが知るべき97のこと」
(2) アンディ・ハント、デイブ・トーマス共著
「達人プログラマー」
※くわしくはこちらをご参照ください!
No.
Date
「人がみんな、感情をスピーディ
に且つ美しく表現して、それを享
受した喜びでまた新しい価値観や
世界がうまれて、そういう創造的
な社会」(3)になったらいいな。
当然自分たちの分析・開発環境も
こうなっているべきだ。
(3)大森靖子
http://blog.livedoor.jp/omorimorimori/archives/52178509.html
No.
Date
#1 Hadoop Ops
No.
Date
分散すると運用は大変
エンジニア小人数、サーバ多数
HDPの構成管理複雑
MapRってとこのHDP使ってるけど、向
こうの手順は全部手作業で死ねる
設定ファイルがばら撒かれている
yum打つだけでも一苦労
アカウント管理、セキュリティ対策
hadoop(Mapr) ops is hard
No.
Date
python製のsshラッパー fabric
複数サーバにssh越しにコマンド実行
構築手順のshellを並列化した
手続きベースでやりたい
sed, grep, yum, service…
使い勝手の問題
構成管理よりコマンド打ちたい!
pythonならみんな書ける
構成管理はchef/ansibleのが良さそう
Fabricを使ってみよう
No.
Date
システム構成
jenkins
jenkins slave
stg(hadoop)
prd(hadoop)
dev
- account
- settings
master
No.
Date
システム構成
master
jenkins
jenkins slave
stg(hadoop)
prd(hadoop)
dev
Fabric
- account
- settings
No.
Date
shellコマンドを打つ
アカウント情報やサーバ設定更新
セキュリティインシデント対応
serviceのstart, stop, check
不具合調査
Hadoopクラスタの構成管理
パッケージ、ユーザの管理
テスト、リリース
やらせていること
No.
Date
使い方は簡単
$ fab –H host task
- hostはhostname(複数可)
- taskはpythonで記述する関数
No.
Date
run / sudo
sshしたhostでコマンド実行
run(“ls /home/*”)
sudo(“rm –rf /”)
local
sshしたhostでコマンド実行
local(“cat ‘hoge world’”)
shellをくるめるapi
No.
Date
reboot
waitしてくれるの最高
cd
ディレクトリにcdしてコマンド実行
execute
taskを実行して標準出力を取れる
早く帰れるapi
def grepMoge(file):
run(‘grep Moge ’ + file)
print execute(grepMoge(‘./file’)
No.
Date
複数サーバに同じコマンドをssh越し
に送りつけるのにとても便利
rebootでwaitできるの超助かる
taskをいっぱい定義してexecute!
コマンドなので、冪等性について考
慮した設計になってない
Welcome to Fabric からどーぞ!
fabricまとめ

More Related Content

PDF
エンジニアが日々何を考えているのか、ということ
PDF
ソニーのディープラーニングツールで簡単エッジコンピューティング
PPTX
11月 Machine Learning15 「確証バイアスによる仮説生成に注意するとAI開発は上手くいく」
PDF
統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト
PDF
Rの導入とRStudio事始め(改訂版)
PDF
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
PDF
第47回TokyoWebMining, トピックモデリングによる評判分析
PDF
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47
エンジニアが日々何を考えているのか、ということ
ソニーのディープラーニングツールで簡単エッジコンピューティング
11月 Machine Learning15 「確証バイアスによる仮説生成に注意するとAI開発は上手くいく」
統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト
Rの導入とRStudio事始め(改訂版)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
第47回TokyoWebMining, トピックモデリングによる評判分析
分析のビジネス展開を考える―状態空間モデルを例に @TokyoWebMining #47

Viewers also liked (12)

PDF
オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京
PDF
Opendata@tokyowebmining
PPTX
クラウド温泉への誘い 2015-08-01 「第48回データマイニング+WEB@東京」版
PDF
LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)
PPTX
傾向スコアを使ったキャンペーン効果検証V1
PDF
Tokyowebmining #49 Matirx and nonparametric bayes
PDF
階層ディリクレ過程事前分布モデルによる画像領域分割
PPTX
話題のイベントの作り方 Event Salonとは
PDF
1000人規模で使う分析基盤構築 〜redshiftを活用したeuc
PDF
Deep learning Libs @twm
PDF
SmartNews の Webmining を支えるプラットフォーム
PDF
AWSでのビッグデータ分析
オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京
Opendata@tokyowebmining
クラウド温泉への誘い 2015-08-01 「第48回データマイニング+WEB@東京」版
LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)
傾向スコアを使ったキャンペーン効果検証V1
Tokyowebmining #49 Matirx and nonparametric bayes
階層ディリクレ過程事前分布モデルによる画像領域分割
話題のイベントの作り方 Event Salonとは
1000人規模で使う分析基盤構築 〜redshiftを活用したeuc
Deep learning Libs @twm
SmartNews の Webmining を支えるプラットフォーム
AWSでのビッグデータ分析
Ad

Similar to Hadoop Ops & Fabric (20)

PDF
Apache drillを業務利用してみる(までの道のり)
PDF
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
PDF
現場の”今”を知る、これからのビッグデータ分析・活用のすすめ
PDF
20120927 findjob4 dev_ops
PDF
Rubyの会社でPythonistaが3ヶ月生き延びた話
PDF
Rubyの会社でPythonistaが三ヶ月生き延びた話
PPTX
黄色い象と共に生きる
PDF
皆で考えるDevOps
PPT
Hadoop Conference Japan 2009 #2
PDF
20181206 Jazug DataScience TeamBuilding and DevOps
PDF
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
PDF
人工知能のコードをハックする会 #2
PDF
Django と Wagtail で作る Headless CMS
PPTX
FINAL FANTASY Record Keeperのマスターデータを支える技術
PDF
MapReduce/YARNの仕組みを知る
PDF
大規模ソーシャルゲームを支える技術~PHP+MySQLを使った高負荷対策~
PDF
Ansibleで構成管理始める人のモチベーションをあげたい! (Cloudera World Tokyo 2014LT講演資料)
PPTX
Visual Studio による開発環境・プログラミングの進化
PPTX
Trat_sprint7
PDF
Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)
Apache drillを業務利用してみる(までの道のり)
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
現場の”今”を知る、これからのビッグデータ分析・活用のすすめ
20120927 findjob4 dev_ops
Rubyの会社でPythonistaが3ヶ月生き延びた話
Rubyの会社でPythonistaが三ヶ月生き延びた話
黄色い象と共に生きる
皆で考えるDevOps
Hadoop Conference Japan 2009 #2
20181206 Jazug DataScience TeamBuilding and DevOps
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
人工知能のコードをハックする会 #2
Django と Wagtail で作る Headless CMS
FINAL FANTASY Record Keeperのマスターデータを支える技術
MapReduce/YARNの仕組みを知る
大規模ソーシャルゲームを支える技術~PHP+MySQLを使った高負荷対策~
Ansibleで構成管理始める人のモチベーションをあげたい! (Cloudera World Tokyo 2014LT講演資料)
Visual Studio による開発環境・プログラミングの進化
Trat_sprint7
Hadoop上の多種多様な処理でPigの活きる道 (Hadoop Conferecne Japan 2013 Winter)
Ad

More from Shu (shoe116) (8)

PDF
GCPでStreamなデータパイプライン作った
PDF
DataProcessingInBuffettCode-20190213
PDF
オープンデータを利用した企業分析ツール"Buffett-Code"について
PDF
データ分析基盤の憂鬱と退屈
PDF
analists_rating_by_lda_hackday_201702
PPTX
データサイエンティストの憂鬱と退屈
PPTX
idoling_approval_desire
PPTX
tokyo_webmining_no51
GCPでStreamなデータパイプライン作った
DataProcessingInBuffettCode-20190213
オープンデータを利用した企業分析ツール"Buffett-Code"について
データ分析基盤の憂鬱と退屈
analists_rating_by_lda_hackday_201702
データサイエンティストの憂鬱と退屈
idoling_approval_desire
tokyo_webmining_no51

Hadoop Ops & Fabric