SlideShare a Scribd company logo
Copyright © 2015 NTT DATA Corporation
2015/11/10
NTTデータ
鯵坂 明
Hadoopのメンテナンスリリース
バージョンをリリースしてみた
Cloudera World Tokyo 2015
ライトニングトーク
2Copyright © 2015 NTT DATA Corporation
 Hadoopのメンテナンスリリースは少ない
直近のHadoopリリース (2015/7時点)
20152014201320122011
9.1.0
9.1.18
9.2.0
9.2.13
9.3.0
9.3.9
9.4.0
9.4.4
PostgreSQL
20152014
2.4.0
2.5.2
2.7.0 2.7.1
2.6.0
2.5.1
2.5.0
2.4.1
Hadoop
3Copyright © 2015 NTT DATA Corporation
 特に、放置されているbranch-2.6をなんとかしたい
 だけど、コミュニティ全体の同意が必要
 敷居が高い
メンテナンスリリースを増やしたい
4Copyright © 2015 NTT DATA Corporation
 嬉しい追い風
Hadoop SummitのBoFで、Yahoo!、Twitterなどのユーザ企
業から、もっとコミュニティでメンテナンスリリースを出せ
ないの? という議論があった
HBaseコミュニティから、2.6.1を出してくれるよう要請が
あった
メンテナンスリリースを増やしたい
5Copyright © 2015 NTT DATA Corporation
 MLにメールを投げた
 協力者が募れたので、Hortonworks、Twitterのメンバと分担し
て2.6.1リリースの作業をした
メンテナンスリリースを増やしたい
In Hadoop Summit, I joined HDFS BoF and heard from Jason Lowe that
Apache Hadoop developers at Yahoo!, Twitter, and other non-distributors
work very hard to maintenance Hadoop by cherry-picking patches to their
own branches.
I want to share the work with the community. If we can cherry-pick bug fix
patches and have more maintenance releases, it'd be very happy not only
for users but also for developers who work very hard for stabilizing their
own branches.
(snip)
I would like to start the work from branch-2.6. If the change will be
accepted by the community, I'm willing to work for the maintenance, as a
release manager.
6Copyright © 2015 NTT DATA Corporation
リリース作業
https://wiki.apache.org/hadoop/HowToRelease
7Copyright © 2015 NTT DATA Corporation
 メーリングリストで、どのパッチを2.6.1に入れたいか確認
 全てのJIRAに"2.6.1-candidate"とラベリング (158件!)
 作業方針 & 分担どうするか決める by hangout
 自分がCommonのcherry-pickを担当する、ということは聞き取れた
 ただひたすらcherry-pick
 進捗管理: https://wiki.apache.org/hadoop/Release-2.6.1-Working-Notes
リリース作業
8Copyright © 2015 NTT DATA Corporation
 JDK6対応 (2.6まではJDK6をサポート)
 try-with-resources statement が使えない -> 書き直す
 例外のmulti catch が使えない -> 書き直す
 java.nio.Files (NIO2) も使えない -> ...諦める
- Vinodさんが書き直した。すごすぎる (HADOOP-11934)
 手でrebaseしたパッチは必ずJIRAに添付
 後でtrackできるように
 依存関係に注意
 あるパッチを当てるために、別のパッチが必要
 あるパッチはあるバグを直すが、別のバグが出るので、それに対応する
パッチが必要
 依存関係がJIRAに書かれていないこともある
- 注意深くソースコードを追いかける
 困ったら、相談!
cherry-pickで気をつけること
9Copyright © 2015 NTT DATA Corporation
 Release Candidateの作成
 Versionを"2.6.1-RC0"に設定
 Release dateを記入
 git tagを登録
 Maven artifactの登録
 GPG署名
 Vote
 期間(5日)内にPMCが「3人以上"+1"」かつ 「"-1"より"+1"が多い」
 初回は、NG (当てるパッチを間違えていた)
 RC1の作り直し
 Release
 Release dateを更新
 git tagを登録
 Distribution directoryにファイルを登録
 リリース告知!
RCの作成、投票
10Copyright © 2015 NTT DATA Corporation
 2.6.1リリースで作業分担したTwitterの開発者が、2.6.2のrelease manager
をやりたいと申し出
 彼の尽力により、すでに2.6.2がリリース済 (2015/10/28)
 2.7.2も、もうすぐリリース!
2.6.1 リリース後
11Copyright © 2015 NTT DATA Corporation
 Thanks Vinod Kumar Vavilavalli and Sangjin Lee, and all the
PMCs/committers/contributors who helped for the maintenance
release.
最後に
20152014
2.4.0
2.5.2
2.7.0 2.7.1
2.6.0
2.5.1
2.5.0
2.4.1
2.6.1
2.6.2
2.7.2
Copyright © 2011 NTT DATA Corporation
Copyright © 2015 NTT DATA Corporation

More Related Content

PDF
SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)
PDF
10大ニュースで振り返るPGCon2015
PDF
PostgreSQLコミュニティに飛び込もう
PDF
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
PDF
20170303 java9 hadoop
PDF
商用ミドルウェアのPuppet化で気を付けたい5つのこと
PDF
サポートメンバは見た! Hadoopバグワースト10 (adoop / Spark Conference Japan 2016 ライトニングトーク発表資料)
PDF
Apache Hadoop 2.8.0 の新機能 (抜粋)
SIプロジェクトでのインフラ自動化の事例 (第1回 Puppetユーザ会 発表資料)
10大ニュースで振り返るPGCon2015
PostgreSQLコミュニティに飛び込もう
SIerとオープンソースの美味しい関係 ~コミュニティの力を活かして世界を目指そう~
20170303 java9 hadoop
商用ミドルウェアのPuppet化で気を付けたい5つのこと
サポートメンバは見た! Hadoopバグワースト10 (adoop / Spark Conference Japan 2016 ライトニングトーク発表資料)
Apache Hadoop 2.8.0 の新機能 (抜粋)

What's hot (20)

PDF
Ansibleで構成管理始める人のモチベーションをあげたい! (Cloudera World Tokyo 2014LT講演資料)
PDF
PuppetConf2015参加レポート (第1回 Puppetユーザ会 発表資料)
PDF
Hadoop2.6の最新機能+
PDF
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
PDF
Apache Hadoopの新機能Ozoneの現状
PDF
Sparkをノートブックにまとめちゃおう。Zeppelinでね!(Hadoopソースコードリーディング 第19回 発表資料)
PDF
ストリームデータ分散処理基盤Storm
PDF
NTT DATA と PostgreSQL が挑んだ総力戦
PPTX
大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...
PDF
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
PDF
PostgreSQLでpg_bigmを使って日本語全文検索 (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料)
PDF
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
PDF
pg_dbms_statsの紹介
PDF
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
PDF
OpenStack & Container
PDF
perfを使ったPostgreSQLの解析(前編)
PDF
【Jpug勉強会】10大ニュースで振り返るpg con2013
PDF
Spark MLlibではじめるスケーラブルな機械学習
PDF
OpenStackとTerraformで作る Phoenix Environments
PDF
PostgreSQLの運用・監視にまつわるエトセトラ
Ansibleで構成管理始める人のモチベーションをあげたい! (Cloudera World Tokyo 2014LT講演資料)
PuppetConf2015参加レポート (第1回 Puppetユーザ会 発表資料)
Hadoop2.6の最新機能+
Sparkコミュニティに飛び込もう!(Spark Meetup Tokyo 2015 講演資料、NTTデータ 猿田 浩輔)
Apache Hadoopの新機能Ozoneの現状
Sparkをノートブックにまとめちゃおう。Zeppelinでね!(Hadoopソースコードリーディング 第19回 発表資料)
ストリームデータ分散処理基盤Storm
NTT DATA と PostgreSQL が挑んだ総力戦
大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...
Hadoop 2.6の最新機能(Cloudera World Tokyo 2014 LT講演資料)
PostgreSQLでpg_bigmを使って日本語全文検索 (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料)
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
pg_dbms_statsの紹介
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
OpenStack & Container
perfを使ったPostgreSQLの解析(前編)
【Jpug勉強会】10大ニュースで振り返るpg con2013
Spark MLlibではじめるスケーラブルな機械学習
OpenStackとTerraformで作る Phoenix Environments
PostgreSQLの運用・監視にまつわるエトセトラ
Ad

Viewers also liked (14)

PDF
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
PDF
本当にあったHadoopの恐い話 Blockはどこへきえた? (Hadoop / Spark Conference Japan 2016 ライトニングトー...
PDF
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
PDF
Application of postgre sql to large social infrastructure
PPTX
今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~
PDF
データ活用をもっともっと円滑に! ~データ処理・分析基盤編を少しだけ~
PPTX
ブロックチェーンの仕組みと動向(入門編)
PDF
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)
PDF
Application of postgre sql to large social infrastructure jp
PDF
PostgreSQLレプリケーション徹底紹介
PDF
PostgreSQL 9.5 新機能紹介
PPTX
Kafkaを活用するためのストリーム処理の基本
PDF
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
PDF
Kafkaによるリアルタイム処理
HDFS新機能総まとめin 2015 (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)
本当にあったHadoopの恐い話 Blockはどこへきえた? (Hadoop / Spark Conference Japan 2016 ライトニングトー...
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
Application of postgre sql to large social infrastructure
今からはじめるPuppet 2016 ~ インフラエンジニアのたしなみ ~
データ活用をもっともっと円滑に! ~データ処理・分析基盤編を少しだけ~
ブロックチェーンの仕組みと動向(入門編)
Apache Spark超入門 (Hadoop / Spark Conference Japan 2016 講演資料)
Application of postgre sql to large social infrastructure jp
PostgreSQLレプリケーション徹底紹介
PostgreSQL 9.5 新機能紹介
Kafkaを活用するためのストリーム処理の基本
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Kafkaによるリアルタイム処理
Ad

Similar to Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料) (20)

PDF
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
PPTX
Java11へのマイグレーションガイド ~Apache Hadoopの事例~
PDF
内製パッケージによるHadoopデータ解析基盤の構築と運用
PDF
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
PPTX
Cloudera大阪セミナー 20130219
PDF
Hadoop ecosystem NTTDATA osc15tk
PDF
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
PDF
HBase Meetup Tokyo Summer 2015 #hbasejp
PDF
最新版Hadoopクラスタを運用して得られたもの
PPT
Hadoop ~Yahoo! JAPANの活用について~
PDF
ヤフーにおけるHadoop Operations #tdtech
PDF
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
PPTX
HBaseサポート最前線 #hbase_ca
PPTX
Hadoopトレーニング番外編 〜間違えられやすいHadoopの7つの仕様〜
PDF
HBase Across the World #LINE_DM
PPTX
OSSプロジェクトへのコントリビューション はじめの一歩を踏み出そう!(Open Source Conference 2022 Online/Spring...
PDF
Hadoop Trends & Hadoop on EC2
PDF
Yifeng hadoop-present-public
PDF
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
PPTX
Hadoop Troubleshooting 101 - Japanese Version
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
Java11へのマイグレーションガイド ~Apache Hadoopの事例~
内製パッケージによるHadoopデータ解析基盤の構築と運用
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
Cloudera大阪セミナー 20130219
Hadoop ecosystem NTTDATA osc15tk
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
HBase Meetup Tokyo Summer 2015 #hbasejp
最新版Hadoopクラスタを運用して得られたもの
Hadoop ~Yahoo! JAPANの活用について~
ヤフーにおけるHadoop Operations #tdtech
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
HBaseサポート最前線 #hbase_ca
Hadoopトレーニング番外編 〜間違えられやすいHadoopの7つの仕様〜
HBase Across the World #LINE_DM
OSSプロジェクトへのコントリビューション はじめの一歩を踏み出そう!(Open Source Conference 2022 Online/Spring...
Hadoop Trends & Hadoop on EC2
Yifeng hadoop-present-public
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
Hadoop Troubleshooting 101 - Japanese Version

More from NTT DATA OSS Professional Services (10)

PDF
Global Top 5 を目指す NTT DATA の確かで意外な技術力
PDF
Spark SQL - The internal -
PDF
Hadoopエコシステムのデータストア振り返り
PDF
HDFS Router-based federation
PDF
PostgreSQL10を導入!大規模データ分析事例からみるDWHとしてのPostgreSQL活用のポイント
PDF
Distributed data stores in Hadoop ecosystem
PDF
Structured Streaming - The Internal -
PDF
Apache Hadoopの未来 3系になって何が変わるのか?
PDF
Apache Hadoop and YARN, current development status
PDF
HDFS basics from API perspective
Global Top 5 を目指す NTT DATA の確かで意外な技術力
Spark SQL - The internal -
Hadoopエコシステムのデータストア振り返り
HDFS Router-based federation
PostgreSQL10を導入!大規模データ分析事例からみるDWHとしてのPostgreSQL活用のポイント
Distributed data stores in Hadoop ecosystem
Structured Streaming - The Internal -
Apache Hadoopの未来 3系になって何が変わるのか?
Apache Hadoop and YARN, current development status
HDFS basics from API perspective

Hadoopのメンテナンスリリースバージョンをリリースしてみた (日本Hadoopユーザー会 ライトニングトーク@Cloudera World Tokyo 2015 講演資料)

  • 1. Copyright © 2015 NTT DATA Corporation 2015/11/10 NTTデータ 鯵坂 明 Hadoopのメンテナンスリリース バージョンをリリースしてみた Cloudera World Tokyo 2015 ライトニングトーク
  • 2. 2Copyright © 2015 NTT DATA Corporation  Hadoopのメンテナンスリリースは少ない 直近のHadoopリリース (2015/7時点) 20152014201320122011 9.1.0 9.1.18 9.2.0 9.2.13 9.3.0 9.3.9 9.4.0 9.4.4 PostgreSQL 20152014 2.4.0 2.5.2 2.7.0 2.7.1 2.6.0 2.5.1 2.5.0 2.4.1 Hadoop
  • 3. 3Copyright © 2015 NTT DATA Corporation  特に、放置されているbranch-2.6をなんとかしたい  だけど、コミュニティ全体の同意が必要  敷居が高い メンテナンスリリースを増やしたい
  • 4. 4Copyright © 2015 NTT DATA Corporation  嬉しい追い風 Hadoop SummitのBoFで、Yahoo!、Twitterなどのユーザ企 業から、もっとコミュニティでメンテナンスリリースを出せ ないの? という議論があった HBaseコミュニティから、2.6.1を出してくれるよう要請が あった メンテナンスリリースを増やしたい
  • 5. 5Copyright © 2015 NTT DATA Corporation  MLにメールを投げた  協力者が募れたので、Hortonworks、Twitterのメンバと分担し て2.6.1リリースの作業をした メンテナンスリリースを増やしたい In Hadoop Summit, I joined HDFS BoF and heard from Jason Lowe that Apache Hadoop developers at Yahoo!, Twitter, and other non-distributors work very hard to maintenance Hadoop by cherry-picking patches to their own branches. I want to share the work with the community. If we can cherry-pick bug fix patches and have more maintenance releases, it'd be very happy not only for users but also for developers who work very hard for stabilizing their own branches. (snip) I would like to start the work from branch-2.6. If the change will be accepted by the community, I'm willing to work for the maintenance, as a release manager.
  • 6. 6Copyright © 2015 NTT DATA Corporation リリース作業 https://wiki.apache.org/hadoop/HowToRelease
  • 7. 7Copyright © 2015 NTT DATA Corporation  メーリングリストで、どのパッチを2.6.1に入れたいか確認  全てのJIRAに"2.6.1-candidate"とラベリング (158件!)  作業方針 & 分担どうするか決める by hangout  自分がCommonのcherry-pickを担当する、ということは聞き取れた  ただひたすらcherry-pick  進捗管理: https://wiki.apache.org/hadoop/Release-2.6.1-Working-Notes リリース作業
  • 8. 8Copyright © 2015 NTT DATA Corporation  JDK6対応 (2.6まではJDK6をサポート)  try-with-resources statement が使えない -> 書き直す  例外のmulti catch が使えない -> 書き直す  java.nio.Files (NIO2) も使えない -> ...諦める - Vinodさんが書き直した。すごすぎる (HADOOP-11934)  手でrebaseしたパッチは必ずJIRAに添付  後でtrackできるように  依存関係に注意  あるパッチを当てるために、別のパッチが必要  あるパッチはあるバグを直すが、別のバグが出るので、それに対応する パッチが必要  依存関係がJIRAに書かれていないこともある - 注意深くソースコードを追いかける  困ったら、相談! cherry-pickで気をつけること
  • 9. 9Copyright © 2015 NTT DATA Corporation  Release Candidateの作成  Versionを"2.6.1-RC0"に設定  Release dateを記入  git tagを登録  Maven artifactの登録  GPG署名  Vote  期間(5日)内にPMCが「3人以上"+1"」かつ 「"-1"より"+1"が多い」  初回は、NG (当てるパッチを間違えていた)  RC1の作り直し  Release  Release dateを更新  git tagを登録  Distribution directoryにファイルを登録  リリース告知! RCの作成、投票
  • 10. 10Copyright © 2015 NTT DATA Corporation  2.6.1リリースで作業分担したTwitterの開発者が、2.6.2のrelease manager をやりたいと申し出  彼の尽力により、すでに2.6.2がリリース済 (2015/10/28)  2.7.2も、もうすぐリリース! 2.6.1 リリース後
  • 11. 11Copyright © 2015 NTT DATA Corporation  Thanks Vinod Kumar Vavilavalli and Sangjin Lee, and all the PMCs/committers/contributors who helped for the maintenance release. 最後に 20152014 2.4.0 2.5.2 2.7.0 2.7.1 2.6.0 2.5.1 2.5.0 2.4.1 2.6.1 2.6.2 2.7.2
  • 12. Copyright © 2011 NTT DATA Corporation Copyright © 2015 NTT DATA Corporation