SlideShare a Scribd company logo
®

ビジネスへの本格活⽤用が
始まった  Hadoop の今
〜~MapR が選ばれる理理由〜~
マップアール・テクノロジーズ株式会社
システムエンジニア
草薙  昭彦
2014 年年 2 ⽉月 26 ⽇日
© MapR Technologies

®
Hadoop による

お客様のビジネスの成功

© MapR Technologies

®
Hadoop ディストリビューション

OPEN SOURCE	

ディストリビューションC
	

ディストリビューションM
	

MANAGEMENT
INNOVATIONS

ディストリビューションA
	

MANAGEMENT
INNOVATIONS

OPEN SOURCE	

OPEN SOURCE	

INFRASTRUCTURE
INNOVATIONS

© MapR Technologies

®
Hadoop ディストリビューション
ディストリビューションA
	

ディストリビューションC
	

MANAGEMENT
INNOVATIONS
OPEN SOURCE	

OPEN SOURCE	

MANAGEMENT
INNOVATIONS
OPEN SOURCE	

INFRASTRUCTURE
INNOVATIONS

© MapR Technologies

®
お客様が直⾯面する現実の課題

データの移動

⾼高信頼の
データ基盤を
全社で共有
© MapR Technologies

⼈人⼿手・コスト
をかけない
運⽤用
®
課題1: データの移動
「とにかく時間がかかる」
「専⽤用ツール・コネクタの
メンテナンスが⼤大変」
業務システム

企業内ユーザー
レポーティング
・クエリー

RDBからのダンプ
・ファイル転送

ステージング
ファイルサーバ
専⽤用ツール
による
バッチ投⼊入

ETL・整形・集計
・キューブ作成

専⽤用コネクタ
による
RDBへの
ロード

© MapR Technologies

分析システム

®
MapR NFS ダイレクトアクセス
より直近のデータを分析対象に
外部システムが変わっても
NFS ならば対応が容易易
業務システム

企業内ユーザー
レポーティング
・クエリー

NFSによる
直接投⼊入

ETL・整形・集計
・キューブ作成

NFS経由で
RDBネイティブ
ローダー利利⽤用

© MapR Technologies

分析システム

®
HDFS vs MapR FS
HDFS

MapR FS

Hadoop 標準ファイルシステム

MapR 最適化ファイルシステム

ライトワンス

ランダム R/W

同時 R/W アクセス不不可

同時 R/W 可能

(ファイルクローズするまで他から⾒見見えない)

(書き込み中のファイルが他から読める)

NFS のフル機能と⾼高い性能を提供できるのは
アーキテクチャが異異なるから
© MapR Technologies

®
課題2: データ基盤の共有
「障害の影響やポリシーの違いを考慮して、他部⾨門と運⽤用を分けているが・・」

部⾨門A

部⾨門B

部⾨門C

© MapR Technologies

®
Volume, Snapshot, Mirroring

部⾨門A

部⾨門B

部⾨門C

部⾨門Aボリューム

部⾨門Bボリューム

部⾨門Cボリューム

© MapR Technologies

®
Volume, Snapshot, Mirroring

部⾨門A

部⾨門B

部⾨門C

部⾨門Aボリューム

部⾨門Bボリューム

部⾨門Cボリューム

スナップショット
スナップショット

部⾨門A
ミラーボリューム

スナップショット
スナップショット

部⾨門B
ミラーボリューム

災害対策⽤用リモートクラスタ

© MapR Technologies

スナップショット
スナップショット

部⾨門C
ミラーボリューム

®
HDFS vs MapR FS
HDFS Snapshot

MapR FS Snapshot

ディレクトリ単位、⼀一貫性の
ないイメージ  (メタデータのみの⼀一貫性)

ボリューム単位の
⼀一貫性のあるイメージ

HDFS ベースの分散コピー

MapR FS Mirroring

MapReduce ジョブによる
ファイル単位の転送

ネイティブプロセスによる
ブロック単位の転送

⼀一貫性のないイメージ

⼀一貫性のあるイメージ

⼀一貫性のあるスナップショット・ミラーリングを
提供できるのはアーキテクチャが異異なるから
© MapR Technologies

®
課題3: ⼈人⼿手/コストをかけない運⽤用
クラスタの規模が⼤大きくなってく
ると、サーバ台数を数%増やすだけ
で年年間数千万円のコスト増に・・・

ハードウェアのコモディティ化が
進んだ今、もっとも貴重でコスト
が⾼高いリソースは⼈人。システムの
運⽤用よりもコアビジネスにエンジ
ニアを多く割り当てたい・・・
© MapR Technologies

®
サーバ台数削減による  TCO 改善
MB per Second

MB per Second

Read/Write スループット  ベンチマーク

DFSIO Read スループット

DFSIO Write スループット

ソース: Flux7 Labs Study, 2013年年10⽉月

実際の事例例
他ディストリビューション

50台	
120台	
© MapR Technologies

®
MapR 統合データプラットフォーム
HBase
§ 

JVM

§ 

HDFS

§ 

NoSQLカラムストア	
  
Apache HBase API
In-Hadoopデータベース

JVM
ext3/ext4

テーブル/ファイル

ディスク

ディスク

他ディストリビューション

MapR M7

多層のレイヤーを統合し、オーバーヘッドを除去
⾼高い性能と運⽤用管理理の⼤大幅な簡素化を実現
© MapR Technologies

®
Architecture Matters
アーキテクチャがすべてを左右する

© MapR Technologies

®
MapR Distribution for Hadoop
APACHE HADOOP ECOSYSTEM
Hive/
Stinger/
Tez

Drill

Impala

Shark

Hue

...

Flume

Mahout

Cascading

Solr

Spark

Storm

Sentry

Zookeeper

Management

Sqoop

Whirr

Pig

YARN

MapReduce

Oozie

HBase

•  標準ファイルアクセス
•  クラスタを論論理理的に
•  ⾼高可⽤用性
•  標準データベースア
分割して異異なる⽤用途
•  データ保護
クセス
・ジョブの種類・ユ
•  ディザスタリカバリ
Patent •  プラガブルサービス
ーザーグループ・管
MAPR-FS
•  2〜~5倍の性能 Pending
MAPR-FS
•  幅広い開発者⽀支援
理理者をサポート
FILES

•  エンタープライズ
セキュリティ認証
•  ワイヤレベル認証
•  データガバナンス

MapR Data Platform
MapR Data Platform
MapR Data Data
MapR Platform

エンタープライズ
グレード

パフォーマンス

Platform
データ保護

•  予測分析・リアル
タイムデータベー
ス処理理・⾼高レート
MAPR-DB
のデータ流流⼊入をサ
MAPR-DB
TABLES
ポートする能⼒力力

マルチテナント

© MapR Technologies

相互運⽤用性

•  トランザクション
の完全性を提供す
る処理理フレームワ
ークユニット

業務  & 分析

®
多くの Hadoop プロジェクトは
まだ実験段階

開発/テストが中⼼心:
教育/サービス

最初の業務事例例
1 – 10 ノード

© MapR Technologies

幅広い業務利利⽤用
10 – 2000 ノード

®
リアルタイム広告オークション

Sellers
Cloud
!

Advertising
Automation
Cloud
!

Buyers
!
Cloud
!

900億

広告オークション
⼀一⽇日あたり

© MapR Technologies

®
フォーチュン100⼩小売⼤大⼿手

4,500万
買い物客

⼀一ヶ⽉月あたり分析対象

© MapR Technologies

®
世界最⼤大のバイオメトリックDB

12億
⼈人

© MapR Technologies

®
MapR 最新のリリース
O’Reilly Strata Conference 2014 in Santa Clara
(2014/2/11〜13) での発表
	

1

YARN をサポートした Apache
Hadoop 2.2 を含む最新のデ
ィストリビューションを発表	

既存アプリと
MapReduce以外の
アプリを共存可能に

2

無償で使⽤用できる開発者向け  
Hadoop Sandbox を発表	

開発と運⽤用⼿手法の
習得を加速
	

3

HP Vertica プラットフォームを  
  
MapR 上で提供	
© MapR Technologies

SQLでの分析・
業務処理理の統合
	

®
さっそく MapR を始めましょう
Free Trial	
MapR 評価版ダウンロード
30⽇日間無償の評価ライセンス

Amazon Web Services (EMR)
Google Compute Engine
数分でクラウド上でクラスタを⽴立立ち上げ

MapR Sandbox
無償の開発者向け
シングルノードVMイメージ
© MapR Technologies

®

More Related Content

PDF
MapR Streams & MapR コンバージド・データ・プラットフォーム
PDF
MapR と Vertica エンジニアが語る、なぜその組み合わせが最高なのか? - db tech showcase 大阪 2014 2014/06/19
PDF
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
PDF
Hadoop によるゲノム解読
PDF
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
PDF
スケールアウト・インメモリ分析の標準フォーマットを目指す Apache Arrow と Value Vectors - Tokyo Apache Dril...
PDF
マップアールが考える企業システムにおける分析プラットフォームの進化 - 2014/06/27 Data Scientist Summit 2014
PDF
HBase と Drill - 緩い型付けの SQL がいかに NoSQL に適しているか
MapR Streams & MapR コンバージド・データ・プラットフォーム
MapR と Vertica エンジニアが語る、なぜその組み合わせが最高なのか? - db tech showcase 大阪 2014 2014/06/19
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
Hadoop によるゲノム解読
Hadoop最新情報 - YARN, Omni, Drill, Impala, Shark, Vertica - MapR CTO Meetup 2014...
スケールアウト・インメモリ分析の標準フォーマットを目指す Apache Arrow と Value Vectors - Tokyo Apache Dril...
マップアールが考える企業システムにおける分析プラットフォームの進化 - 2014/06/27 Data Scientist Summit 2014
HBase と Drill - 緩い型付けの SQL がいかに NoSQL に適しているか

What's hot (20)

PDF
MapR 5.2: MapR コンバージド・コミュニティ・エディションを使いこなす
PDF
逆らえない大きな流れ: 次世代のエンタープライズアーキテクチャ
PDF
Fast Data を扱うためのデザインパターン
PDF
実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...
PDF
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
PDF
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
PDF
Hadoop概要説明
PDF
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
PDF
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
PDF
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
PPTX
Hadoopトレーニング番外編 〜間違えられやすいHadoopの7つの仕様〜
PDF
(LT)Spark and Cassandra
PDF
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
PDF
ストリーミングアーキテクチャ: State から Flow へ - 2016/02/08 Hadoop / Spark Conference Japan ...
PDF
Apache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッション
PDF
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
PDF
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
PPTX
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
PPTX
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
PDF
Hadoopによる大規模分散データ処理
MapR 5.2: MapR コンバージド・コミュニティ・エディションを使いこなす
逆らえない大きな流れ: 次世代のエンタープライズアーキテクチャ
Fast Data を扱うためのデザインパターン
実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...
MapR アーキテクチャ概要 - MapR CTO Meetup 2013/11/12
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Hadoop概要説明
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
Amazon Elastic MapReduce@Hadoop Conference Japan 2011 Fall
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
Hadoopトレーニング番外編 〜間違えられやすいHadoopの7つの仕様〜
(LT)Spark and Cassandra
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
ストリーミングアーキテクチャ: State から Flow へ - 2016/02/08 Hadoop / Spark Conference Japan ...
Apache Drill でたしなむ セルフサービスデータ探索 - 2014/11/06 Cloudera World Tokyo 2014 LTセッション
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
Hadoopによる大規模分散データ処理
Ad

Similar to ビジネスへの本格活用が始まったHadoopの今 ~MapRが選ばれる理由~ - ビッグデータEXPO東京 2014/02/26 (20)

PDF
Okinawa Open Days HP事例紹介
PDF
SDN Conference 2014 Tokyo / Osaka , HP presentation
PPTX
New Technology Trends and Effects on Business
PDF
JISAAwards2013講演会資料(hifive)
PDF
CloudSpiral 2014年度 ビッグデータ講義
PDF
ERPのデータをフロントシステムでどう活かすか
PDF
20131212 morphlabs okinawa_presentation
PDF
Okinawa Open Daysでの講演(OpenStackトレーニングなど)
PDF
2021/02/19 Alterbooth 多忙なアーキテクトのためのクラウド導入フレームワーク (CAF) ダイジェスト
PDF
Red Hat Forum 2014 IBM session
PDF
データ分析を支える技術 DWH再入門
PDF
CUPA Cafe #18 ~Enterpriseのためのクラウド~
PDF
Case study of DevOps for Hadoop in Recruit.
PDF
Case study of DevOps for Hadoop in Recruit.
PDF
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
PDF
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
PDF
Spark MLlibではじめるスケーラブルな機械学習
PDF
Oracle Database 12c Release 1 PSR 12.1.0.2 のご紹介
PPTX
MapReduceを使った並列化 20111212
PDF
避けては通れないビッグデータ周辺の重要課題
Okinawa Open Days HP事例紹介
SDN Conference 2014 Tokyo / Osaka , HP presentation
New Technology Trends and Effects on Business
JISAAwards2013講演会資料(hifive)
CloudSpiral 2014年度 ビッグデータ講義
ERPのデータをフロントシステムでどう活かすか
20131212 morphlabs okinawa_presentation
Okinawa Open Daysでの講演(OpenStackトレーニングなど)
2021/02/19 Alterbooth 多忙なアーキテクトのためのクラウド導入フレームワーク (CAF) ダイジェスト
Red Hat Forum 2014 IBM session
データ分析を支える技術 DWH再入門
CUPA Cafe #18 ~Enterpriseのためのクラウド~
Case study of DevOps for Hadoop in Recruit.
Case study of DevOps for Hadoop in Recruit.
Hadoop Conference Japan_2016 セッション「顧客事例から学んだ、 エンタープライズでの "マジな"Hadoop導入の勘所」
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
Spark MLlibではじめるスケーラブルな機械学習
Oracle Database 12c Release 1 PSR 12.1.0.2 のご紹介
MapReduceを使った並列化 20111212
避けては通れないビッグデータ周辺の重要課題
Ad

More from MapR Technologies Japan (12)

PDF
Drill超簡単チューニング
PDF
Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09
PPTX
Apache Drill で日本語を扱ってみよう + オープンデータ解析
PDF
Drilling into Data with Apache Drill - Tokyo Apache Drill Meetup 2015/11/12
PDF
Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11
PDF
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
PDF
異常検知 - 何を探すかよく分かっていないものを見つける方法
PDF
時系列の世界の時系列データ
PDF
Apache Drill を利用した実データの分析
PDF
Apache Drill: Rethinking SQL for Big data – Don’t Compromise on Flexibility o...
PDF
エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション - db tech showcase 大阪 2014 201...
PDF
MapR M7 技術概要
Drill超簡単チューニング
Spark Streaming の基本とスケールする時系列データ処理 - Spark Meetup December 2015/12/09
Apache Drill で日本語を扱ってみよう + オープンデータ解析
Drilling into Data with Apache Drill - Tokyo Apache Drill Meetup 2015/11/12
Apache Drill でオープンデータを分析してみる - db tech showcase Sapporo 2015 2015/09/11
Apache Drill で JSON 形式の オープンデータを分析してみる - db tech showcase Tokyo 2015 2015/06/11
異常検知 - 何を探すかよく分かっていないものを見つける方法
時系列の世界の時系列データ
Apache Drill を利用した実データの分析
Apache Drill: Rethinking SQL for Big data – Don’t Compromise on Flexibility o...
エンタープライズ NoSQL/HBase プラットフォーム – MapR M7 エディション - db tech showcase 大阪 2014 201...
MapR M7 技術概要

ビジネスへの本格活用が始まったHadoopの今 ~MapRが選ばれる理由~ - ビッグデータEXPO東京 2014/02/26