SlideShare a Scribd company logo
HADOOPの標準GUI
HUEの
最新情報
Tatsuo Kawasaki
kawasaki@cloudera.com

Hadoop User Conference 2014, Jul 8, 2014
HUE以前
基本的な操作はコマンド
ラインから
エンジニア、パワーユー
ザー以外には敷居が高い
HUE以後
Hadoop用のGUI
ブラウザから操作
・Windowsでも
・Macでも
・Linuxでも
その気になれば、タブ
レットやスマホでも!
HUEの目標
APACHE HADOOPで
データを分析するための
ウェブインタフェース
シンプル&統合
無料&オープンソース
̶> ビッグデータを多くの人に
おおまかな概要
Hadoop
 Web Server
あなた、同僚、
IE9を使っている友人でさえも ;)
オープンソース
3350 のコミット
38 人のコントリビュータ
698 のスター
245 のフォーク
github.com/cloudera/hue
開発コアチーム
Join	
  us	
  at	
  team.gethue.com	
  
Romain	
  Rigaux	
   Enrico	
  Ber5	
  Chang	
   Abraham	
  Elmahrek	
  Amstel	
  
トーク
ミートアップとイベント:	
  	
  NYC,	
  
Paris,	
  LA,	
  Tokyo,	
  SF,	
  Stockholm,	
  
Vienna,	
  San	
  Jose,	
  Singapore,	
  
Budapest…	
  
近日予定:	
  London,	
  West	
  coast	
  
AROUND

THE WORLD
避暑
Nov	
  13	
  Koh	
  Chang,	
  Thailand	
  
May	
  14	
  Curaçao,	
  Netherlands	
  An5lles	
  
Nov	
  14	
  Goa,	
  India	
  
トレンド: 成長
gethue.com	
  
HISTORY


HUE 1
ブラウザ内でデスクトッ
プのような機能を実現し
ていたが、かなり遅く、
メモリリークもあり、IE
には適していなかった。
しかし、その当時
(2009-2010)は明らか
に先進的だった。
HISTORY


HUE 2
いたるところがTwitter
のブートストラップによ
る最初のフラット構造な
実装
HUE 2.5
自動補完とドラッグ&ド
ロップのような新しい良
い機能を追加し、ユー
ザーエクスペリエンスを
改善した新しいアプリ
HISTORY


HUE 3 ALPHA
提案されたデザイン。
うまくいかなかった
HISTORY


HUE 3.5
新しいUI、いくつかの新
しいアプリ、これまでで
最もユーザーフレンド
リーな機能	
  
HISTORY


HUE 3.6+
そして今…
データを検索、探索する
ための全く新しい方法
どちらのバージョンを使うべきか?
その後の2500以上のコミット、
新しいUI、インタラクティブな
検索、SQL、ダッシュボード…
1∼2年古いバージョンで、
Hive0.12以前に依存して
いる場合にのみ使用する
HUE 2.X
 HUE 3.X
どのディストリビューションを使うべきか?
先進的なプレビュー版 最も安定し、コンポー
ネント間での確認もな
されている
非常に新しい
GITHUB
 CDH / CM
TARBALL
ハッカー 先進的なユーザー 一般ユーザー
どこにHUEを配置するべきか? 1台のマシン
どこにHUEを配置するべきか?
 クラスタの外
どこにHUEを配置するべきか? クラスタの内側
Python 2.4 2.6
パッケージを使用する場合。
ソースからビルドする場合は
その他の packagesが必要
SERVER
 CLIENT
ウェブブラウザ
IE 9+, FF 10+, Chrome,
Safari
必要なものは?
Hi	
  there,	
  I’m	
  “just”	
  a	
  web	
  server.	
  
HUEのサービスは?
ページ、および静的コ
ンテンツも提供するプ
ロセス
1 SERVER
 1 DB
クッキー、保存したク
エリ、ワークフロー用
Hi	
  there,	
  I’m	
  “just”	
  a	
  web	
  server.	
  
HUEの設定方法
HUE.INI
core-site.xmlに似ている
が、.INI形式の構文
場所?
/etc/hue/conf/hue.ini
または
$HUE_HOME/desktop/conf/
pseudo-distributed.ini
[desktop]
[[database]]
# Database engine is typically one of:
# postgresql_psycopg2, mysql, or sqlite3
engine=sqlite3
## host=
## port=
## user=
## password=
name=desktop/desktop.db
認証
データベース
(SQLite, MySQL,
…)にLogin/
Passwordを管理
SIMPLE ENTERPRISE
LDAP (最も使用され
ている), OAuth,
OpenID, SAML
DBバックエンド
LDAPバックエンド
Integrate	
  your	
  employees:	
  LDAP	
  How	
  to	
  guide	
  
ユーザー
ユーザーまたはユー
ザーのグループに、権
限を付与、破棄できる
管理者 ユーザー
標準ユーザー + 権限
グループのリストと権限
権限ができること:
- アプリ(例: Hiveエ
ディタ)へのアクセス
を許可
- アプリからデータを
修正 (例: Hiveテーブ
ルのDROPや、
HBaseブラウザでセ
ルを編集)
設定 ‒ アプリケーションと権限
A	
  list	
  of	
  permissions	
  
実行中の権限
「test」ユーザーは
「hive」権限のみを持つ
「hiveonly」グループに
属している
設定 ‒ アプリケーションと権限
どのようにHUEはHADOOPとやり取りするのか
YARN	

JobTracker	

Oozie	

Hue Plugins	

LDAP	

SAML	

Pig	

HDFS	

 HiveServer2	

Hive	

Metastore	

Cloudera	

Impala	

Solr	

HBase	

Sqoop2	

Zookeeper
RPC CALL
全てのHADOOPコンポーネントに
HDFSの例
WebHDFS
REST
DN
DN
DN
…
DN
NN
hp://localhost:50070/webhdfs/v1/<PATH>?op=LISTSTATUS	
  
HOW
hue.iniにHadoop API
の全てのホストとポー
トをリスト
HBaseとHiveの例
Full	
  list	
  
[hbase]
# Comma-separated list of HBase Thrift servers for
# clusters in the format of '(name|host:port)'.
hbase_clusters=(Cluster|localhost:9090)
[beeswax]
hive_server_host=host-abc
hive_server_port=10000
RPC CALL
全てのHADOOPコンポーネントに
HTTPS
 SSL DB
SSL WITH HIVESERVER2
さらに多く …
AUDITING
セキュリティ
KERBEROS
2つのHueインスタンス
HA proxy
Multi DB
パフォーマンス: ウェブ
サイトのようにほとんど
がRPCコール
高可用性
HOW
Impala, Hiveの統合,
Spark (Shark も)
対話的なSQLエディタ
MapReduce、メタス
トア、HDFSを統合
SQL
WHAT
Solr&Cloudを統合
カスタムできる対話的
なダッシュボード
ドラッグ&ドロップ
ウィジェット (チャー
ト、タイムライン…)
SEARCH(検索)
WHAT
シンプルなカスタムク
エリ言語
HBaseフィルタ言語を
サポート
選択、コピー&ペース
ト
自動補完のヘルプメ
ニュー
HBASEブラウザ
WHAT
DEMO 
TIME

まとめ
Hueでプロキシーユーザーと
してHadoop Service APIを
有効化
各サービスAPIを示すよう
にhue.iniを設定
@gethue や hue-user
マシンにHueを
インストール
LDAPバックエンドを使用
インストール 設定有効化
ヘルプLDAP
次の6ヶ月のロードマップ
Sentry
Search, Spark, SQL
多くのダッシュボード!
Oozie v2
内部コンポーネントの統
合 (HBase <-> Search,
インデックス作成ウィ
ザード、ドキュメントの
権限), Hadoop Web
apps SDK
あなたのアイデアは?
WHAT


…GIVE CLOUDERA MANAGER A TRY!
vimeo.com/91805055	
  
設定が難しい…
何か間違っている?
learn.gethue.com	
  
インストールせずに試してみる
demo.gethue.com	
  
TWITTER
@gethue	
  
USER
GROUP
hue-­‐user@	
  
WEBSITE
hp://gethue.com	
  
LEARN
hp://learn.gethue.com	
  
THANK YOU! 


翻訳版ブログ公開中	
  
hp://gethue.com/blog/?lang=ja	
  

More Related Content

PDF
ストリーム処理プラットフォームにおけるKafka導入事例 #kafkajp
PDF
Open Policy Agent (OPA) 入門
PDF
Java EE から Quarkus による開発への移行について
PPTX
FHIR Server 安裝與使用
PPTX
Oracle Database (CDB) on Docker を動かしてみる
PPT
インフラエンジニアのためのcassandra入門
PDF
Google Cloud Dataflow を理解する - #bq_sushi
PPTX
Apache Avro vs Protocol Buffers
ストリーム処理プラットフォームにおけるKafka導入事例 #kafkajp
Open Policy Agent (OPA) 入門
Java EE から Quarkus による開発への移行について
FHIR Server 安裝與使用
Oracle Database (CDB) on Docker を動かしてみる
インフラエンジニアのためのcassandra入門
Google Cloud Dataflow を理解する - #bq_sushi
Apache Avro vs Protocol Buffers

What's hot (20)

PDF
클라우드 허브: 멀티클라우드 시대의 디지털 비즈니스 핵심 전략
PDF
BuildKitの概要と最近の機能
PDF
はじめてのpostmarketOSインストール Windowsタブレット #kagolug Beginner for install postmar...
PDF
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL
PDF
NGINX ADC: Basics and Best Practices – EMEA
PDF
Apache Hadoopの未来 3系になって何が変わるのか?
PDF
Docker Compose入門~今日から始めるComposeの初歩からswarm mode対応まで
PDF
Apache Bigtop3.2 (仮)(Open Source Conference 2022 Online/Hiroshima 発表資料)
PDF
そんなトランザクションマネージャで大丈夫か?
PPTX
Kafka error handling patterns and best practices | Hemant Desale and Aruna Ka...
PDF
捕鯨!詳解docker
PDF
インフラ野郎AzureチームProX
PDF
次世代Webコンテナ Undertowについて
PPTX
フロー技術によるネットワーク管理
PDF
[CTO Night & Day 2019] 高可用性アーキテクチャについて考える #ctonight
PDF
Kuberneteの運用を支えるGitOps
PDF
Quarkus入門
PDF
噛み砕いてKafka Streams #kafkajp
PPTX
Hadoop -NameNode HAの仕組み-
PDF
Active Directory のおさらいをしましょう!~グループポリシー編~
클라우드 허브: 멀티클라우드 시대의 디지털 비즈니스 핵심 전략
BuildKitの概要と最近の機能
はじめてのpostmarketOSインストール Windowsタブレット #kagolug Beginner for install postmar...
20190424 AWS Black Belt Online Seminar Amazon Aurora MySQL
NGINX ADC: Basics and Best Practices – EMEA
Apache Hadoopの未来 3系になって何が変わるのか?
Docker Compose入門~今日から始めるComposeの初歩からswarm mode対応まで
Apache Bigtop3.2 (仮)(Open Source Conference 2022 Online/Hiroshima 発表資料)
そんなトランザクションマネージャで大丈夫か?
Kafka error handling patterns and best practices | Hemant Desale and Aruna Ka...
捕鯨!詳解docker
インフラ野郎AzureチームProX
次世代Webコンテナ Undertowについて
フロー技術によるネットワーク管理
[CTO Night & Day 2019] 高可用性アーキテクチャについて考える #ctonight
Kuberneteの運用を支えるGitOps
Quarkus入門
噛み砕いてKafka Streams #kafkajp
Hadoop -NameNode HAの仕組み-
Active Directory のおさらいをしましょう!~グループポリシー編~
Ad

Viewers also liked (20)

PDF
⾃宅で Hive 愛を育むための⼿順(Raspberry Pi 編)
PDF
自宅でHive愛を育む方法 〜Raspberry Pi編〜
PDF
PL/Perlのはなし
PDF
Hadoop operation chaper 4
PDF
Hue勉強会 20131008
PDF
Javaのプログラムはどうやって動いているの? GC編
PDF
分類器 (ナイーブベイズ)
DOCX
Universidad nacional del altiplano sistemas dig
PDF
Better Presentations
PDF
DAILY AGRI REPORT BY EPIC RESEARCH- 3 NOVEMBER 2012
PPT
OER development and re-use
PDF
"Arbejde fremstilling og handling" Hannah Arendt's filosofi om arbejde. Works...
PPTX
Building a InCredible Product Brand (Christina Inge) ProductCamp Boston May 2013
PDF
Digital Marketing by NetMedia8
PPT
Latihan 2
PPTX
Il software MARIE (Progettazione interfacce e valutazione dell'usabilità)
KEY
Presentación de Educar21 en el aula
PDF
Grafico diario del dax perfomance index para el 08 10-2013
PDF
Wildnet Technologies
PPTX
The hyper social organization
⾃宅で Hive 愛を育むための⼿順(Raspberry Pi 編)
自宅でHive愛を育む方法 〜Raspberry Pi編〜
PL/Perlのはなし
Hadoop operation chaper 4
Hue勉強会 20131008
Javaのプログラムはどうやって動いているの? GC編
分類器 (ナイーブベイズ)
Universidad nacional del altiplano sistemas dig
Better Presentations
DAILY AGRI REPORT BY EPIC RESEARCH- 3 NOVEMBER 2012
OER development and re-use
"Arbejde fremstilling og handling" Hannah Arendt's filosofi om arbejde. Works...
Building a InCredible Product Brand (Christina Inge) ProductCamp Boston May 2013
Digital Marketing by NetMedia8
Latihan 2
Il software MARIE (Progettazione interfacce e valutazione dell'usabilità)
Presentación de Educar21 en el aula
Grafico diario del dax perfomance index para el 08 10-2013
Wildnet Technologies
The hyper social organization
Ad

More from Cloudera Japan (20)

PPTX
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
PPTX
機械学習の定番プラットフォームSparkの紹介
PPTX
HDFS Supportaiblity Improvements
PDF
分散DB Apache Kuduのアーキテクチャ DBの性能と一貫性を両立させる仕組み 「HybridTime」とは
PDF
Apache Impalaパフォーマンスチューニング #dbts2018
PDF
Apache Hadoop YARNとマルチテナントにおけるリソース管理
PDF
HBase Across the World #LINE_DM
PDF
Cloudera のサポートエンジニアリング #supennight
PDF
Train, predict, serve: How to go into production your machine learning model
PDF
Apache Kuduを使った分析システムの裏側
PDF
Cloudera in the Cloud #CWT2017
PDF
先行事例から学ぶ IoT / ビッグデータの始め方
PPTX
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
PDF
How to go into production your machine learning models? #CWT2017
PDF
Apache Kudu - Updatable Analytical Storage #rakutentech
PPTX
Hue 4.0 / Hue Meetup Tokyo #huejp
PDF
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
PDF
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
PDF
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
PDF
Cloud Native Hadoop #cwt2016
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
機械学習の定番プラットフォームSparkの紹介
HDFS Supportaiblity Improvements
分散DB Apache Kuduのアーキテクチャ DBの性能と一貫性を両立させる仕組み 「HybridTime」とは
Apache Impalaパフォーマンスチューニング #dbts2018
Apache Hadoop YARNとマルチテナントにおけるリソース管理
HBase Across the World #LINE_DM
Cloudera のサポートエンジニアリング #supennight
Train, predict, serve: How to go into production your machine learning model
Apache Kuduを使った分析システムの裏側
Cloudera in the Cloud #CWT2017
先行事例から学ぶ IoT / ビッグデータの始め方
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
How to go into production your machine learning models? #CWT2017
Apache Kudu - Updatable Analytical Storage #rakutentech
Hue 4.0 / Hue Meetup Tokyo #huejp
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Cloud Native Hadoop #cwt2016

Hadoopの標準GUI HUEの最新情報