SlideShare a Scribd company logo
Faster and Easier for HBase 
亦思科技Hubert 范姜冠宇
Who are we? 
• 位於新竹科學園區 
• 過去主要客戶為園區各大製造廠 
• 未來願景: 全球HBase最專業的軟體廠商 
• 努力方向: 
– 提供HBase較好的使用介面 
– 改善HBase效能,提高Availability 
– 提供各產業完善的HBase解決方案
What we done? 
• 2010.7 以研發雲端計算軟體工具之投資計畫獲准進駐新竹科學園區 
• 2011 與清華大學資工系鍾葉青教授合作進行產學合作 
• 少數獲邀參與國際雲端計算研討會IEEE CloudCom的專業公司 
• 少數已經有實際經驗協助客戶完成建置Hadoop 系統的資訊廠商 
• 2012.01 JackHare (ANSI SQL JDBC Driver) 
• 2012.11 HareDB Hbase Client 
• 2012.12 HareDB Data Model Management 
• 2013.08 Hare ( High Speed Query in HBase)
Easier and Faster for hbase in HadoopCon 2014
Who am I ? 
• 姓名: 范姜冠宇Hubert 
• 任職: 亦思科技 
• 功能: 
– 設計HBase相關產品與解決方案 
– 替苦悶的RD工程師打氣 
– 在嚴肅場合說冷笑話
TALK ABOUT HBASE
HBase 原生介面
不方便的HBase 
• 資料傾倒問題 
• Table 管理問題 
– Schema 管理問題 
• 查詢問題(方便,效能) 
• 程式學習門檻問題
資料傾倒問題
資料傾倒問題
資料傾倒問題
TABLE管理問題
Table管理
查詢問題
查詢問題(UI Query)
查詢問題(SQL Query)
程式學習門檻問題
如何降低門檻 
• ODBC/JDBC Driver 
• HareSQL Driver 
• Example with R
ODBC DRIVER
Easier and Faster for hbase in HadoopCon 2014
ODBC Driver 
• http://www.microsoft.com/en-us/download/details.aspx?id=40886
設定HareDB連線資訊 
• 在`開始`搜尋odbc administrator(如圖) 
• 若作業系統為X64,請執行64-bit;X86請 
執行32-bit。
設定HareDB連線資訊 
• 點選新增,建立新資料來源。 
• 選擇`Microsoft Hive ODBC Driver`後,點 
選完成。
設定HareDB連線資訊
Excel 讀取HareDB 示範
Excel 讀取HareDB 示範
Excel 讀取HareDB 示範
Excel 讀取HareDB 示範
Excel 讀取HareDB 示範
Excel 讀取HareDB 示範
Excel 讀取HareDB 示範
Excel 讀取HareDB 示範
SQL STRING
Easier and Faster for hbase in HadoopCon 2014
Easier and Faster for hbase in HadoopCon 2014
與應用系統整合– ( R )
Easier and Faster for hbase in HadoopCon 2014
Easier and Faster for hbase in HadoopCon 2014
FASTER
Client 
Hare Executor Coprocessor Windup Server 
Region 4 
HBase 
Hight Speed ? 
HiveQL 
Hive Parser HareDriver 
Hare Planner 
Hare Executor Coprocessor 
Hare Optimizer 
Region 3 
EndPoint 
Instance 
EndPoint 
Instance 
Region 2 
EndPoint 
Instance 
Region 1 
Region 5
SQL A SQL B SQL C SQL E SQL F SQL G SQL H 
Faster 
Impala in Hadoop 115 s 13 s 91 s 78 s 7 s 6 s 
Impala in HBase 2925 s 0.26 s 2338 s 5876 s 5832 s oom 
Hare 
(only for HBase) 
1410 s 9 s 1355 s 1303 s 1283 s 1258 s 1640 s 
Hive in Hadoop 113 s 107 s 110 s 161 s 154 s 163 s 157 s 
Hive mr2 10694 s 22 s 9661 s 9462 s 9461 s 9484 s 9032 s
One more thing ….
Easier and Faster for hbase in HadoopCon 2014

More Related Content

PDF
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
PDF
阿里云Hadoop在云上的最佳实践
PDF
How to plan a hadoop cluster for testing and production environment
PPTX
淘宝Hadoop数据分析实践
PDF
2016-07-12 Introduction to Big Data Platform Security
PPTX
Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構
PDF
How We Prepared Etu Hadoop Competition 2014
PDF
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Apache hadoop and cdh(cloudera distribution) introduction 基本介紹
阿里云Hadoop在云上的最佳实践
How to plan a hadoop cluster for testing and production environment
淘宝Hadoop数据分析实践
2016-07-12 Introduction to Big Data Platform Security
Track A-3 Enterprise Data Lake in Action - 搭建「活」的企業 Big Data 生態架構
How We Prepared Etu Hadoop Competition 2014
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告

What's hot (20)

PPTX
阿里自研数据库 Ocean base实践
PPTX
Hadoop hive
PDF
Kyligence Leverages Alluxio to Accelerate OLAP in the Cloud
PDF
Hadoop con 2015 hadoop enables enterprise data lake
PDF
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
PDF
Azure Data Lake 簡介
PDF
00.exalogic概览
PDF
運用MMLSpark 來加速Spark 上 機器學習專案
PDF
Databases on AWS
PDF
唯品会大数据实践 Sacc pub
PDF
数据科学分析协作平台CDSW
PDF
Distributed Data Analytics at Taobao
PPTX
Mapreduce
PPTX
2021 二月 Kasten K10 介紹與概觀
PDF
阿里云技术实践
PDF
Sql server 2014 新功能探索
PDF
The practice of enjoying apache
PPT
Hadoop 與 SQL 的甜蜜連結
PDF
Cloudera企业数据中枢平台
PDF
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
阿里自研数据库 Ocean base实践
Hadoop hive
Kyligence Leverages Alluxio to Accelerate OLAP in the Cloud
Hadoop con 2015 hadoop enables enterprise data lake
Big Data Taiwan 2014 Track1-3: Big Data, Big Challenge — Splunk 幫你解決 Big Data...
Azure Data Lake 簡介
00.exalogic概览
運用MMLSpark 來加速Spark 上 機器學習專案
Databases on AWS
唯品会大数据实践 Sacc pub
数据科学分析协作平台CDSW
Distributed Data Analytics at Taobao
Mapreduce
2021 二月 Kasten K10 介紹與概觀
阿里云技术实践
Sql server 2014 新功能探索
The practice of enjoying apache
Hadoop 與 SQL 的甜蜜連結
Cloudera企业数据中枢平台
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
Ad

Viewers also liked (20)

PPT
3rd Hour- Homelessness Around The World. By. Emily A. Scharich.(:
PDF
Cvmaira[1]
PPT
S.s presentation Zachary
PDF
Adaptació
PPT
Wind dylanhearns
PPT
Devon 2
PPT
Japan earthquake Austin Tyndall
PPT
Cyclones,quentin
PDF
PPT
Child abuse: eric
PPT
Poaching Tyler Amburgey
PDF
AFP 2011 report universal
PPT
Liver cancer
PPTX
Introduction to Apache Spark
PPT
Child labor
PPTX
Il segreto del Dio di Michelangelo
PPT
Domestic violence Hunter g
PPT
Marine biology adl
PPT
Child abuse worldwide,Jurnee
3rd Hour- Homelessness Around The World. By. Emily A. Scharich.(:
Cvmaira[1]
S.s presentation Zachary
Adaptació
Wind dylanhearns
Devon 2
Japan earthquake Austin Tyndall
Cyclones,quentin
Child abuse: eric
Poaching Tyler Amburgey
AFP 2011 report universal
Liver cancer
Introduction to Apache Spark
Child labor
Il segreto del Dio di Michelangelo
Domestic violence Hunter g
Marine biology adl
Child abuse worldwide,Jurnee
Ad

Similar to Easier and Faster for hbase in HadoopCon 2014 (20)

PDF
高科技產業資料分析解決方案 Hare DB
PPTX
张挺大数据产品测试方法论(欢迎大数据产品测试相关行业的技术人员来讨论).pptx
PDF
Hadoop ecosystem - hadoop 生態系
PDF
Qcon2013 罗李 - hadoop在阿里
PPTX
Hadoop 介紹 20141024
PDF
吕潇 星环科技大数据技术探索与应用实践
PDF
2015中国软件技术大会-开放云介绍
PDF
選擇正確的Solution 來建置現代化的雲端資料倉儲
PDF
Bigdata introduction
PDF
Hadoop Deployment Model @ OSDC.TW
PPTX
云梯的多Namenode和跨机房之路
PPTX
大數據
PDF
Zh120226techparty velocity2011-review
PDF
王涛:基于Cloudera impala的非关系型数据库sql执行引擎
PPTX
HDInsight for Microsoft Users
PDF
Hbase在淘宝的应用与优化 修改
PDF
Raising The MySQL Bar-Manyi Lu
PPT
Paas研究介绍
PDF
Hbase optimization and apply summary in taobao
PPTX
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
高科技產業資料分析解決方案 Hare DB
张挺大数据产品测试方法论(欢迎大数据产品测试相关行业的技术人员来讨论).pptx
Hadoop ecosystem - hadoop 生態系
Qcon2013 罗李 - hadoop在阿里
Hadoop 介紹 20141024
吕潇 星环科技大数据技术探索与应用实践
2015中国软件技术大会-开放云介绍
選擇正確的Solution 來建置現代化的雲端資料倉儲
Bigdata introduction
Hadoop Deployment Model @ OSDC.TW
云梯的多Namenode和跨机房之路
大數據
Zh120226techparty velocity2011-review
王涛:基于Cloudera impala的非关系型数据库sql执行引擎
HDInsight for Microsoft Users
Hbase在淘宝的应用与优化 修改
Raising The MySQL Bar-Manyi Lu
Paas研究介绍
Hbase optimization and apply summary in taobao
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...

Easier and Faster for hbase in HadoopCon 2014

Editor's Notes

  • #28: 左邊的Table是 HBase Table + Hive Table 右邊HBase的欄位也會出現