SlideShare a Scribd company logo
Hadoop程式開發與環境設置
簡報製作:蘇立鼎
開發環境概述(java)
hadoop標準的開發工具需要maven與eclipse,
本投影片講述在Windows上進行coding,將專案
編譯後,再傳至linux環境中的hadoop運行之。
hadoop
maven eclipse
版本
Hadoop 2.4.0
m2eclipse (with JDK7)
Apache Maven 3.2.2
安裝maven
Maven是JAVA的專案管理與編譯工具,
在linux與windows都可以安裝。
Linux安裝與windows的方式皆為,由
官網下載解壓包,進行解壓。
要使用前,必須配置環境變數
安裝maven(續)
(ubuntu)
在其中加入
應用變量
$vim ~/.bashrc
# export M2_HOME=/usr/local/maven
# export PATH=$M2_HOME/bin:$PATH
$source ~/.bashrc
安裝maven(續)
(Windows)
安裝後可以在linux或cmd輸入測試指令
M2_HOME
$mvn -v
安裝 m2eclipse
Eclipse中 -
在add裡加入m2eclipse
Location: http://download.eclipse.org/technology/m2e/releases
點擊下一步進行安裝即可
Install New
Software
Help
開發MapReduce簡易流程
這邊做一個簡易的WordCount程式
(1)在環境安置好後 建立 Maven Project
1.
3.
2.
4.
(2)建立好專案後,可以把預設的
App.java,以及Test資料夾刪除
點開pom.xml,再點擊同名頁籤
(3)修改pom.xml
這邊主要的目的是利用Maven插件的功
能,去抓對應版本,我們會使用到的
jar檔,run的時候,選擇maven install
即可
完整程式碼請見附件
抓取的jar
(4)建立三個java檔,作為基本的架構
[主程式、Mapper、Reducer]
程式碼在附件中
(5)利用Maven編譯打包,開啟cmd.exe
,在cmd中,cd至專案的位置後,輸入
$mvn clean install
檢查專案文件夾內的target文件夾
jar檔是否已經出現
(5)以FTP傳輸整個專案至hadoop的運作
環境中
(6)在linux環境創立兩個文件 file1.txt 、
file2.txt 在裡面打入任意的內容 例如:
在Hadoop新增目錄/data
將兩個文件上傳至Hadoop
$hadoop fs -mkdir /data
$hadoop fs -put -f ./file1.txt ./file2.txt /data
(7)執行我們上傳的jar檔
$hadoop jar SimpleMapReduce/target/MapReduce-0.0.1-
SNAPSHOT.jar easytest.hadoop.SimpleMapReduce.WordCount
/data /op
(8)觀看運作結果
我們簡單的範例就運行完成了,可以此
當作開發的範本
$hadoop fs -cat /op/part-r-00000

More Related Content

PPTX
加速開發! 在Windows開發hadoop程式,直接運行 map/reduce
PPTX
Hadoop 設定與配置
PPTX
Hadoop 簡介 教師 許智威
PPTX
HDFS與MapReduce架構研討
PPTX
Hadoop安裝 (1)
PPT
Hadoop Map Reduce 程式設計
PDF
Hadoop开发者入门专刊
PDF
Deployment with Capistrano
加速開發! 在Windows開發hadoop程式,直接運行 map/reduce
Hadoop 設定與配置
Hadoop 簡介 教師 許智威
HDFS與MapReduce架構研討
Hadoop安裝 (1)
Hadoop Map Reduce 程式設計
Hadoop开发者入门专刊
Deployment with Capistrano

What's hot (20)

PDF
DRBL-live-hadoop at TSLC
PPTX
线上问题排查交流
PDF
DAE 新变化介绍
PDF
Bigdata 大資料分析實務 (進階上機課程)
PPTX
Hadoop hive
PPT
系统性能分析和优化.ppt
PPTX
Mahout資料分析基礎入門
PPTX
使用Ubuntu架設hadoop
PDF
Docker
PDF
20150604 docker 新手入門
PDF
Something about Kafka - Why Kafka is so fast
PDF
[DCTPE2011] 8) 多伺服器/高效能的Drupal 主機解決方案--James Liu
PDF
Laravel - 系統全攻略(續)
PDF
AWS EC2 for beginner
PPT
Hadoop平台搭建
PDF
Hadoop ecosystem - hadoop 生態系
XLS
Puppet安装总结
PDF
Big Java, Big Data
PPT
Mysql展示功能与源码对应
PPT
善用工具
DRBL-live-hadoop at TSLC
线上问题排查交流
DAE 新变化介绍
Bigdata 大資料分析實務 (進階上機課程)
Hadoop hive
系统性能分析和优化.ppt
Mahout資料分析基礎入門
使用Ubuntu架設hadoop
Docker
20150604 docker 新手入門
Something about Kafka - Why Kafka is so fast
[DCTPE2011] 8) 多伺服器/高效能的Drupal 主機解決方案--James Liu
Laravel - 系統全攻略(續)
AWS EC2 for beginner
Hadoop平台搭建
Hadoop ecosystem - hadoop 生態系
Puppet安装总结
Big Java, Big Data
Mysql展示功能与源码对应
善用工具
Ad

Viewers also liked (8)

PDF
大資料趨勢介紹與相關使用技術
PDF
Hadoop sqoop
PDF
Hadoop 0.20 程式設計
PDF
Hadoop pig
PDF
Hadoop 2.0 之古往今來
PDF
MapReduce 簡單介紹與練習
PDF
Storm特性
PPTX
工程師必備第一工具 - Git
大資料趨勢介紹與相關使用技術
Hadoop sqoop
Hadoop 0.20 程式設計
Hadoop pig
Hadoop 2.0 之古往今來
MapReduce 簡單介紹與練習
Storm特性
工程師必備第一工具 - Git
Ad

Similar to Hadoop程式開發環境 (20)

PDF
初探Maven 3
PDF
Mac osx 安裝apache cordova教學
PPT
OSGi Small Lab
PPTX
Maven初级培训
PDF
打開窗,讓大象跨進來 - Microsoft HDInsight
PPT
Wordpress使用心得
PPTX
项目开发实践No.1
PDF
Maven私服安装,Maven使用教程
PPTX
Docker tutorial
PPT
Maven初级培训
PDF
用Maven管理專案的依賴關係
PPTX
轻松写出优雅的Java代码之check style
PDF
2012 java two-desktop-appliction-using-j-ruby-with-swt
 
PPTX
Sencha touch 2 訓練課程 1 建置專案環境
PPT
Java2新觀念教本投影片ch1
PPTX
基于Ivy ant的java构建初探
PDF
Maven in eclipse practices
PPTX
Maven技术分享
PDF
Ruby on Rails 開發環境建置 for Ubuntu
PDF
人工智慧01_安裝機器學習開發環境
初探Maven 3
Mac osx 安裝apache cordova教學
OSGi Small Lab
Maven初级培训
打開窗,讓大象跨進來 - Microsoft HDInsight
Wordpress使用心得
项目开发实践No.1
Maven私服安装,Maven使用教程
Docker tutorial
Maven初级培训
用Maven管理專案的依賴關係
轻松写出优雅的Java代码之check style
2012 java two-desktop-appliction-using-j-ruby-with-swt
 
Sencha touch 2 訓練課程 1 建置專案環境
Java2新觀念教本投影片ch1
基于Ivy ant的java构建初探
Maven in eclipse practices
Maven技术分享
Ruby on Rails 開發環境建置 for Ubuntu
人工智慧01_安裝機器學習開發環境

Hadoop程式開發環境