Submit Search
Gis tools for hadoopを用いたビッグデータ処理の検証
Download as PPTX, PDF
3 likes
6,346 views
Kazutaka ishizaki
2013年11月2日 FOSS4G 2013 Tokyo の発表スライドです。
Lifestyle
Read more
1 of 33
Download now
Downloaded 34 times
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
More Related Content
PPTX
Hadoopによる空間ビッグデータ処理の試み
Kazutaka ishizaki
PPTX
気象予報データ(数値予報GPV)を用いたデータビジュアライゼーション
Kazuhide Okamura
PDF
夏サミ2013 Hadoopを使わない独自の分散処理環境の構築とその運用
Developers Summit
ODP
Python geohash 紹介
Hiroaki Kawai
PDF
Hadoop - OSC2013 .Enterprise
Shinichi YAMASHITA
PPTX
Hadoopことはじめ
Katsunori Kanda
PDF
Hadoop Conference Japan 2013 Winter オープニングスライド
hamaken
PDF
What makes Apache Spark?
Hadoop / Spark Conference Japan
Hadoopによる空間ビッグデータ処理の試み
Kazutaka ishizaki
気象予報データ(数値予報GPV)を用いたデータビジュアライゼーション
Kazuhide Okamura
夏サミ2013 Hadoopを使わない独自の分散処理環境の構築とその運用
Developers Summit
Python geohash 紹介
Hiroaki Kawai
Hadoop - OSC2013 .Enterprise
Shinichi YAMASHITA
Hadoopことはじめ
Katsunori Kanda
Hadoop Conference Japan 2013 Winter オープニングスライド
hamaken
What makes Apache Spark?
Hadoop / Spark Conference Japan
What's hot
(10)
PDF
Hadoopの標準GUI HUEの最新情報
Cloudera Japan
PPTX
MapReduceを使った並列化 20111212
marony
PDF
Apache Hadoop & Hive 入門 (マーケティングデータ分析基盤技術勉強会)
Takeshi Mikami
PDF
[Azure Deep Dive] Spark と Azure HDInsight によるビッグ データ分析入門 (2017/03/27)
Naoki (Neo) SATO
PDF
QConTokyo2015「Sparkを用いたビッグデータ解析 〜後編〜」
Kazuki Taniguchi
PDF
Hadoop 基礎
hideaki honda
PPT
Hadoop loves H2
Tadashi Satoh
PDF
Spark Summit 2015 参加報告
Katsunori Kanda
PDF
Hadoopデータプラットフォーム #cwt2013
Cloudera Japan
PPTX
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
maruyama097
Hadoopの標準GUI HUEの最新情報
Cloudera Japan
MapReduceを使った並列化 20111212
marony
Apache Hadoop & Hive 入門 (マーケティングデータ分析基盤技術勉強会)
Takeshi Mikami
[Azure Deep Dive] Spark と Azure HDInsight によるビッグ データ分析入門 (2017/03/27)
Naoki (Neo) SATO
QConTokyo2015「Sparkを用いたビッグデータ解析 〜後編〜」
Kazuki Taniguchi
Hadoop 基礎
hideaki honda
Hadoop loves H2
Tadashi Satoh
Spark Summit 2015 参加報告
Katsunori Kanda
Hadoopデータプラットフォーム #cwt2013
Cloudera Japan
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
maruyama097
Ad
Viewers also liked
(6)
PPTX
サーバ構築・デプロイが簡単に!Elastic beanstalk
Hirokazu Ouchi
PPTX
Spark Streamingを使ってみた ~Twitterリアルタイムトレンドランキング~
sugiyama koki
PDF
最近のストリーム処理事情振り返り
Sotaro Kimura
PDF
Hive on Spark を活用した高速データ分析 - Hadoop / Spark Conference Japan 2016
Nagato Kasaki
PDF
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
NTT DATA OSS Professional Services
PDF
ビッグデータ処理データベースの全体像と使い分け
Recruit Technologies
サーバ構築・デプロイが簡単に!Elastic beanstalk
Hirokazu Ouchi
Spark Streamingを使ってみた ~Twitterリアルタイムトレンドランキング~
sugiyama koki
最近のストリーム処理事情振り返り
Sotaro Kimura
Hive on Spark を活用した高速データ分析 - Hadoop / Spark Conference Japan 2016
Nagato Kasaki
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
NTT DATA OSS Professional Services
ビッグデータ処理データベースの全体像と使い分け
Recruit Technologies
Ad
Similar to Gis tools for hadoopを用いたビッグデータ処理の検証
(20)
PDF
OSC2014 Tokyo/Spring Hadoop
Shinichi YAMASHITA
PDF
2014-07-26 Exploration into HDInsight Tuning Maniax 2014 Hadoopコース参戦記
Yoshiyuki Nakamura
PDF
[Japanese Content] Lance Riedel_The App Server, The Hive in Tokyo_Aug29
The Hive
PDF
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Yahoo!デベロッパーネットワーク
PPTX
大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...
NTT DATA Technology & Innovation
PPTX
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
AdvancedTechNight
PDF
ビッグデータ活用とサーバー基盤
日本ヒューレット・パッカード株式会社
PDF
Datadog monitoring with HashiCorp stack
Masatomo Ito
PDF
Datadog monitoring with HashiCorp
Masatomo Ito
PDF
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
The Japan DataScientist Society
PDF
情報爆発シンポジウム infoplosion
Rakuten Group, Inc.
PDF
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
YusukeKuramata
PDF
Java Clientで入門する Apache Kafka #jjug_ccc #ccc_e2
Yahoo!デベロッパーネットワーク
PDF
第1回Hadoop関西勉強会参加レポート
You&I
PDF
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情
Hideo Takagi
PDF
BIG DATA サービス と ツール
Ngoc Dao
PDF
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
Developers Summit
PDF
Databricks の始め方
Ryoma Nagata
PDF
Hadoopの概念と基本的知識
Ken SASAKI
PDF
Data Scientist Workbench - dots0729
s. kaijima
OSC2014 Tokyo/Spring Hadoop
Shinichi YAMASHITA
2014-07-26 Exploration into HDInsight Tuning Maniax 2014 Hadoopコース参戦記
Yoshiyuki Nakamura
[Japanese Content] Lance Riedel_The App Server, The Hive in Tokyo_Aug29
The Hive
Apache Big Data Miami 2017 - Hadoop Source Code Reading #23 #hadoopreading
Yahoo!デベロッパーネットワーク
大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...
NTT DATA Technology & Innovation
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
AdvancedTechNight
ビッグデータ活用とサーバー基盤
日本ヒューレット・パッカード株式会社
Datadog monitoring with HashiCorp stack
Masatomo Ito
Datadog monitoring with HashiCorp
Masatomo Ito
データ分析に必要なスキルをつけるためのツール~Jupyter notebook、r連携、機械学習からsparkまで~
The Japan DataScientist Society
情報爆発シンポジウム infoplosion
Rakuten Group, Inc.
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
YusukeKuramata
Java Clientで入門する Apache Kafka #jjug_ccc #ccc_e2
Yahoo!デベロッパーネットワーク
第1回Hadoop関西勉強会参加レポート
You&I
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情
Hideo Takagi
BIG DATA サービス と ツール
Ngoc Dao
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
Developers Summit
Databricks の始め方
Ryoma Nagata
Hadoopの概念と基本的知識
Ken SASAKI
Data Scientist Workbench - dots0729
s. kaijima
More from Kazutaka ishizaki
(14)
PDF
地理院タイルを利用した3次元による地図表示について
Kazutaka ishizaki
PDF
GISを使ってみよう 2019
Kazutaka ishizaki
PPTX
地理院タイルを利用した ハザードマップの紹介
Kazutaka ishizaki
PPTX
FOSS4Gを利用して 小学生の自由研究してみた件
Kazutaka ishizaki
PPTX
QGISの活用例を見てみよう
Kazutaka ishizaki
PDF
地理院地図を利用した観光情報の提供
Kazutaka ishizaki
PPTX
PythonとQGISで簡単処理
Kazutaka ishizaki
PPTX
オープンデータから消防水利図を作成してみた
Kazutaka ishizaki
PPTX
リアルタイム位置情報と地理院タイルの各ソフトウェアへの表示
Kazutaka ishizaki
PPTX
Cesiumを動かしてみよう FOSS4G 2016 Tokyo版
Kazutaka ishizaki
PPTX
FOSS4G と北海道地図
Kazutaka ishizaki
PPTX
Cesiumを動かしてみよう
Kazutaka ishizaki
PPTX
超初心者向けハンズオン講座 「ゼロから始めるQGIS」
Kazutaka ishizaki
PPTX
超初心者向けハンズオン講座 「ゼロから始めるQGIS」 準備手順書
Kazutaka ishizaki
地理院タイルを利用した3次元による地図表示について
Kazutaka ishizaki
GISを使ってみよう 2019
Kazutaka ishizaki
地理院タイルを利用した ハザードマップの紹介
Kazutaka ishizaki
FOSS4Gを利用して 小学生の自由研究してみた件
Kazutaka ishizaki
QGISの活用例を見てみよう
Kazutaka ishizaki
地理院地図を利用した観光情報の提供
Kazutaka ishizaki
PythonとQGISで簡単処理
Kazutaka ishizaki
オープンデータから消防水利図を作成してみた
Kazutaka ishizaki
リアルタイム位置情報と地理院タイルの各ソフトウェアへの表示
Kazutaka ishizaki
Cesiumを動かしてみよう FOSS4G 2016 Tokyo版
Kazutaka ishizaki
FOSS4G と北海道地図
Kazutaka ishizaki
Cesiumを動かしてみよう
Kazutaka ishizaki
超初心者向けハンズオン講座 「ゼロから始めるQGIS」
Kazutaka ishizaki
超初心者向けハンズオン講座 「ゼロから始めるQGIS」 準備手順書
Kazutaka ishizaki
Gis tools for hadoopを用いたビッグデータ処理の検証
1.
GIS Tools for
Hadoopを用いた ビッグデータ処理の検証 石崎 一隆 2013年11月2日
2.
発表の経緯 • Esriジャパン社のGISコミュニティフォーラムの 「ビッグデータ活用ソリューションセッション」 に興味を持つ • 紹介されたGIS
Tools for Hadoopを試す • 試したので紹介 2
3.
発表の流れ • • • • Hadoop GIS Tools for
Hadoop GIS Tools for Hadoop と ArcGIS 比較 まとめ 3
4.
Hadoop について 4
5.
ビッグデータとは 通話情報 自動車のGPS情報 SNS 株価情報 SNSにホストされる写真情報 5
6.
ビッグデータの処理 • 注目されている技術は 6
7.
Hadoop とは • ビックデータを複数のサーバを利用して 分散処理するソフトウェア •
サーバ台数を増やしスケールアウト可能 • ライセンスはApache License, Version 2.0 • Open Source 7
8.
Hadoopを利用するには 1 Apache Hadoopプロジェクトから利用 •
Apache Hadoop http://hadoop.apache.org/ 8
9.
Hadoopを利用するには 2 ディストリビューションから利用 • Cloudera
CHD Clouders’s Distribution including Apache Hadoop http://www.cloudera.com/hadoop/ • Hortonworks HDP Hortonworks Data Platform http://hortonworks.com ※ エディションにより有償 9
10.
Hadoopを利用するには 3 クラウドサービス提供のHadoopから利用 • Amazon
Elastic MapReduce Amazon Elastic Compute Cloud(Amazon EC2)、 Amazon Simple Storage Service(Amazon S3)上で Hadoopが稼動 ※ サービスを利用するので有償 10
11.
Hadoopに必要な環境 4台のサーバのクラスタ 例 各サーバに必要 ・CentOS、RHEL等 ・Oracle JDK ・SSHの設定 タスク管理 ・DataNode ・ TaskTracker ・DataNode ・ TaskTracker ・NameNode ・SecandaryNameNode ・JobTracker ・DataNode ・TaskTracker 11
12.
Hadoopの役割 HDFS タスク実行 分散ファイルシステム mapReduce タスクの実 行 データ処理のプログ ラミングモデル タスク管理 ・DataNode ・TaskTracker タスク実 行 ・DataNode ・TaskTracker ・NameNode ・SecandaryNameNode ・JobTracker ・DataNode ・TaskTracker 12
13.
データフロー mapが処理 mapが処理 入力データ HDFSに配置 reduceが 処理 計算結果 mapが処理 Javaを利用して map関数作成 Javaを利用して reduce関数作成 13
14.
GIS Tools for
Hadoop について 14
15.
GIS Tools for
Hadoop とは • Esri社が開発したツール ※Esri社のサポート対象外です • • • • Hadoopを利用して空間分析が可能 ArcGISとHadoopの連係が可能 ライセンスはApache License, Version 2.0 Open Source 15
16.
GIS Tools for
Hadoop の構成 • Esri Geometry API for Java Hadoopを利用した空間解析API • Spatial Framework for Hadoop Esri Json等のAPI Hiveから利用可能 • GeoProcessing Tools for Hadoop ArcGIS DesktopとHadoop間の相互交換 16
17.
GIS Tools for
Hadoopドキュメント類 • Esri Geometry API for Java APIドキュメント http://esri.github.io/geometry-api-java/javadoc/ • Spatial Framework for Hadoop APIドキュメント http://esri.github.io/spatial-framework-for-hadoop/json/ • Spatial Framework for Hadoop UDFドキュメント https://github.com/Esri/spatial-framework-for-hadoop/wiki/UDF-Documentation 17
18.
Esri Geometry API
for Java API APIの例 • contains フィーチャ1がフィーチャ2に含まれるか • Crosses フィーチャ1がフィーチャ2に交差しているか • Buffer フィーチャに指定距離のバッファ作成 18
19.
Spatial Framework for
Hadoop UDFの例 • ST_Polygon 座標からポリゴン作成 • ST_Length 長さ計算 • ST_Intersects 重なる図形の重なりを計算 19
20.
ダウンロード先 • Esri Geometry
API for Java https://github.com/esri/geometry-api-java • Spatial Framework for Hadoop https://github.com/Esri/spatial-framework-for-hadoop • GeoProcessing Tools for Hadoop https://github.com/Esri/geoprocessing-tools-for-hadoop • サンプル https://github.com/Esri/gis-tools-for-hadoop 20
21.
必要なパッケージ • Hadoop • Hive HDFSのデータをSQLライク構文で扱う •
Oozie Hadoopのジョブの実行、スケジュール 21
22.
ArcGISから実行 GeoProcessing Tools for
Hadoop ArcGISのToolBoxに追加 モデルを作成 Javaでプログラム作成 又は HiveでSQL作成 Oozieのworkflow.xml作成 実行 22
23.
Javaのプログラム構成 • MapReduceのジョブを実行するコード Esri JSON、入力データのパス、MapReduce
の処理結果の パスの処理 • Mapクラス 入力データの処理を行う GIS Tools for Hadoopは主にMapクラスに記述 • Reduceクラス mapクラスの結果を処理し出力 23
24.
GIS Tools for
Hadoop と ArcGIS 比較 について 24
25.
GIS Tools for
Hadoop、ArcGIS 比較 GIS Tools for Hadoop の構成 Windows7 Ultimate x64 Xeon 2.40GHz メモリ 8GB ArcGIS 10.1 for Desktop Basic CentOS5.6 x64 CentOS5.6 x64 Xeon 2.40GHz メモリ 16GB Oracle JDK Java Ver 1.7.0_25 Oracle JDK Java Ver 1.7.0_25 ArcGISの構成 Windows7 Ultimate x64 Xeon 2.40GHz メモリ 8GB 25 ArcGIS 10.1 for Desktop Basic
26.
比較条件 6,779ポリゴンの市町村界 (島含む) 272,693 位置参照情報の街区 レベル情報 市町村界に含まれる街区ポイントの合計値を計算しポリゴンに付与 ※前処理 ・ ArcGISは位置参照情報をポイントフィーチャへ変換 ・
Hadoopは位置参照情報の文字コードをEUCへ変換し、 HDFSへ移動 26
27.
ArcGISの検証 6,779ポリゴンの市町村界 (島含む) 属性の結合とリレート → 結合 27
28.
GIS Tools for
Hadoopの検証 6,779ポリゴン → ESRI JSON ESRI JSON → HDFS HDFS → ESRI JSON 6,779ポリゴンの市町村界に 272,693ポイントの位置参照情報の街区レベル情報 が含まれるか処理 ESRI JOSN → GeoDatabase テーブル 6,779ポリゴンの市町村界 に合計値を付与 28
29.
検証結果 ArcGIS GIS Tools for
Hadoop 変換時間 結果不一致数 GIS Tools for Hadoop 2分28秒 7 / 188市区町村 ArcGIS 7分41秒 ※ ArcGISの処理は面積の大きい ポリゴンに合計値を付与 29
30.
まとめ 30
31.
まとめ GIS Tools for
Hadoopを利用する事で • ArcGISで作成していた処理を移行 • 今まで時間を要していたタスクを分散処理 • 変換時間の短縮 31
32.
最後に GIS Tools for
Hadoopの各ツールは Esri、Esri ジャパン社のサポート対象外です。 32
33.
ご清聴ありがとうございます 33
Download