Submit Search
世界一簡単なHadoopの話
2 likes
776 views
Koichi Shimazaki
Hadoop
Technology
Read more
1 of 10
Download now
Download to read offline
1
2
3
4
5
6
7
8
9
10
More Related Content
PDF
Hadoop 基礎
hideaki honda
PDF
Hadoopの概念と基本的知識
Ken SASAKI
PPT
はやわかりHadoop
Shinpei Ohtani
PDF
Hadoopことはじめ
均 津田
PDF
基幹業務もHadoopで!! -ローソンにおける店舗発注業務へのHadoop + Hive導入と その取り組みについて-
Keigo Suda
PPT
Hadoop loves H2
Tadashi Satoh
PDF
Hadoopデータプラットフォーム #cwt2013
Cloudera Japan
PPTX
SASとHadoopとの連携
SAS Institute Japan
Hadoop 基礎
hideaki honda
Hadoopの概念と基本的知識
Ken SASAKI
はやわかりHadoop
Shinpei Ohtani
Hadoopことはじめ
均 津田
基幹業務もHadoopで!! -ローソンにおける店舗発注業務へのHadoop + Hive導入と その取り組みについて-
Keigo Suda
Hadoop loves H2
Tadashi Satoh
Hadoopデータプラットフォーム #cwt2013
Cloudera Japan
SASとHadoopとの連携
SAS Institute Japan
What's hot
(19)
PDF
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
NTT DATA OSS Professional Services
PPTX
Hadoop / Elastic MapReduceつまみ食い
Ryuji Tamagawa
PDF
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
hamaken
PDF
HadoopとRDBMSをシームレスに連携させるSmart SQL Processing (Hadoop Conference Japan 2014)
Hadoop / Spark Conference Japan
PPTX
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
maruyama097
ODP
Hadoop for programmer
Sho Shimauchi
PPT
Amazon Redshift ベンチマーク Hadoop + Hiveと比較
FlyData Inc.
PDF
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
hamaken
PPTX
今さら聞けないHadoop セントラルソフト株式会社(20120119)
Toru Takizawa
PDF
Hadoop Conference Japan 2013 Winter オープニングスライド
hamaken
PDF
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTT DATA OSS Professional Services
PDF
Hadoopによる大規模分散データ処理
Yoji Kiyota
PDF
Hadoop入門
Preferred Networks
PDF
FluentdやNorikraを使った データ集約基盤への取り組み紹介
Recruit Technologies
PDF
実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...
MapR Technologies Japan
PDF
Hadoop概要説明
Satoshi Noto
PDF
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Hadoop / Spark Conference Japan
PDF
Hadoop ecosystem NTTDATA osc15tk
NTT DATA OSS Professional Services
PDF
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
NTT DATA OSS Professional Services
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
NTT DATA OSS Professional Services
Hadoop / Elastic MapReduceつまみ食い
Ryuji Tamagawa
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
hamaken
HadoopとRDBMSをシームレスに連携させるSmart SQL Processing (Hadoop Conference Japan 2014)
Hadoop / Spark Conference Japan
大規模分散システムの現在 -- GFS, MapReduce, BigTableはどう変化したか?
maruyama097
Hadoop for programmer
Sho Shimauchi
Amazon Redshift ベンチマーク Hadoop + Hiveと比較
FlyData Inc.
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
hamaken
今さら聞けないHadoop セントラルソフト株式会社(20120119)
Toru Takizawa
Hadoop Conference Japan 2013 Winter オープニングスライド
hamaken
NTTデータ流 Hadoop活用のすすめ ~インフラ構築・運用の勘所~
NTT DATA OSS Professional Services
Hadoopによる大規模分散データ処理
Yoji Kiyota
Hadoop入門
Preferred Networks
FluentdやNorikraを使った データ集約基盤への取り組み紹介
Recruit Technologies
実践機械学習 — MahoutとSolrを活用したレコメンデーションにおけるイノベーション - 2014/07/08 Hadoop Conference ...
MapR Technologies Japan
Hadoop概要説明
Satoshi Noto
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
Hadoop / Spark Conference Japan
Hadoop ecosystem NTTDATA osc15tk
NTT DATA OSS Professional Services
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
NTT DATA OSS Professional Services
Ad
Similar to 世界一簡単なHadoopの話
(20)
PDF
Data-Intensive Text Processing with MapReduce(Ch1,Ch2)
Sho Shimauchi
PPT
Hadoopの紹介
bigt23
PDF
MapReduce 初心者が Hadoop をさわってみた。もちろん C++ から。
You&I
PPT
Hadoop ~Yahoo! JAPANの活用について~
Yahoo!デベロッパーネットワーク
PDF
Hadoop / MapReduce とは
Takeshi Matsuoka
PPT
Hadoop~Yahoo! JAPANの活用について~
Yahoo!デベロッパーネットワーク
PDF
ただいまHadoop勉強中
Satoshi Noto
PDF
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
NTT DATA OSS Professional Services
PPTX
Tuning maniax 2014 Hadoop編
ThinkIT_impress
PPT
Hadoop~Yahoo!Japanの活用について
kaminashi
PDF
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
Akira Shimosako
PPT
Googleの基盤クローン Hadoopについて
Kazuki Ohta
PDF
Apache Hadoop & Hive 入門 (マーケティングデータ分析基盤技術勉強会)
Takeshi Mikami
PDF
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
NTT DATA OSS Professional Services
PDF
Hadoop_startup
Yusuke Shimizu
PPTX
Hadoop
Atsushi Shimura
PPTX
A 2-3ゾウ使いへの第一歩 hadoop on azure 編
GoAzure
PPTX
ゾウ使いへの第一歩
Fumito Ito
PDF
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
DataWorks Summit/Hadoop Summit
PDF
第1回Hadoop関西勉強会参加レポート
You&I
Data-Intensive Text Processing with MapReduce(Ch1,Ch2)
Sho Shimauchi
Hadoopの紹介
bigt23
MapReduce 初心者が Hadoop をさわってみた。もちろん C++ から。
You&I
Hadoop ~Yahoo! JAPANの活用について~
Yahoo!デベロッパーネットワーク
Hadoop / MapReduce とは
Takeshi Matsuoka
Hadoop~Yahoo! JAPANの活用について~
Yahoo!デベロッパーネットワーク
ただいまHadoop勉強中
Satoshi Noto
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
NTT DATA OSS Professional Services
Tuning maniax 2014 Hadoop編
ThinkIT_impress
Hadoop~Yahoo!Japanの活用について
kaminashi
IBM版Hadoop - BigInsights/Big SQL (2013/07/26 CLUB DB2発表資料)
Akira Shimosako
Googleの基盤クローン Hadoopについて
Kazuki Ohta
Apache Hadoop & Hive 入門 (マーケティングデータ分析基盤技術勉強会)
Takeshi Mikami
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
NTT DATA OSS Professional Services
Hadoop_startup
Yusuke Shimizu
Hadoop
Atsushi Shimura
A 2-3ゾウ使いへの第一歩 hadoop on azure 編
GoAzure
ゾウ使いへの第一歩
Fumito Ito
Introduction to Hadoop and Spark (before joining the other talk) and An Overv...
DataWorks Summit/Hadoop Summit
第1回Hadoop関西勉強会参加レポート
You&I
Ad
世界一簡単なHadoopの話
1.
世界⼀簡単なHadoopの話 株式会社イオシス http://io-sys.co.jp/ 島崎浩一
2.
つーかHadoopって何なの? • 一言で・・・言えない! • Hadoopには大きく分けてHDFSという 分散ファイルシステムという役割と、 MapReduceという処理エンジンがある •
HDFSは完全にインフラ的な話 • MapReduceは完全にアプリ的な話 更に・・・
3.
つーかHadoopって何なの? 使いこなす為に統計学的な知識や 高度な処理要件が必要になる! 要件定義に、単に業務に詳しいだけ ではなくデータサイエンティストが必要
4.
つーかHadoopって何なの? よって、構築に際し インフラに詳しくて、Javaとかにも詳しくて、 アプリ開発経験があって、統計分析も出来て、 業務にも詳しい人が必要になる
5.
つーかHadoopって何なの? よって、構築に際し インフラに詳しくて、Javaとかにも詳しくて、 アプリ開発経験があって、統計分析も出来て、 業務にも詳しい人が必要になる んな奴いるか!(俺以外に!嘘ゴメン) これがHadoopやビッグデータの大変さ
6.
HDFS つーことで、一つ一つざっくりと説明してみる HDFS(分散ファイルシステム)は RAID5 RAID5は一つのPCの中でHDDを複数使う という仕組みだが、 HDFSは一つのHDFSの中で複数のPCを使う という感じなだけ。 役割も大体一緒
7.
MapReduce 処理の方式。Javaで実装するフレームワーク。 Mapという分類処理と、 ReduceというMapの結果に対する整理処理 合わせてMapReduceという集計処理 なだけ。
8.
MapReduce 例えばリアルで行われてる、大量のデータを集 計して計算して順番並べてといえば… そう、選挙の開票作業がまさにそれ!
9.
MapReduce Map処理 データを集めて名前ごとに分類 Reduce処理 Mapである程度たばになったモノを ちゃんと整理して順番にならべたり
10.
まとめると まぁ大体こんな感じ。 全員がそれぞれ全部解ってないとダメなわけ じゃないけど、ある程度解っててくれないと話 にならない。 おまけにインフラにかかる費用も凄い(導入 はAWS前提かなぁ)。 という感じなので、システム屋としては いろいろ大変なのでした。
Download