SlideShare a Scribd company logo
国際シンポジウム
 国際シンポジウム
 情報爆発を えて」
「情報爆発を越えて」
 クラウドとHPCIによる
 クラウドとHPCIによる
   たなイノベーション
 新たなイノベーション
ビジネスでの状況と
    での状況
ビジネスでの状況と方向性

Rakuten Inc. Masaya Mori Jan. 16th, 2012
Introduction
•            まさや)
    森 正弥 (もり まさや)
•   楽天株式会社 執行役員

•   楽天技術研究所 所長
•   アーキテクチャ関連部署 部署長              Masaya Mori
    –   クラウド関連
                               Twitter: @emasha
    –   検索・データ解析基盤




                                                  2
クラウドは本格的な普及状態に
         クラウドは本格的な普及状態に突入

•“全米の約70%の企業が何らかの形でクラウドを利用” The Economist
   全米の 70%の企業が らかの形 クラウドを利用
   全米
• “パブリッククラウドは反動期、プライベートクラウドは流行期 Gartner
   パブリッククラウドは反動期、プライベートクラウドは流行期”


                            ガートナーの
                            ガートナーのハイプサイクル




• E-Commerce においては、普及のスピードが最も速い
               においては、普及のスピードが
    •Netflix の全面移行、Amazon の全面移行
     Netflix 全面移行、
• 東日本大震災以降、BCP対策としての導入例(ケンコーコム)も増加
  東日本大震災以降、BCP対策としての導入例 ケンコーコム)
                    対策としての導入例(              3
「今のクラウド」のキーワード
         クラウド」



              •パブリックとプライベート
ハイブリッド設計
              •オンプレミスとの連携


              •CloudStack、OpenStack、
コモディティ化
              •Eucalyptus、CloudFoundry


              •Hadoop、NoSQLの台頭
ビッグデータ        •実空間情報の統合



                                         4
「今のクラウド」のキーワード
              クラウド」


                    •パブリックとプライベート
 ハイブリッド設計
                    •オンプレミスとの連携


•パブリックとプライベートの連携
 パブリックとプライベートの
 パブリック
 •パブリックを使う、いや、使わない、という二項対立ではない
  パブリックを
  パブリック    いや、 わない、という二項対立ではない
                      二項対立
 •IT基盤戦略のポートフォリオをどう作るか
  IT基盤戦略
  IT基盤戦略のポートフォリオをどう
                をどう作

 •情報系・参照系・2.0系のパプリック vs. 基幹系のプライベート
  情報系・参照系・2.0系
  情報系                    基幹系の
 •繁忙期、ピーク期におけるトランザクションの爆発に対応
  繁忙期、
  繁忙期 ピーク期におけるトランザクション 爆発に
                トランザクションの
 •海外展開での連携 (ネットワークのレイテンシ、各種法令対応)
  海外展開での
  海外展開での連携 ネットワークのレイテンシ、各種法令対応)



• 全体戦略としては、IT基盤全体設計ができるアーキテクト人材の確保
  全体戦略としては IT基盤全体設計ができるアーキテクト人材の
      としては、 基盤全体設計ができるアーキテクト人材
                                      5
「今のクラウド」のキーワード
              クラウド」


                     •CloudStack、OpenStack、
  コモディティ化
                     •Eucalyptus、CloudFoundry


•プライベート基盤構築のコモディティ化
 プライベート基盤構築のコモディティ化
 プライベート基盤構築
 •各種オープンソース化しており、技術のコモディティ化が進行
  各種オープンソース化しており、技術のコモディティ化
  各種オープンソース
 •利用するクラウドから、自分たちでも作るクラウドが本格化
  利用するクラウドから
  利用するクラウドから、自分たちでも
               たちでも作 クラウドが

 •CloudStack のオープンソース化
  CloudStack オープンソース化
 •OpenStack の継続的リリース、コミュニティの拡大
  OpenStack 継続的リリース コミュニティの
                  リリース、
 •老舗 Eucalyptus もメジャーバージョン3に
  老舗             メジャーバージョン3
 •PaaS基盤 CloudFoundry の登場
  PaaS基盤
  PaaS

• 選択と集中の加速
  選択と集中の
• パブリックと役割分担した開発生産性を意識した基盤が構築可能に
  パブリックと役割分担した開発生産性を意識した基盤が構築可能に
            した開発生産性   した基盤
                                                6
「今のクラウド」のキーワード
               クラウド」


                       •CloudStack、OpenStack、
  コモディティ化
                       •Eucalyptus、CloudFoundry


•プライベート基盤構築のコモディティ化
 プライベート基盤構築のコモディティ化
 プライベート基盤構築
 •“Open Compute Project Facebook
   Open         Project”
 •インフラをスケールさせるハードウェアの設計や仕様の公開
  インフラを
  インフラ スケールさせるハードウェアの設計や仕様の
                 させるハードウェア
 •不要な機能や部品を排し、高い効率性と妥当なコストの実現
  不要な
  不要 機能や部品を                 効率性と妥当なコストの




• 大規模なクラウド基盤の知識も共有が進む
  大規模なクラウド基盤の知識も共有が
          基盤
                                                  7
「今のクラウド」のキーワード
                     クラウド」


                          •Hadoop,NoSQLの台頭
   ビッグデータ
                          •実空間情報の統合

•そもそもの情報の活用例
 そもそもの情報の
 そもそもの情報
 •Last.fm
  Last.fm
 •230カ国以上に3000万人以上のユーザ
  230カ国以上に3000万人以上の
  230         万人以上
 •膨大なユーザの嗜好を分析,個々人にあった音楽を推薦・提供.
  膨大な
  膨大 ユーザの嗜好を分析,      にあった音楽 推薦・提供.
                         音楽を
 •毎日1000万回以上の視聴情報を解析
  毎日1000万回以上の
  毎日1000万回以上 視聴情報を
 •Pandora Radio
  Pandora
 •ユーザデータに加え,曲の旋律,歌詞,声質,楽器,拍子,コード進
  ユーザデータに
  ユーザデータ      旋律,歌詞,声質,楽器,拍子,コード進
 行等を かく解析
 行等を細かく解析
 •ユーザの評価を組み合わせ,よりよい曲を提供
  ユーザの
  ユーザ 評価を    わせ,よりよい曲
  1億人以上のユーザを   成長を
 •1億人以上のユーザを持ち,成長を続ける

• 情報解析のビジネス価値の発見
  情報解析のビジネス価値
           価値の
                                             8
「今のクラウド」のキーワード
             クラウド」


                  •Hadoop,NoSQLの台頭
   ビッグデータ
                  •実空間情報の統合

•スーパーDB、レコメンド、パーソナライズ
 スーパーDB、レコメンド、
 スーパーDB
 •データマイニング、NLP、統計による価値の創出
  データマイニング、NLP、統計による価値の
  データマイニング       による価値




• 情報解析のビジネス価値の発見、情報解析の重要性
  情報解析のビジネス価値 発見、情報解析の
           価値の
                                     9
「今のクラウド」のキーワード
              クラウド」


                    •Hadoop,NoSQLの台頭
   ビッグデータ
                    •実空間情報の統合


•情報爆発
 情報爆発
 •インターネット接続回線合計トラフィック 11Gbps以上
  インターネット接続回線合計トラフィック 11Gbps以上
  インターネット接続回線合計
 •PV 1億、年間流通総額 1兆円 (グループ2.3兆円)
  PV 1億             グループ2.3兆円)
                         2.3兆円
 •ユーザー数 8000万、商品数 8800万、レビュー 7000万
  ユーザー数
  ユーザー 8000万      8800万      7000万
 •一日数百GB以上のトランザクション、アクセスログ、検索ログ
  一日数百GB以上の
  一日数百GB以上 トランザクション、アクセスログ、検索ログ




• 情報解析基盤の大規模化
  情報解析基盤の
• 大規模システムの構築・運用技術は必須
  大規模システム 構築・運用技術は
     システムの
                                       10
「今のクラウド」のキーワード
              クラウド」


                     •Hadoop,NoSQLの台頭
   ビッグデータ
                     •実空間情報の統合

•大規模基盤の活用・構築
 大規模基盤の活用・
 大規模基盤
 •クラウドの普及、技術のコモディティ化を踏まえ
  クラウドの普及、技術のコモディティ化
  クラウド
 •パブリッククラウドの活用、プライベートの構築
  パブリッククラウドの
  パブリッククラウド 活用、プライベートの
 •Hadoopクラスターの構築、NoSQLの活用・構築
  Hadoopクラスター
  Hadoopクラスターの構築、NoSQLの活用・




• レコメンド、ターゲティング広告、検索改善、ログ解析での活用
  レコメンド、ターゲティング広告 検索改善、ログ解析での活用
               広告、       解析での
• OSSの活用、貢献、開発が進む
  OSSの活用、貢献、開発が
                                        11
楽天プロダクトランキング
                   楽天プロダクトランキング
■処理内容
・ランキングデータ集計        サーチエンジン         購買履歴           製品マスタDB
                                                  製品マスタDB
                                                    マスタ
・製品ページ用データ生成

■データ量
  データ量            検索ワード    価格    売上件数   売上高      製品名    製品コード
・1日/1億レコード
・1日/300GB          レビュー   商品件数   売上率    購買時間帯    スペック    発売日


■M/R 処理時間
・1時間半

■ノード数
  ノード数
・70台




 RAN         Calculate
 DB

                                              Rakuten Product
                                                                12
検索での関連語提示や辞書構築での活用
                検索での関連語提示や辞書構築での活用
                  での関連語提示     での


クラスターから検索解析用のHiveにつなげ
関連語の提示や辞書構築等での活用



月 250GBのデータを解析

                                                    suggest batch
                                                    server
                                                                                      Suggest
                                                                                       Index


                                        sync analyzed                  update search index
                                        data
    Shared Hadoop
       Cluster          NGS Hive                        dictionary batch          検索エンジン
                                                        Server
                    NGS common
                                                                                      Dictionary
                    platform for hive                                                   Index

                                                                           update search index
                                                                                                   13
「今のクラウド」のキーワード
                クラウド」


                         •Hadoop,NoSQLの台頭
   ビッグデータ
                         •実空間情報の統合

•実空間情報の統合
 実空間情報の
 実空間情報
 •スマートフォンの普及、Online To Offline サービスの胎動
  スマートフォンの普及、
  スマートフォン                              サービスの
 •Shopkick, ShopSavvy, CheckPoints、Milo
  Shopkick,            CheckPoints、
 •トヨタの自動車クラウド
  トヨタの
  トヨタ 自動車クラウド
 •位置情報,走行距離・状態、使用傾向の収集・解析
  位置情報,
  位置情報 走行距離・状態、使用傾向の収集・
 •ナビでリアルタイム情報推薦,適した自動車ローン商品の開発
  ナビで
  ナビ リアルタイム情報推薦    情報推薦, した自動車ローン商品自動車ローン商品の




• 実空間情報の統合による、更なる情報爆発・ビッグデータ
  実空間情報の統合による
          による、 なる情報爆発
                 情報爆発・
• 次世代の情報解析基盤・情報ネットワークの整備が急務に
  次世代の情報解析基盤・情報ネットワーク 整備が急務に
               ネットワークの                         14
「今のクラウド」のキーワード
             クラウド」



                  •パブリックとプライベート
 ハイブリッド設計
                  •オンプレミスとの連携


                  •CloudStack、OpenStack、
  コモディティ化
                  •Eucalyptus、CloudFoundry


                  •Hadoop、NoSQLの台頭
   ビッグデータ         •実空間情報の統合

• クラウドはビジネスに着実に浸透、高度な全体設計が要求される
  クラウドはビジネスに着実に浸透、高度な全体設計が要求される
• ビッグデータ活用の価値増大と基盤構築、更なる情報爆発への対応
  ビッグデータ活用 価値増大と基盤構築、 なる情報爆発への対応
        活用の             情報爆発への
                                             15

More Related Content

PDF
金融機関でのHive/Presto事例紹介
PDF
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
PDF
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
PPTX
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
PDF
大規模サイトを支えるビッグデータプラットフォーム技術
PDF
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
PDF
NetflixにおけるPresto/Spark活用事例
PDF
最新版Hadoopクラスタを運用して得られたもの
金融機関でのHive/Presto事例紹介
[db tech showcase Tokyo 2016] B31: Spark Summit 2016@SFに参加してきたので最新事例などを紹介しつつデ...
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
リクルートライフスタイルの考える ストリームデータの活かし方(Hadoop Spark Conference2016)
大規模サイトを支えるビッグデータプラットフォーム技術
Hadoopエコシステムの最新動向とNTTデータの取り組み (OSC 2016 Tokyo/Spring 講演資料)
NetflixにおけるPresto/Spark活用事例
最新版Hadoopクラスタを運用して得られたもの

What's hot (20)

PPT
Hadoop ~Yahoo! JAPANの活用について~
PPTX
Hadoop / Elastic MapReduceつまみ食い
PPTX
データ利活用を促進するメタデータ
PDF
[DI06] 並列分散処理の考え方とオープンソース分散処理系の動向
PDF
基幹業務もHadoopで!! -ローソンにおける店舗発注業務への Hadoop + Hive導入と その取り組みについて-
PDF
MapR と Vertica エンジニアが語る、なぜその組み合わせが最高なのか? - db tech showcase 大阪 2014 2014/06/19
PPT
20120822_dstn技術交流会_DataSpider接続先技術動向
PDF
Yahoo!プロモーション広告のビックデータ基盤を支える技術と今後の展望
PDF
[de:code 2017] 並列分散処理の考え方とオープンソース分散処理系の動向
PDF
大規模クラスタでのHadoop課題
PDF
ビッグデータ関連Oss動向調査とニーズ分析
PDF
Apache Kuduを使った分析システムの裏側
PDF
ちょっと理解に自信がないな という皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
PDF
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
PDF
MapR Streams & MapR コンバージド・データ・プラットフォーム
PDF
SparkやBigQueryなどを用いた モバイルゲーム分析環境
PDF
今こそクラウドへ!データの移行、連携、統合のコツ
PDF
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
PPTX
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
PDF
(LT)Spark and Cassandra
Hadoop ~Yahoo! JAPANの活用について~
Hadoop / Elastic MapReduceつまみ食い
データ利活用を促進するメタデータ
[DI06] 並列分散処理の考え方とオープンソース分散処理系の動向
基幹業務もHadoopで!! -ローソンにおける店舗発注業務への Hadoop + Hive導入と その取り組みについて-
MapR と Vertica エンジニアが語る、なぜその組み合わせが最高なのか? - db tech showcase 大阪 2014 2014/06/19
20120822_dstn技術交流会_DataSpider接続先技術動向
Yahoo!プロモーション広告のビックデータ基盤を支える技術と今後の展望
[de:code 2017] 並列分散処理の考え方とオープンソース分散処理系の動向
大規模クラスタでのHadoop課題
ビッグデータ関連Oss動向調査とニーズ分析
Apache Kuduを使った分析システムの裏側
ちょっと理解に自信がないな という皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
MapR Streams & MapR コンバージド・データ・プラットフォーム
SparkやBigQueryなどを用いた モバイルゲーム分析環境
今こそクラウドへ!データの移行、連携、統合のコツ
Apache Hadoop の現在と将来(Hadoop / Spark Conference Japan 2016 キーノート講演資料)
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
(LT)Spark and Cassandra
Ad

Similar to 情報爆発シンポジウム infoplosion (20)

PDF
OSSとクラウドによるコンピューティングモデルの変化
PPTX
WebDB Forum 2012 基調講演資料
PDF
【IVS CTO Night & Day】AWSにおけるビッグデータ活用
PPTX
ビッグデータ&データマネジメント展
PDF
【HinemosWorld2014】B1-4_NTTデータ先端技術のOpenStack Hinemosソリューション
PPTX
ビッグデータ活用支援フォーラム
PDF
PaaS / Cloud Foundry makes you happy
PDF
Microsoft の深層学習への取り組み
PDF
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
PPT
Big data解析ビジネス
PDF
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
PDF
楽天がCloud foundryを選んだ理由
PDF
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
PDF
1_各Atlassian製品の紹介
PDF
OSSではじめるオープン・スタンダードのクラウド @201304
PPTX
【日商USA】Webinar 2023.12.13 AWS re:Invent ハイライト ~データ活用の最先端を垣間見る~
PDF
オブジェクトストレージのユースケース (Cloudweek2014 講演資料)
PDF
jubatus pressrelease
PDF
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
PDF
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
OSSとクラウドによるコンピューティングモデルの変化
WebDB Forum 2012 基調講演資料
【IVS CTO Night & Day】AWSにおけるビッグデータ活用
ビッグデータ&データマネジメント展
【HinemosWorld2014】B1-4_NTTデータ先端技術のOpenStack Hinemosソリューション
ビッグデータ活用支援フォーラム
PaaS / Cloud Foundry makes you happy
Microsoft の深層学習への取り組み
Apache Drill Overview - Tokyo Apache Drill Meetup 2015/09/15
Big data解析ビジネス
Prestoで実現するインタラクティブクエリ - dbtech showcase 2014 Tokyo
楽天がCloud foundryを選んだ理由
[db tech showcase Tokyo 2014] D33: Prestoで実現するインタラクティブクエリ by トレジャーデータ株式会社 斉藤太郎
1_各Atlassian製品の紹介
OSSではじめるオープン・スタンダードのクラウド @201304
【日商USA】Webinar 2023.12.13 AWS re:Invent ハイライト ~データ活用の最先端を垣間見る~
オブジェクトストレージのユースケース (Cloudweek2014 講演資料)
jubatus pressrelease
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
Ad

More from Rakuten Group, Inc. (20)

PDF
EPSS (Exploit Prediction Scoring System)モニタリングツールの開発
PPTX
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
PDF
楽天における安全な秘匿情報管理への道のり
PDF
What Makes Software Green?
PDF
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
PDF
DataSkillCultureを浸透させる楽天の取り組み
PDF
大規模なリアルタイム監視の導入と展開
PDF
楽天における大規模データベースの運用
PDF
楽天サービスを支えるネットワークインフラストラクチャー
PDF
楽天の規模とクラウドプラットフォーム統括部の役割
PDF
Rakuten Services and Infrastructure Team.pdf
PDF
The Data Platform Administration Handling the 100 PB.pdf
PDF
Supporting Internal Customers as Technical Account Managers.pdf
PDF
Making Cloud Native CI_CD Services.pdf
PDF
How We Defined Our Own Cloud.pdf
PDF
Travel & Leisure Platform Department's tech info
PDF
Travel & Leisure Platform Department's tech info
PDF
OWASPTop10_Introduction
PDF
Introduction of GORA API Group technology
PDF
100PBを越えるデータプラットフォームの実情
EPSS (Exploit Prediction Scoring System)モニタリングツールの開発
コードレビュー改善のためにJenkinsとIntelliJ IDEAのプラグインを自作してみた話
楽天における安全な秘匿情報管理への道のり
What Makes Software Green?
Simple and Effective Knowledge-Driven Query Expansion for QA-Based Product At...
DataSkillCultureを浸透させる楽天の取り組み
大規模なリアルタイム監視の導入と展開
楽天における大規模データベースの運用
楽天サービスを支えるネットワークインフラストラクチャー
楽天の規模とクラウドプラットフォーム統括部の役割
Rakuten Services and Infrastructure Team.pdf
The Data Platform Administration Handling the 100 PB.pdf
Supporting Internal Customers as Technical Account Managers.pdf
Making Cloud Native CI_CD Services.pdf
How We Defined Our Own Cloud.pdf
Travel & Leisure Platform Department's tech info
Travel & Leisure Platform Department's tech info
OWASPTop10_Introduction
Introduction of GORA API Group technology
100PBを越えるデータプラットフォームの実情

情報爆発シンポジウム infoplosion

  • 1. 国際シンポジウム 国際シンポジウム 情報爆発を えて」 「情報爆発を越えて」 クラウドとHPCIによる クラウドとHPCIによる たなイノベーション 新たなイノベーション ビジネスでの状況と での状況 ビジネスでの状況と方向性 Rakuten Inc. Masaya Mori Jan. 16th, 2012
  • 2. Introduction • まさや) 森 正弥 (もり まさや) • 楽天株式会社 執行役員 • 楽天技術研究所 所長 • アーキテクチャ関連部署 部署長 Masaya Mori – クラウド関連 Twitter: @emasha – 検索・データ解析基盤 2
  • 3. クラウドは本格的な普及状態に クラウドは本格的な普及状態に突入 •“全米の約70%の企業が何らかの形でクラウドを利用” The Economist 全米の 70%の企業が らかの形 クラウドを利用 全米 • “パブリッククラウドは反動期、プライベートクラウドは流行期 Gartner パブリッククラウドは反動期、プライベートクラウドは流行期” ガートナーの ガートナーのハイプサイクル • E-Commerce においては、普及のスピードが最も速い においては、普及のスピードが •Netflix の全面移行、Amazon の全面移行 Netflix 全面移行、 • 東日本大震災以降、BCP対策としての導入例(ケンコーコム)も増加 東日本大震災以降、BCP対策としての導入例 ケンコーコム) 対策としての導入例( 3
  • 4. 「今のクラウド」のキーワード クラウド」 •パブリックとプライベート ハイブリッド設計 •オンプレミスとの連携 •CloudStack、OpenStack、 コモディティ化 •Eucalyptus、CloudFoundry •Hadoop、NoSQLの台頭 ビッグデータ •実空間情報の統合 4
  • 5. 「今のクラウド」のキーワード クラウド」 •パブリックとプライベート ハイブリッド設計 •オンプレミスとの連携 •パブリックとプライベートの連携 パブリックとプライベートの パブリック •パブリックを使う、いや、使わない、という二項対立ではない パブリックを パブリック いや、 わない、という二項対立ではない 二項対立 •IT基盤戦略のポートフォリオをどう作るか IT基盤戦略 IT基盤戦略のポートフォリオをどう をどう作 •情報系・参照系・2.0系のパプリック vs. 基幹系のプライベート 情報系・参照系・2.0系 情報系 基幹系の •繁忙期、ピーク期におけるトランザクションの爆発に対応 繁忙期、 繁忙期 ピーク期におけるトランザクション 爆発に トランザクションの •海外展開での連携 (ネットワークのレイテンシ、各種法令対応) 海外展開での 海外展開での連携 ネットワークのレイテンシ、各種法令対応) • 全体戦略としては、IT基盤全体設計ができるアーキテクト人材の確保 全体戦略としては IT基盤全体設計ができるアーキテクト人材の としては、 基盤全体設計ができるアーキテクト人材 5
  • 6. 「今のクラウド」のキーワード クラウド」 •CloudStack、OpenStack、 コモディティ化 •Eucalyptus、CloudFoundry •プライベート基盤構築のコモディティ化 プライベート基盤構築のコモディティ化 プライベート基盤構築 •各種オープンソース化しており、技術のコモディティ化が進行 各種オープンソース化しており、技術のコモディティ化 各種オープンソース •利用するクラウドから、自分たちでも作るクラウドが本格化 利用するクラウドから 利用するクラウドから、自分たちでも たちでも作 クラウドが •CloudStack のオープンソース化 CloudStack オープンソース化 •OpenStack の継続的リリース、コミュニティの拡大 OpenStack 継続的リリース コミュニティの リリース、 •老舗 Eucalyptus もメジャーバージョン3に 老舗 メジャーバージョン3 •PaaS基盤 CloudFoundry の登場 PaaS基盤 PaaS • 選択と集中の加速 選択と集中の • パブリックと役割分担した開発生産性を意識した基盤が構築可能に パブリックと役割分担した開発生産性を意識した基盤が構築可能に した開発生産性 した基盤 6
  • 7. 「今のクラウド」のキーワード クラウド」 •CloudStack、OpenStack、 コモディティ化 •Eucalyptus、CloudFoundry •プライベート基盤構築のコモディティ化 プライベート基盤構築のコモディティ化 プライベート基盤構築 •“Open Compute Project Facebook Open Project” •インフラをスケールさせるハードウェアの設計や仕様の公開 インフラを インフラ スケールさせるハードウェアの設計や仕様の させるハードウェア •不要な機能や部品を排し、高い効率性と妥当なコストの実現 不要な 不要 機能や部品を 効率性と妥当なコストの • 大規模なクラウド基盤の知識も共有が進む 大規模なクラウド基盤の知識も共有が 基盤 7
  • 8. 「今のクラウド」のキーワード クラウド」 •Hadoop,NoSQLの台頭 ビッグデータ •実空間情報の統合 •そもそもの情報の活用例 そもそもの情報の そもそもの情報 •Last.fm Last.fm •230カ国以上に3000万人以上のユーザ 230カ国以上に3000万人以上の 230 万人以上 •膨大なユーザの嗜好を分析,個々人にあった音楽を推薦・提供. 膨大な 膨大 ユーザの嗜好を分析, にあった音楽 推薦・提供. 音楽を •毎日1000万回以上の視聴情報を解析 毎日1000万回以上の 毎日1000万回以上 視聴情報を •Pandora Radio Pandora •ユーザデータに加え,曲の旋律,歌詞,声質,楽器,拍子,コード進 ユーザデータに ユーザデータ 旋律,歌詞,声質,楽器,拍子,コード進 行等を かく解析 行等を細かく解析 •ユーザの評価を組み合わせ,よりよい曲を提供 ユーザの ユーザ 評価を わせ,よりよい曲 1億人以上のユーザを 成長を •1億人以上のユーザを持ち,成長を続ける • 情報解析のビジネス価値の発見 情報解析のビジネス価値 価値の 8
  • 9. 「今のクラウド」のキーワード クラウド」 •Hadoop,NoSQLの台頭 ビッグデータ •実空間情報の統合 •スーパーDB、レコメンド、パーソナライズ スーパーDB、レコメンド、 スーパーDB •データマイニング、NLP、統計による価値の創出 データマイニング、NLP、統計による価値の データマイニング による価値 • 情報解析のビジネス価値の発見、情報解析の重要性 情報解析のビジネス価値 発見、情報解析の 価値の 9
  • 10. 「今のクラウド」のキーワード クラウド」 •Hadoop,NoSQLの台頭 ビッグデータ •実空間情報の統合 •情報爆発 情報爆発 •インターネット接続回線合計トラフィック 11Gbps以上 インターネット接続回線合計トラフィック 11Gbps以上 インターネット接続回線合計 •PV 1億、年間流通総額 1兆円 (グループ2.3兆円) PV 1億 グループ2.3兆円) 2.3兆円 •ユーザー数 8000万、商品数 8800万、レビュー 7000万 ユーザー数 ユーザー 8000万 8800万 7000万 •一日数百GB以上のトランザクション、アクセスログ、検索ログ 一日数百GB以上の 一日数百GB以上 トランザクション、アクセスログ、検索ログ • 情報解析基盤の大規模化 情報解析基盤の • 大規模システムの構築・運用技術は必須 大規模システム 構築・運用技術は システムの 10
  • 11. 「今のクラウド」のキーワード クラウド」 •Hadoop,NoSQLの台頭 ビッグデータ •実空間情報の統合 •大規模基盤の活用・構築 大規模基盤の活用・ 大規模基盤 •クラウドの普及、技術のコモディティ化を踏まえ クラウドの普及、技術のコモディティ化 クラウド •パブリッククラウドの活用、プライベートの構築 パブリッククラウドの パブリッククラウド 活用、プライベートの •Hadoopクラスターの構築、NoSQLの活用・構築 Hadoopクラスター Hadoopクラスターの構築、NoSQLの活用・ • レコメンド、ターゲティング広告、検索改善、ログ解析での活用 レコメンド、ターゲティング広告 検索改善、ログ解析での活用 広告、 解析での • OSSの活用、貢献、開発が進む OSSの活用、貢献、開発が 11
  • 12. 楽天プロダクトランキング 楽天プロダクトランキング ■処理内容 ・ランキングデータ集計 サーチエンジン 購買履歴 製品マスタDB 製品マスタDB マスタ ・製品ページ用データ生成 ■データ量 データ量 検索ワード 価格 売上件数 売上高 製品名 製品コード ・1日/1億レコード ・1日/300GB レビュー 商品件数 売上率 購買時間帯 スペック 発売日 ■M/R 処理時間 ・1時間半 ■ノード数 ノード数 ・70台 RAN Calculate DB Rakuten Product 12
  • 13. 検索での関連語提示や辞書構築での活用 検索での関連語提示や辞書構築での活用 での関連語提示 での クラスターから検索解析用のHiveにつなげ 関連語の提示や辞書構築等での活用 月 250GBのデータを解析 suggest batch server Suggest Index sync analyzed update search index data Shared Hadoop Cluster NGS Hive dictionary batch 検索エンジン Server NGS common Dictionary platform for hive Index update search index 13
  • 14. 「今のクラウド」のキーワード クラウド」 •Hadoop,NoSQLの台頭 ビッグデータ •実空間情報の統合 •実空間情報の統合 実空間情報の 実空間情報 •スマートフォンの普及、Online To Offline サービスの胎動 スマートフォンの普及、 スマートフォン サービスの •Shopkick, ShopSavvy, CheckPoints、Milo Shopkick, CheckPoints、 •トヨタの自動車クラウド トヨタの トヨタ 自動車クラウド •位置情報,走行距離・状態、使用傾向の収集・解析 位置情報, 位置情報 走行距離・状態、使用傾向の収集・ •ナビでリアルタイム情報推薦,適した自動車ローン商品の開発 ナビで ナビ リアルタイム情報推薦 情報推薦, した自動車ローン商品自動車ローン商品の • 実空間情報の統合による、更なる情報爆発・ビッグデータ 実空間情報の統合による による、 なる情報爆発 情報爆発・ • 次世代の情報解析基盤・情報ネットワークの整備が急務に 次世代の情報解析基盤・情報ネットワーク 整備が急務に ネットワークの 14
  • 15. 「今のクラウド」のキーワード クラウド」 •パブリックとプライベート ハイブリッド設計 •オンプレミスとの連携 •CloudStack、OpenStack、 コモディティ化 •Eucalyptus、CloudFoundry •Hadoop、NoSQLの台頭 ビッグデータ •実空間情報の統合 • クラウドはビジネスに着実に浸透、高度な全体設計が要求される クラウドはビジネスに着実に浸透、高度な全体設計が要求される • ビッグデータ活用の価値増大と基盤構築、更なる情報爆発への対応 ビッグデータ活用 価値増大と基盤構築、 なる情報爆発への対応 活用の 情報爆発への 15