SlideShare a Scribd company logo
Advanced Tech Night No.04

              Twitterの
         リアルタイム分散処理システム
                  Storm
              DEMO
                                      2012/03/01
                            Acroquest Technology
                                      木村宗太郎
発表の流れ

1.   自己紹介
2.   Stormのクラスタ構築ってどうやるの?
3.   今回動かすStormクラスタ構成
4.   今回動作させるTopologyの機能
     Stormデモ
5. 今回開発した規模
6. まとめ




                                     1
               Advanced Tech Night
1.自己紹介

•   名前      : 木村宗太郎
•   所属      : Acroquest Technology
•   Twitter : @kimutan_sk
•   主な仕事:
     Androidのアプリ基盤、サービス基盤開発
•   趣味:
     料理全般
     (特にお菓子作り)




                                        2
                  Advanced Tech Night
2.Stormのクラスタ構築ってどうやるの?

•   ブログ:T3(Taste of Tech Topics)
    (http://d.hatena.ne.jp/acro-engineer/)
    をご覧ください。




                                                 3
                           Advanced Tech Night
3.今回動かすStormクラスタ構成

•   1台の仮想マシンに下記のプロセスを構築しています。

                              仮想マシン(CentOS 6.2 64bit)
    ①   Nimbus
    ②   Zookeeper    Nimbus                 Zookeeper   Supervisor


    ③   Supervisor                                          Worker

    ④   Worker
    ⑤   Storm UI     Storm UI



                               NimbusとThriftを用いて通信し、
                            Stormクラスタの概況を表示するWebUI
                                    Jettyを用いて構築

                                                                     4
                      Advanced Tech Night
4.今回動作させるTopologyの機能

   Twitterから「ATN」のハッシュタグを含むつぶやきを取得する



    Twitter                     HashTag               Fields
                   Shuffle                                           Printer
    Single                       Filter              Grouping
                  Grouping                                            Bolt
    Spout                         Bolt

 TwitterのTweetで                1つのTweetを                     ハッシュタグが「atn」を
「#atn2012」を含む                {ハッシュタグ,Tweet}                       含む場合
    呟きを抽出                     の構造に分割する                      (CorrectTag + Tweet)
  (スレッド数:1)                   ※複数ハッシュタグを                        をログに出力
                               含む場合は複数の
                               タプルを生成する
                                                               (スレッド数:5)
                               (スレッド数:5)


                                                                               5
                               Advanced Tech Night
DEMO
Stormの実行




                                 6
           Advanced Tech Night
5.今回開発した規模

  TwitterSingleSpout                   90ライン
  HashTagFilterBolt                    37ライン
  PrinterBolt                          30ライン
  Topologyの定義                          45ライン

  計                                   202ライン
                                          たった
                                         これだけ!

                                                 7
                Advanced Tech Night
6.まとめ


1. Stormを使うと、少ない実装量(数百ライン程度)で
   簡単にリアルタイム処理システムが構築できます。

2. Topologyの概要は、Storm UIで常に見れます。

3. 1つのStormクラスタ上で
   複数のTopologyを混在して実行可能です。
   → クラスタのリソースを有効活用できます。


                                     8
               Advanced Tech Night

More Related Content

PDF
Twitterのリアルタイム分散処理システム「Storm」入門
PDF
分散ストリーム処理フレームワーク Apache S4
PDF
Stormのパフォーマンス分析
PDF
Stormの注目の新機能TridentAPI
PPTX
Stormとその周辺 2013.03.15
PDF
クラウドオーケストレーション「OpenStack Heat」に迫る!
PDF
ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド
PDF
JOSUG Meetup 28th Heat 101
Twitterのリアルタイム分散処理システム「Storm」入門
分散ストリーム処理フレームワーク Apache S4
Stormのパフォーマンス分析
Stormの注目の新機能TridentAPI
Stormとその周辺 2013.03.15
クラウドオーケストレーション「OpenStack Heat」に迫る!
ソフトウェアエンジニアのための「機械学習理論」入門・ハンズオン演習ガイド
JOSUG Meetup 28th Heat 101

What's hot (20)

PPTX
Wiresharkの解析プラグインを作る ssmjp 201409
PDF
Linux女子部 iptables復習編
PDF
RDOとPackstackのご紹介
PDF
エンジニア向け夏期特別講座 〜 Red Hat OpenStack徹底解説! 第二部 OpenStackの内部構造
PDF
完全分散エッジ処理で実現するNeutron仮想ネットワーク
PDF
OpenStackクラウド基盤構築ハンズオンセミナー 第2日:講義No2
PDF
OpenStackクラウド基盤構築ハンズオンセミナー 第1日:講義No2
PDF
OpenStackクラウド基盤構築ハンズオンセミナー 第2日:ハンズオンNo1
PDF
Red Hat Enterprise Linux OpenStack Platform環境でのDocker活用テクニック
PDF
PG-REXで学ぶPacemaker運用の実例
PPTX
OpenStack管理者入門 - OpenStack最新情報セミナー 2014年12月
PPTX
葉物野菜を見極めたい!by Keras
PDF
OpenStackクラウド基盤構築ハンズオンセミナー 第1日:ハンズオンNo2
PDF
Node.jsv0.8からv4.xへのバージョンアップ ~大規模Push通知基盤の運用事例~
PDF
OpenStackでも重要な役割を果たすPacemakerを知ろう!
PDF
Pacemakerを使いこなそう
PDF
痛い目にあってわかる HAクラスタのありがたさ
PDF
TensroFlow XLA : JIT編 (r1.3版)
PDF
OpenStackクラウド基盤構築ハンズオンセミナー 第1日:ハンズオンNo1
PDF
RHEL7/CentOS7 NetworkManager徹底入門
Wiresharkの解析プラグインを作る ssmjp 201409
Linux女子部 iptables復習編
RDOとPackstackのご紹介
エンジニア向け夏期特別講座 〜 Red Hat OpenStack徹底解説! 第二部 OpenStackの内部構造
完全分散エッジ処理で実現するNeutron仮想ネットワーク
OpenStackクラウド基盤構築ハンズオンセミナー 第2日:講義No2
OpenStackクラウド基盤構築ハンズオンセミナー 第1日:講義No2
OpenStackクラウド基盤構築ハンズオンセミナー 第2日:ハンズオンNo1
Red Hat Enterprise Linux OpenStack Platform環境でのDocker活用テクニック
PG-REXで学ぶPacemaker運用の実例
OpenStack管理者入門 - OpenStack最新情報セミナー 2014年12月
葉物野菜を見極めたい!by Keras
OpenStackクラウド基盤構築ハンズオンセミナー 第1日:ハンズオンNo2
Node.jsv0.8からv4.xへのバージョンアップ ~大規模Push通知基盤の運用事例~
OpenStackでも重要な役割を果たすPacemakerを知ろう!
Pacemakerを使いこなそう
痛い目にあってわかる HAクラスタのありがたさ
TensroFlow XLA : JIT編 (r1.3版)
OpenStackクラウド基盤構築ハンズオンセミナー 第1日:ハンズオンNo1
RHEL7/CentOS7 NetworkManager徹底入門
Ad

Viewers also liked (10)

PDF
Orchestrate DBaaS入門
PDF
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
PPTX
Open daylightバージョンアップ対応
PDF
デブサミ2014-Stormで実現するビッグデータのリアルタイム処理プラットフォーム ~ストリームデータ処理から機械学習まで~
PDF
Jubatus分類器の活用テクニック
PDF
ストリームデータ分散処理基盤Storm
PDF
Astah Community スタートガイド
PDF
Storm の新機能について @HSCR #hadoopreading
PDF
Automation of Rolling Upgrade of Hadoop Cluster without Data Lost and Job Fai...
PDF
SORACOM Harvest + AWS Lambdaでウィンドウ処理をやってみた
Orchestrate DBaaS入門
Jubatusにおける大規模分散オンライン機械学習@先端金融テクノロジー研究会
Open daylightバージョンアップ対応
デブサミ2014-Stormで実現するビッグデータのリアルタイム処理プラットフォーム ~ストリームデータ処理から機械学習まで~
Jubatus分類器の活用テクニック
ストリームデータ分散処理基盤Storm
Astah Community スタートガイド
Storm の新機能について @HSCR #hadoopreading
Automation of Rolling Upgrade of Hadoop Cluster without Data Lost and Job Fai...
SORACOM Harvest + AWS Lambdaでウィンドウ処理をやってみた
Ad

Similar to Twitterのリアルタイム分散処理システム「Storm」入門 demo (20)

PDF
分散バージョン管理システムって何なん 20101218
PDF
運用に自動化を求めるのは間違っているだろうか
PDF
FlexUnit4とMockitoFlex
PDF
Osc2010 tokyo fall@kaorun
PPTX
2015 0227 OSC-Spring Tokyo NETMF
PDF
Prometheus at Preferred Networks
PDF
TripleO Deep Dive 1.1
PDF
StreamingAPIを使用したTwitter Bot @waketi の紹介
PDF
20130329 rtm3
PDF
20130329 rtm2
PDF
Mesh tensorflow
PDF
エンタープライズブロックチェーン構築の基礎
PDF
4.総合演習(1)
PPTX
Chrome Extensionで スクリーンシェアをやってみる
PPTX
Tokyo Jazug Night 2020-01 Azure Monitor を使った運用監視コトハジメ
PPTX
Hyperledgerのチュートリアルで理解する基幹システム向けブロックチェーンハンズオン
PDF
パターンでわかる! .NET Coreの非同期処理
PDF
201111 04
PPTX
OpenStack最新動向と構築のポイント - EMC様セミナー 「あなたのビジネスを高速化! OpenStackが実現する戦略的なクラウドインフラ」
分散バージョン管理システムって何なん 20101218
運用に自動化を求めるのは間違っているだろうか
FlexUnit4とMockitoFlex
Osc2010 tokyo fall@kaorun
2015 0227 OSC-Spring Tokyo NETMF
Prometheus at Preferred Networks
TripleO Deep Dive 1.1
StreamingAPIを使用したTwitter Bot @waketi の紹介
20130329 rtm3
20130329 rtm2
Mesh tensorflow
エンタープライズブロックチェーン構築の基礎
4.総合演習(1)
Chrome Extensionで スクリーンシェアをやってみる
Tokyo Jazug Night 2020-01 Azure Monitor を使った運用監視コトハジメ
Hyperledgerのチュートリアルで理解する基幹システム向けブロックチェーンハンズオン
パターンでわかる! .NET Coreの非同期処理
201111 04
OpenStack最新動向と構築のポイント - EMC様セミナー 「あなたのビジネスを高速化! OpenStackが実現する戦略的なクラウドインフラ」

More from AdvancedTechNight (18)

PDF
CSS3Rendererを使ってiOSでもサクサク3D
PDF
D3.jsと学ぶVisualization(可視化)の世界
PDF
3DCG(3Dコンピュータグラフィック)をWebGLで始めよう
PDF
CSSだけで実現するグラフィック表現
PDF
これから利用拡大?WebSocket
PDF
全部入り!WGPで高速JavaScript+HML5体験
PDF
Backbone.js入門
PDF
TypeScriptのススメ ~JavaエンジニアのためのJava(like)Script
PDF
three.jsで作る3Dの世界
PDF
単なるキャッシュじゃないよ!?infinispanの紹介
PDF
Spine入門
PDF
ログ収集フレームワークの新バージョン「FlumeNG」
PPTX
Hadoop scr第7回 hw2011フィードバック
PPTX
ななめ45°から見たJavaOne
PPTX
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
PPTX
ATN No.1 Hadoop vs Amazon EMR
PDF
ATN No.2 大阪から来たJavaPuzzlers
PDF
ATN No.2 Scala事始め
CSS3Rendererを使ってiOSでもサクサク3D
D3.jsと学ぶVisualization(可視化)の世界
3DCG(3Dコンピュータグラフィック)をWebGLで始めよう
CSSだけで実現するグラフィック表現
これから利用拡大?WebSocket
全部入り!WGPで高速JavaScript+HML5体験
Backbone.js入門
TypeScriptのススメ ~JavaエンジニアのためのJava(like)Script
three.jsで作る3Dの世界
単なるキャッシュじゃないよ!?infinispanの紹介
Spine入門
ログ収集フレームワークの新バージョン「FlumeNG」
Hadoop scr第7回 hw2011フィードバック
ななめ45°から見たJavaOne
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
ATN No.1 Hadoop vs Amazon EMR
ATN No.2 大阪から来たJavaPuzzlers
ATN No.2 Scala事始め

Twitterのリアルタイム分散処理システム「Storm」入門 demo

  • 1. Advanced Tech Night No.04 Twitterの リアルタイム分散処理システム Storm DEMO 2012/03/01 Acroquest Technology 木村宗太郎
  • 2. 発表の流れ 1. 自己紹介 2. Stormのクラスタ構築ってどうやるの? 3. 今回動かすStormクラスタ構成 4. 今回動作させるTopologyの機能 Stormデモ 5. 今回開発した規模 6. まとめ 1 Advanced Tech Night
  • 3. 1.自己紹介 • 名前 : 木村宗太郎 • 所属 : Acroquest Technology • Twitter : @kimutan_sk • 主な仕事: Androidのアプリ基盤、サービス基盤開発 • 趣味: 料理全般 (特にお菓子作り) 2 Advanced Tech Night
  • 4. 2.Stormのクラスタ構築ってどうやるの? • ブログ:T3(Taste of Tech Topics) (http://d.hatena.ne.jp/acro-engineer/) をご覧ください。 3 Advanced Tech Night
  • 5. 3.今回動かすStormクラスタ構成 • 1台の仮想マシンに下記のプロセスを構築しています。 仮想マシン(CentOS 6.2 64bit) ① Nimbus ② Zookeeper Nimbus Zookeeper Supervisor ③ Supervisor Worker ④ Worker ⑤ Storm UI Storm UI NimbusとThriftを用いて通信し、 Stormクラスタの概況を表示するWebUI Jettyを用いて構築 4 Advanced Tech Night
  • 6. 4.今回動作させるTopologyの機能 Twitterから「ATN」のハッシュタグを含むつぶやきを取得する Twitter HashTag Fields Shuffle Printer Single Filter Grouping Grouping Bolt Spout Bolt TwitterのTweetで 1つのTweetを ハッシュタグが「atn」を 「#atn2012」を含む {ハッシュタグ,Tweet} 含む場合 呟きを抽出 の構造に分割する (CorrectTag + Tweet) (スレッド数:1) ※複数ハッシュタグを をログに出力 含む場合は複数の タプルを生成する (スレッド数:5) (スレッド数:5) 5 Advanced Tech Night
  • 7. DEMO Stormの実行 6 Advanced Tech Night
  • 8. 5.今回開発した規模 TwitterSingleSpout 90ライン HashTagFilterBolt 37ライン PrinterBolt 30ライン Topologyの定義 45ライン 計 202ライン たった これだけ! 7 Advanced Tech Night
  • 9. 6.まとめ 1. Stormを使うと、少ない実装量(数百ライン程度)で 簡単にリアルタイム処理システムが構築できます。 2. Topologyの概要は、Storm UIで常に見れます。 3. 1つのStormクラスタ上で 複数のTopologyを混在して実行可能です。 → クラスタのリソースを有効活用できます。 8 Advanced Tech Night