SlideShare a Scribd company logo
みんな、
ベンチマークどうやってるの?



  サーバ擬人化ユーザ会
  @sechiro
  http://d.hatena.ne.jp/sechiro/
自己紹介
●   Twitter ID: @sechiro
     ● サーバ擬人化ユーザ会

     ● サーバ擬人化エバンジェリスト


●   主な仕事
    ●   ざびたん
    ●   パスワードの擬人化
    ●   インフラエンジニア双六
    ●   新人インフラエンジニア向け
        メイド喫茶紹介
    ●   昼の仕事は便利屋SE
                           ざびたん2 護&サチ
本日のお題
●   みんな、ベンチマークどうやっ
    てるの?
    ●
        ベンチマークはみんなやってる
        はずなのに、どうやってるのか
        という話を聞く機会が少ない
    ●   世の中のベンチマーク結果は玉
        石混交…
    ●   なので、自分が意識している点
        をお話ししてみたい
    ●   今回は「計画と準備」を中心に
コンテンツ
●   ベンチマークの計画を立てる
●   ベンチマークの対象を知る
●   取得すべき情報を明確に
●   ベンチマークツールの選定
●   分析・レポート
ベンチマークの計画を立てる
●   何のベンチマークを取るの?
    ●
        HW性能?
    ●   アプリ性能?
    ●   ボトルネック解析?
    ●
        プロダクト比較?
●   目的が違うと、やるべきこと
    が全然違ってくる
目的別戦略
●   HW性能?
    ● TPCとかほかと比較できる一般的な基準を採用
●   アプリ性能?
    ●   基礎的なスコア?
        –   応答性能 → 応答時間がちゃんと取れるツール
        –   スループット → スループットをちゃんとカウントするツール
        –   処理時間 → 時間をちゃんと計測、timeコマンドでもおk
        –   チューニングはせず、基本設定のみがベター
    ●   最大性能?
        –   チューニングの限界に挑戦 → 多少の無茶はおk
●   ボトルネック解析?
    ●   既存のログを解析して戦略を立てることから
●   プロダクト比較?
    ●   観点とベンチマークの条件を明確にする
    ●   内容次第では、一方的な結果になりがち
●   いずれにしてもリソース使用状況は必ず取得する
    ●   そうしないと結果の妥当性が担保できない
ベンチマーク対象を知る
●   ベンチマーク対象のアーキテ
    クチャを把握する
    ●
        何を計測しているのかを明確に
    ●
        開始当初はおおざっぱでもよい
        –   ベンチマークしてみてわかること
            もある
        –   少なくとも分析のたたき台は必須
    ●   アーキテクチャから最大性能を
        概算できているとよい
例:とあるHBaseのベンチマーク
   負荷を掛けきれる?
                       知りたいのは
                        基本性能                           それぞれの操作
                                                      にかかった時間は
                                                      どうやってわかる?

                      JVMヒープと
                      OS管理メモリ                           ネットワーク通信
                     の使い分けは?                             の回数は?



                                                                 実際にディスクに
                                                                  書いてるの?
                                                                   fsync?

                                                             1GbEだとスルー
                                                             プットとRTTは?
               http://www.slideshare.net/sechiro/osc2012-spring-hphbasereport
取得すべき情報を明確に
●   どの情報を取るのか?
    ●   基本的には取れる情報はすべて取る
        –   sar -A とか ps aumx?とか
        –   あとからは取り返せない
    ●   情報取得のオーバーヘッドはほとんど性能
        に影響を与えない
    ●   各部分の性能がどの性能情報から判断でき
        るかを確認して、網羅性を確認する
    ●   必要な情報収集はスクリプト化、ツール化
        して自動化すべし
        –   実行後、結果をExcelに貼るだけの状態に
        –   設定含めエビデンスはすべて自動収集
        –   人手が入ると時間がかかり、信頼性も落ちる
例:とあるHBaseのベンチマーク
   応答時間、スループット
   クライアントでもsarとか                            JVMヒープやGCは
      を一緒に取る                                メトリクスとログから

               HBaseレイヤは                                   プロセスごとの値は
                 HBaseの                                      psやtopから
                 メトリクス
                                          HDFSレイヤは
                                           Hadoopの
                                            メトリクス


                                                                  OSレイヤは
                                                                 sarや/procから




              http://www.slideshare.net/sechiro/osc2012-spring-hphbasereport
そんなツールで大丈夫か?
●   ベンチマークツールを疑う
    ●
        ベンチマークツールのソースを
        読む
    ●   ツールが何を測定しているのか
        確認
    ●   それが自分のベンチマークの目
        的に適っているのかを検討
    ●   ちゃんと見ないと求めていたも
        のと違う結果が出てしまう
分析・レポート
●   分析・レポートはどうするの?
    ●
        Excel万能説
         – 一次集計をCSVで出力して貼り付け
         – あとからいろいろ解析できる
    ●   定形のグラフを出すだけでよいな
        ら”gnuplot”も便利
        –  設定ファイルつくるのが手間
         – 作ってしまえば、一気に大量のグラフを
           作って、HTMLに埋め込んで閲覧・レポート
           化まで自動化できる
         – 最新版を自分でビルドすべし
    ●
        sar のデータをみるなら”kSar”とかも
        よいらしい
まとめ
●   ベンチマークは計画と準備が重要
    ●   ちゃんとやらないと使えないデータばか
        りになってしまう。
    ●   性能値の正当性を感覚的に理解できてい
        ると、インフラエンジニア的にはかっこ
        いい
●   ベンチのノウハウは聞く機会が少ない
    ので、みなさんがどのようにやってい
    るのか聞いてみたい
ありがとうございました!

More Related Content

PDF
MongoDBCSharp
PDF
『アジャイルデータサイエンス』1章 理論
PPT
Robust log process
PDF
Shinjuku.rb #61 RubyKaigi2018予習
PDF
MongoDBではじめるカジュアルなタイムラインシステム
PDF
Db tech showcase2015 how to replicate between clusters
PPTX
サバフェスLt
PPTX
shared_ptrとゲームプログラミングでのメモリ管理
MongoDBCSharp
『アジャイルデータサイエンス』1章 理論
Robust log process
Shinjuku.rb #61 RubyKaigi2018予習
MongoDBではじめるカジュアルなタイムラインシステム
Db tech showcase2015 how to replicate between clusters
サバフェスLt
shared_ptrとゲームプログラミングでのメモリ管理

Viewers also liked (20)

PDF
新工場記念!500円でフォトブック印刷「tolot」ブロガーイベント第3回
PPTX
[セカイラボセミナー資料]アプリ企画ってどうしてる?
PPTX
ocamera 企画書
PDF
企画書のポイント
PDF
【第37回紅梅会研修会】糖尿病患者をアプリで支える
PDF
ベンチマーク勉強会#01
PDF
iPhone、Android両対応アプリ開発講座 概論
PDF
Router board勉強会vol2(ベンチマーク班まとめ)
PPT
(身内用)ゲーム勉強会 企画書フォーマット
PDF
Cephのベンチマークをしました
ODP
KANAZAWAスマホアプリコンテスト企画書
PDF
金沢すきま旅 企画書
PDF
iOsikko(仮)企画書
PPT
スマホゲーム企画書
PPT
スマホアプリ企画書
PDF
Webサービスの企画書 準備を楽しむ計画アプリ
PPTX
【ゲーム企画】「あなた採用、お前不採用っ。」
PDF
協賛が欲しい大学生が知っておくべき「企画書」のこと
PDF
「企画・提案書チラ見せナイト2」発表・ワークショップスライド
PDF
企画書作成術|江戸っ子社長会セミナー(2013.01.08)
新工場記念!500円でフォトブック印刷「tolot」ブロガーイベント第3回
[セカイラボセミナー資料]アプリ企画ってどうしてる?
ocamera 企画書
企画書のポイント
【第37回紅梅会研修会】糖尿病患者をアプリで支える
ベンチマーク勉強会#01
iPhone、Android両対応アプリ開発講座 概論
Router board勉強会vol2(ベンチマーク班まとめ)
(身内用)ゲーム勉強会 企画書フォーマット
Cephのベンチマークをしました
KANAZAWAスマホアプリコンテスト企画書
金沢すきま旅 企画書
iOsikko(仮)企画書
スマホゲーム企画書
スマホアプリ企画書
Webサービスの企画書 準備を楽しむ計画アプリ
【ゲーム企画】「あなた採用、お前不採用っ。」
協賛が欲しい大学生が知っておくべき「企画書」のこと
「企画・提案書チラ見せナイト2」発表・ワークショップスライド
企画書作成術|江戸っ子社長会セミナー(2013.01.08)
Ad

Similar to 【Hpcstudy】みんな、ベンチマークどうやってるの? (20)

PDF
hbstudy#06
PDF
Osc2012 spring HBase Report
PDF
アドテク×Scala×パフォーマンスチューニング
PDF
hbstudy25 劇的ビフォーアフター
PDF
大規模ソーシャルゲームを支える技術~PHP+MySQLを使った高負荷対策~
PPTX
初心者向け負荷軽減のはなし
PDF
Facebookのリアルタイム Big Data 処理
PPT
Performance and Scalability of Web Service
PDF
Lars George HBase Seminar with O'REILLY Oct.12 2012
PPTX
ビッグデータ&データマネジメント展
KEY
NHN techcon-20120519-fujimoto
PPTX
WebDB Forum 2012 基調講演資料
PPTX
ビッグデータ活用支援フォーラム
PPTX
Hadoopカンファレンス2013
PDF
Info talk #36
PDF
cross2012a fujya
PDF
Guide to Cassandra for Production Deployments
PDF
drecomにおけるwinning the metrics battle
PDF
Open stack reference architecture v1 2
PDF
Jenkinsとhadoopを利用した継続的データ解析環境の構築
hbstudy#06
Osc2012 spring HBase Report
アドテク×Scala×パフォーマンスチューニング
hbstudy25 劇的ビフォーアフター
大規模ソーシャルゲームを支える技術~PHP+MySQLを使った高負荷対策~
初心者向け負荷軽減のはなし
Facebookのリアルタイム Big Data 処理
Performance and Scalability of Web Service
Lars George HBase Seminar with O'REILLY Oct.12 2012
ビッグデータ&データマネジメント展
NHN techcon-20120519-fujimoto
WebDB Forum 2012 基調講演資料
ビッグデータ活用支援フォーラム
Hadoopカンファレンス2013
Info talk #36
cross2012a fujya
Guide to Cassandra for Production Deployments
drecomにおけるwinning the metrics battle
Open stack reference architecture v1 2
Jenkinsとhadoopを利用した継続的データ解析環境の構築
Ad

More from Seiichiro Ishida (16)

PDF
CEO 3Dモデルお披露目兼会社説明会
PDF
Infrastructure as code LT AWS + Ansibleのお悩み相談
PDF
Qpstudy201404 インフラ設計の勘所
PDF
Qpstudy.2013.07.c84新作発表資料「汝はエンジニアような名状しがたい何かなりや?」
PDF
Note difference between sysstat on cent os 5 & 6
PDF
Osc2013 spring OpenStackで実現する分散ストレージ「Swift」とプライベートクラウド
PDF
かるた工場作業一日目
PDF
俺のZabbixがこんなに可愛いわけがない~北海道巡業編~
PDF
【Zabbix jp】明日から職場で使えるざびたん
PDF
Zabbix jp勉強会 Hadoop-HBaseの監視_20120512
PDF
【Qp08】ざびたん2リリース報告lt 20111022
PDF
サーバ擬人化ユーザ会Lt資料 qpstudy lite
PDF
サーバ擬人化ユーザ会キックオフ資料 Slideshare ver
PDF
俺のZabbixがこんなに可愛いわけがない(おかわり)
PDF
俺のZabbixがこんなに可愛いわけがない
PDF
第1回Webサーバ勉強会 - 212-223 ブラウザマッチ処理
CEO 3Dモデルお披露目兼会社説明会
Infrastructure as code LT AWS + Ansibleのお悩み相談
Qpstudy201404 インフラ設計の勘所
Qpstudy.2013.07.c84新作発表資料「汝はエンジニアような名状しがたい何かなりや?」
Note difference between sysstat on cent os 5 & 6
Osc2013 spring OpenStackで実現する分散ストレージ「Swift」とプライベートクラウド
かるた工場作業一日目
俺のZabbixがこんなに可愛いわけがない~北海道巡業編~
【Zabbix jp】明日から職場で使えるざびたん
Zabbix jp勉強会 Hadoop-HBaseの監視_20120512
【Qp08】ざびたん2リリース報告lt 20111022
サーバ擬人化ユーザ会Lt資料 qpstudy lite
サーバ擬人化ユーザ会キックオフ資料 Slideshare ver
俺のZabbixがこんなに可愛いわけがない(おかわり)
俺のZabbixがこんなに可愛いわけがない
第1回Webサーバ勉強会 - 212-223 ブラウザマッチ処理

【Hpcstudy】みんな、ベンチマークどうやってるの?

  • 1. みんな、 ベンチマークどうやってるの? サーバ擬人化ユーザ会 @sechiro http://d.hatena.ne.jp/sechiro/
  • 2. 自己紹介 ● Twitter ID: @sechiro ● サーバ擬人化ユーザ会 ● サーバ擬人化エバンジェリスト ● 主な仕事 ● ざびたん ● パスワードの擬人化 ● インフラエンジニア双六 ● 新人インフラエンジニア向け メイド喫茶紹介 ● 昼の仕事は便利屋SE ざびたん2 護&サチ
  • 3. 本日のお題 ● みんな、ベンチマークどうやっ てるの? ● ベンチマークはみんなやってる はずなのに、どうやってるのか という話を聞く機会が少ない ● 世の中のベンチマーク結果は玉 石混交… ● なので、自分が意識している点 をお話ししてみたい ● 今回は「計画と準備」を中心に
  • 4. コンテンツ ● ベンチマークの計画を立てる ● ベンチマークの対象を知る ● 取得すべき情報を明確に ● ベンチマークツールの選定 ● 分析・レポート
  • 5. ベンチマークの計画を立てる ● 何のベンチマークを取るの? ● HW性能? ● アプリ性能? ● ボトルネック解析? ● プロダクト比較? ● 目的が違うと、やるべきこと が全然違ってくる
  • 6. 目的別戦略 ● HW性能? ● TPCとかほかと比較できる一般的な基準を採用 ● アプリ性能? ● 基礎的なスコア? – 応答性能 → 応答時間がちゃんと取れるツール – スループット → スループットをちゃんとカウントするツール – 処理時間 → 時間をちゃんと計測、timeコマンドでもおk – チューニングはせず、基本設定のみがベター ● 最大性能? – チューニングの限界に挑戦 → 多少の無茶はおk ● ボトルネック解析? ● 既存のログを解析して戦略を立てることから ● プロダクト比較? ● 観点とベンチマークの条件を明確にする ● 内容次第では、一方的な結果になりがち ● いずれにしてもリソース使用状況は必ず取得する ● そうしないと結果の妥当性が担保できない
  • 7. ベンチマーク対象を知る ● ベンチマーク対象のアーキテ クチャを把握する ● 何を計測しているのかを明確に ● 開始当初はおおざっぱでもよい – ベンチマークしてみてわかること もある – 少なくとも分析のたたき台は必須 ● アーキテクチャから最大性能を 概算できているとよい
  • 8. 例:とあるHBaseのベンチマーク 負荷を掛けきれる? 知りたいのは 基本性能 それぞれの操作 にかかった時間は どうやってわかる? JVMヒープと OS管理メモリ ネットワーク通信 の使い分けは? の回数は? 実際にディスクに 書いてるの? fsync? 1GbEだとスルー プットとRTTは? http://www.slideshare.net/sechiro/osc2012-spring-hphbasereport
  • 9. 取得すべき情報を明確に ● どの情報を取るのか? ● 基本的には取れる情報はすべて取る – sar -A とか ps aumx?とか – あとからは取り返せない ● 情報取得のオーバーヘッドはほとんど性能 に影響を与えない ● 各部分の性能がどの性能情報から判断でき るかを確認して、網羅性を確認する ● 必要な情報収集はスクリプト化、ツール化 して自動化すべし – 実行後、結果をExcelに貼るだけの状態に – 設定含めエビデンスはすべて自動収集 – 人手が入ると時間がかかり、信頼性も落ちる
  • 10. 例:とあるHBaseのベンチマーク 応答時間、スループット クライアントでもsarとか JVMヒープやGCは を一緒に取る メトリクスとログから HBaseレイヤは プロセスごとの値は HBaseの psやtopから メトリクス HDFSレイヤは Hadoopの メトリクス OSレイヤは sarや/procから http://www.slideshare.net/sechiro/osc2012-spring-hphbasereport
  • 11. そんなツールで大丈夫か? ● ベンチマークツールを疑う ● ベンチマークツールのソースを 読む ● ツールが何を測定しているのか 確認 ● それが自分のベンチマークの目 的に適っているのかを検討 ● ちゃんと見ないと求めていたも のと違う結果が出てしまう
  • 12. 分析・レポート ● 分析・レポートはどうするの? ● Excel万能説 – 一次集計をCSVで出力して貼り付け – あとからいろいろ解析できる ● 定形のグラフを出すだけでよいな ら”gnuplot”も便利 – 設定ファイルつくるのが手間 – 作ってしまえば、一気に大量のグラフを 作って、HTMLに埋め込んで閲覧・レポート 化まで自動化できる – 最新版を自分でビルドすべし ● sar のデータをみるなら”kSar”とかも よいらしい
  • 13. まとめ ● ベンチマークは計画と準備が重要 ● ちゃんとやらないと使えないデータばか りになってしまう。 ● 性能値の正当性を感覚的に理解できてい ると、インフラエンジニア的にはかっこ いい ● ベンチのノウハウは聞く機会が少ない ので、みなさんがどのようにやってい るのか聞いてみたい