セイバーメトリクス
Tokyo.R
2013.2.23
自己紹介
2
twitter @argyle320
勤務先 IT分野のリサーチ会社
データ分析歴 約18年
R歴 2年
Twitterの写真
(円空仏)
参考書籍
3
ワイン方程式 (前回LT)
セイバーメトリクスとは?
• SABRmetrics
「SABR」=Society for American Baseball Research(アメリカ野球学会)
• 統計学の視点で選手の評価指標や戦略を洗いなおす
• 1970年代にビル・ジェイムスが自主出版で提唱
• 当初はMLB+メディアからは冷淡な扱い
• アスレチックス(マネーボール)やレッドソックスの成功
でMLBでも広がりつつある
• 日本でも千葉ロッテマリーンズが導入
4
データ分析による経営改善の事例
使われている統計手法
• 平均・標準偏差
• 直線回帰 (決定係数なし)
• 二乗平均平方根誤差 (相関係数なし)
• 確率、期待値、条件付き確率 (場合分け、樹形図)
• 打率の移動平均
• 散布図、ヒストグラム、箱ひげ図
5
そんなに高度な手法を使っているわけではない
なにがすごいか
• 野球の評価指標の再定義
• 細かい場合分け
6
野球の評価指標の再定義
• 旧来の指標はチームと選手の力を正しく評価してい
ない
– 打率、打点、自責点、防御率、エラー、・・・
– 運と能力が混在している
• ジェイムスによるチーム得点予測式
7
得点数=(安打数+四球数)×塁打数÷(打数+四球数)
野球の評価指標の再定義
• 攻撃力は出塁率と長打率がカギ。安打より四球
• 投手の評価指標・・・DIPS
– 本塁打、四球、死球、三振だけが投手の能力を純粋に表す指標
– 安定している+翌年の成績との相関が高い
8
OPS 出塁率+長打率
NOI (出塁率+長打率÷3)×1000
GPA (出塁率×1.8+長打率)÷4
SecA (塁打-安打+四球+盗塁- 盗塁死)÷打数
細かい場合分け
9
アウト数は非常に貴重
送りバント 低打率の打者なら有効(投手など)
盗塁 成功確率が0.6以上でないと得点見込みは減少
敬遠
強打者のボンズが相手だとしても、敬遠が有効な場面は
限られる (2アウトで一塁が空いている場合のみ)
セイバーメトリクスから学ぶ点
• 基本的な統計手法でも有用な分析はできる
• Big dataでなくても有用な分析はできる
• 対象とデータを深く見ることが重要
• 素人が統計分析だけで切り込んでも受けが悪い
10
MLBの10年間の全試合の投球データ数は?
30球団×162試合×150球×10年=729万レコード
オマケ
• 2012のパ・リーグの打率王はロッテの角中勝也
• 受賞コメント「出塁率を上げたい」
• 打率で表彰されておいて「出塁率」か???
• セイバーメトリクスらしいコメント
• きっと査定で使われているんだ
11
ご清聴ありがとうございました
12

More Related Content

PDF
PPTX
Fluentd,mongo db,rでお手軽ログ解析環境
PDF
Collaborativefilteringwith r
PDF
R3.0.0 is relased
PDF
Tokyo.R 白熱教室「これからのRcppの話をしよう」
PPTX
Tokyo r33 beginner
PDF
Rでコンジョイント分析
PPTX
Tokyo r30 beginner
Fluentd,mongo db,rでお手軽ログ解析環境
Collaborativefilteringwith r
R3.0.0 is relased
Tokyo.R 白熱教室「これからのRcppの話をしよう」
Tokyo r33 beginner
Rでコンジョイント分析
Tokyo r30 beginner

Viewers also liked (20)

PDF
PPTX
Tokyo r30 anova
PDF
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
PDF
Tokyo r12 - R言語による回帰分析入門
PDF
R-3.0.0でGLM
PDF
Doradora09 lt tokyo_r33
PPTX
ニコニコ動画タグネットワーク
PPTX
偽相関と偏相関係数
PDF
Rで実験計画法 後編
PDF
第31回TokyoR LT資料
PDF
Extend R with Rcpp!!!
PDF
中の人が語る seekR.jp の裏側
PPTX
Tokyo r30 anova_part2
PDF
第32回Tokyo.R#初心者セッション
PDF
R+pythonでKAGGLEの2値予測に挑戦!
PPTX
Abテストと検定
PDF
Rから利用するオープンデータAPI
PDF
相関係数と決定係数~回帰係数とその不偏性も
 
Tokyo r30 anova
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
Tokyo r12 - R言語による回帰分析入門
R-3.0.0でGLM
Doradora09 lt tokyo_r33
ニコニコ動画タグネットワーク
偽相関と偏相関係数
Rで実験計画法 後編
第31回TokyoR LT資料
Extend R with Rcpp!!!
中の人が語る seekR.jp の裏側
Tokyo r30 anova_part2
第32回Tokyo.R#初心者セッション
R+pythonでKAGGLEの2値予測に挑戦!
Abテストと検定
Rから利用するオープンデータAPI
相関係数と決定係数~回帰係数とその不偏性も
 
Ad

Similar to セイバーメトリクス (6)

PPTX
Sabr metrics
PDF
Sabr metrics(web展開用)
PDF
Agile Baseball Science - はじめてのセイバーメトリクス
PDF
Railsではじめる野球プログラミング
PDF
Three Out Change !!〜アウトについて語ろう BPstudy #79 2014/3/26
PDF
Agile Baseball Science - アジャイル脳によく効く野球のハナシ
Sabr metrics
Sabr metrics(web展開用)
Agile Baseball Science - はじめてのセイバーメトリクス
Railsではじめる野球プログラミング
Three Out Change !!〜アウトについて語ろう BPstudy #79 2014/3/26
Agile Baseball Science - アジャイル脳によく効く野球のハナシ
Ad

More from Mitsuo Shimohata (6)

PDF
決定木学習
PDF
ハイブリッド型樹木法
PDF
相関係数は傾きに影響される
PDF
因子分析
PDF
ワイン方程式
PDF
質的変数の相関・因子分析
決定木学習
ハイブリッド型樹木法
相関係数は傾きに影響される
因子分析
ワイン方程式
質的変数の相関・因子分析

セイバーメトリクス