SlideShare a Scribd company logo
野球Hack!(続き)~Pythonを用いた野球サービス構築 #bpstudy
Who am I ?
• Shinichi Nakagawa(@shinyorke)
• Pythonで野球の人(野生の野球アナリスト)
• Python / Agile / Infra as a code(Dockerとか)
• 贔屓チーム
• 北海道日本ハムファイターズ
• オークランド・アスレチックス
• BPStudy登壇:4回目(#79, #89, #91, #99)
野球Hack~Pythonを用いたデータ分析と可視化
http://www.slideshare.net/shinyorke/hackpython-pyconjp
反響
• 60席+立ち見&床席40人ちょっと(推定)

→発表時の聴衆の皆さま(感謝!)
• 約20,000views(SlideShare)
• 220

→はてなブックマークの数(減ってた)
とても興奮している. ありがとう!
※なお、カノーさんはシアトルに来てから(ry
Today’s Starting Member
• デモアプリ(のコード)を公開しました!
• 次回予告
おさらい
分析と可視化
• レスターは何月に一番勝っているのか?
• ボットのマルチ四球(=1試合2四球)の回数

Jon Lester Joey Votto
Jon Lester(ジョン・レスター)
• メジャー屈指の先発左腕、優勝請負人 ※世界一経験二回
• プレーオフ(10/9)に先発、なお負け投手
• レッドソックス(2006-2014)→アスレチックス(2014)→カブス(2015)
レスターさんの月別勝利数
• 調子いい時は4,5月で稼いでいる、8,9月も良さげだがそんなに極端ではない
• 残りの月はなんか微妙だけど傾向がアレ

ちなみに7月はオールスターの為登板が少ない(レスターにかぎらず)
Joey Votto(ジョーイ・ボット)
• レッズ一筋(2007-2015)、強打の一塁手
• 選球眼が良すぎて散歩(四球)が多い、通算アダム・ダン率は38%
• 内野フライが異常に少ない。とある統計によると、2009-2012の4年間で3本(ファ!?)
塁間さんぽ(イッチVSボット)
• 月別の四球数、凡例の数字はシーズン通算
• 圧倒的にボットさんが散歩好き、特に8,9月やばい
• 神イチローはとにかく打って走るスタイル、春先はまあまあ歩いてる
イチロー ボット
マルチさんぽ(イッチVSボット)
• 1試合で2個以上四球を選んだ試合を月別にカウント
• ボットさんの回数がやばい
• 神イチローはある意味予想通り、流石天才バッター
イチロー ボット
コード、公開しました!
https://github.com/Shinichi-Nakagawa/hatteberg
MLBの野球データを用いた分析と可視化
のサンプル(Python)を公開しました
http://shinyorke.hatenablog.com/entry/
2015/11/15/231336
こだわりポイント
• 自動化~煩わしい前処理の型化
• 高速化~15年分のMLBデータを10分でDB化
• すぐ使えるサンプルの提供
自動化
• ダルい作業である、前処理を自動化
• 野球データのダウンロード,前処理,作成を

一気通貫に出来る仕組みに作り直し
• MySQLをDockerで一発作成

&マイグレツール「py-retrosheet」を作り直し
https://github.com/Shinichi-Nakagawa/py-retrosheet
高速化(特にマイグレツール)
• 従来のマイグレツール(py-retrosheet)

→1シーズン分のデータ作成に20分

 15年分は(ry
• 作りなおしたマイグレツール

→1シーズン分で1分かからず

 15年分は10分でデータ取得~前処理~DB作成!
15年分のMLB試合データを10分でMySQLに
格納するPythonスクリプト(野球Hack!)
http://qiita.com/shinyorke/items/
d44d00d0f02b09b8b0ed
サンプルコード
• Jupyter notebookベースで使えるサンプルを
用意
• レスターの勝ち星、ボットの散歩に加え、

背番号55の方のデータ分析サンプルを追加
• Jupyterで遊びたい人はどうぞ!
結び
• 誰でも野球Hack!出来る仕組みにした(つもり)

→公開をモチベーションに、自動化と高速化をやり切った

 現実使える仕組み&使い心地じゃないと意味ない(おもてなしの心)
• もっといい作り・プロダクトにしたい!

→野球で何かやりたい人は活用して欲しい&フィードバック待ってます!
• 現実的な使い道

→15年分のMLB打席データ(約280万レコード)が割と楽に手に入る

 データ見てニヤニヤしたり、機械学習の勉強ネタにどうぞ!
Next Challenge…
野球Hack!(続き)~Pythonを用いた野球サービス構築 #bpstudy
今年やったネタ
これカッコ良くね?
今年やったネタ
http://m.mlb.com/apps/atbat?c_id=mlb
Next Challenge
• MLB一球速報(MLB At Bat)データを用いた分析と可視化

Pitch f/x(高性能スピードガン)のデータを用いた分析と可視
化、やってます! ※ライセンスは問題無いです(念のため)
• 選手のタイプ(配球やコース、打者の好きなボールetc…)を
分析したい

→そろそろ機械学習まじめにやる
• PyCon JP 2016で発表出来る…はず(Proposal通れば)
ゲームセット!!!
ご清聴ありがとうございました.
Shinichi Nakagawa(Twitter/Facebook/hatena:@shinyorke)

More Related Content

PDF
アジャイルサムライ~Pythonista道場 #PyLadiesTokyo 1周年記念パーティー 2015/10/24
PDF
Python Professional Baseball Programming Open Data Edition #bpstudy 91(2015/3...
PDF
Pythonではじめる野球プログラミング(続き)PyCon JP 2014 LT
PDF
データ分析に使える野球データまとめ #PyDataTokyo meetup 2015/10/23
PDF
Python野球クラスタの紹介
PDF
Pythonistaな私がChefからAnsibleに乗り換えた話(ひたすらゆるくプレゼンする会 2015/4/9)
PDF
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
PDF
Railsではじめる野球プログラミング
アジャイルサムライ~Pythonista道場 #PyLadiesTokyo 1周年記念パーティー 2015/10/24
Python Professional Baseball Programming Open Data Edition #bpstudy 91(2015/3...
Pythonではじめる野球プログラミング(続き)PyCon JP 2014 LT
データ分析に使える野球データまとめ #PyDataTokyo meetup 2015/10/23
Python野球クラスタの紹介
Pythonistaな私がChefからAnsibleに乗り換えた話(ひたすらゆるくプレゼンする会 2015/4/9)
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
Railsではじめる野球プログラミング

What's hot (14)

PDF
野球Hack!~Pythonを用いたデータ分析と可視化 #kwskrb #28 2015/9/30
PDF
こんなゴールデン・グラブ賞は嫌だ~2015 #bpstudy 100回目記念LT
PDF
【Inception-Deck】野球Hack! - Pythonを用いたデータ分析と可視化
PDF
Pythonではじめる野球プログラミング - kawasaki.rb #15 2014/8/27
PDF
Pythonではじめる野球プログラミング PyCon JP 2014 9/14 Talk Session
PDF
Agile Baseball Science - アジャイル脳によく効く野球のハナシ
PDF
Rで野球のデータ解析がしたい (データが欲しい)
PDF
A Tour of やきう&Go - やきう民の私とGoの半年(実質3日間)
PDF
PyData入門(超初心者編)~野球のデータをカジュアルに可視化
PDF
社内プレゼン勉強会発表資料
PPTX
逆求人 自己紹介スライド
PDF
I was bone to love Design
PDF
神奈川電子技術研究所 あかんゲームといいゲーム
PDF
【部活用】GCC プログラミング講習3
野球Hack!~Pythonを用いたデータ分析と可視化 #kwskrb #28 2015/9/30
こんなゴールデン・グラブ賞は嫌だ~2015 #bpstudy 100回目記念LT
【Inception-Deck】野球Hack! - Pythonを用いたデータ分析と可視化
Pythonではじめる野球プログラミング - kawasaki.rb #15 2014/8/27
Pythonではじめる野球プログラミング PyCon JP 2014 9/14 Talk Session
Agile Baseball Science - アジャイル脳によく効く野球のハナシ
Rで野球のデータ解析がしたい (データが欲しい)
A Tour of やきう&Go - やきう民の私とGoの半年(実質3日間)
PyData入門(超初心者編)~野球のデータをカジュアルに可視化
社内プレゼン勉強会発表資料
逆求人 自己紹介スライド
I was bone to love Design
神奈川電子技術研究所 あかんゲームといいゲーム
【部活用】GCC プログラミング講習3

Viewers also liked (20)

PDF
CMSI計算科学技術特論B(13) 大規模量子化学計算(2)
PDF
ビックデータとPythonではじめる野球の統計分析(α)
PPTX
PyLadies Tokyo #3: ゼロからはじめたPyData
PDF
サーバーサイドボトルネックの探し方
PDF
Big Data Baseball with Python - Ichiro Suzuki hacks! #kwsk01
PDF
20150329 tokyo r47
PDF
データの不備を統計的に見抜く (Gelman’s secret weapon)
PDF
User Happyをささえるアジャイルのココロとスクラムのキホン
PPTX
Pyladies Tokyo meet up #6
PDF
Rで野球データ解析がしたい ( pitchRxを使う )
PDF
あなただけにそっと教える弊社の分析事情 #data analyst meetup tokyo vol.1 LT
PDF
最近遊んだ Wii Uの 3つのソフトの感想
PPTX
これからの時代に! パソコン離れの中のパソコン選び
PDF
5分でわかるかもしれないglmnet
PDF
続Pythonによるwebスクレイピング入門
PDF
Python と型ヒント (Type Hints)
PDF
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack
PPTX
アイドルソング制作の工程管理
PDF
Redmineによるwebサポート窓口の実装と運用
PDF
ベイジアンモデリングによるマーケティングサイエンス〜状態空間モデルを用いたモデリング
CMSI計算科学技術特論B(13) 大規模量子化学計算(2)
ビックデータとPythonではじめる野球の統計分析(α)
PyLadies Tokyo #3: ゼロからはじめたPyData
サーバーサイドボトルネックの探し方
Big Data Baseball with Python - Ichiro Suzuki hacks! #kwsk01
20150329 tokyo r47
データの不備を統計的に見抜く (Gelman’s secret weapon)
User Happyをささえるアジャイルのココロとスクラムのキホン
Pyladies Tokyo meet up #6
Rで野球データ解析がしたい ( pitchRxを使う )
あなただけにそっと教える弊社の分析事情 #data analyst meetup tokyo vol.1 LT
最近遊んだ Wii Uの 3つのソフトの感想
これからの時代に! パソコン離れの中のパソコン選び
5分でわかるかもしれないglmnet
続Pythonによるwebスクレイピング入門
Python と型ヒント (Type Hints)
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack
アイドルソング制作の工程管理
Redmineによるwebサポート窓口の実装と運用
ベイジアンモデリングによるマーケティングサイエンス〜状態空間モデルを用いたモデリング

More from Shinichi Nakagawa (12)

PDF
価値を見せる技術 #DevLOVE ベースボールからみる技術
PDF
Baseball Play Study 2016冬〜Replacement!(ありがとう陽岱鋼!)
PDF
Py "Baseball" Data入門〜サービス(と野球)を支えるデータ分析基盤 #monotarotech
PDF
Py "Baseball" Data入門 - 広島東洋カープ編 #pyconhiro
PDF
XPな俺達に贈るPyCon JP 2016レポート #xpjug
PDF
たった数行のPythonコードで打者大谷翔平がどれだけ凄いのかを見てみる #ABPro
PDF
ビックデータとPythonではじめる野球の統計分析 #pyconjp
PDF
Pythonistaデビュー #PyNyumon 2016/5/31
PDF
やきうデータLT「ホームラン」 #pyconjp
PDF
Agile Baseball Science - はじめてのセイバーメトリクス
PDF
はじめてのLean Canvas〜最初のアイディアを言語化してみよう #bpstudy
PDF
Python + Raspberry Piでスマートハウスを手作りする(計画) Python mini Hack-a-thon #49 成果発表 2014...
価値を見せる技術 #DevLOVE ベースボールからみる技術
Baseball Play Study 2016冬〜Replacement!(ありがとう陽岱鋼!)
Py "Baseball" Data入門〜サービス(と野球)を支えるデータ分析基盤 #monotarotech
Py "Baseball" Data入門 - 広島東洋カープ編 #pyconhiro
XPな俺達に贈るPyCon JP 2016レポート #xpjug
たった数行のPythonコードで打者大谷翔平がどれだけ凄いのかを見てみる #ABPro
ビックデータとPythonではじめる野球の統計分析 #pyconjp
Pythonistaデビュー #PyNyumon 2016/5/31
やきうデータLT「ホームラン」 #pyconjp
Agile Baseball Science - はじめてのセイバーメトリクス
はじめてのLean Canvas〜最初のアイディアを言語化してみよう #bpstudy
Python + Raspberry Piでスマートハウスを手作りする(計画) Python mini Hack-a-thon #49 成果発表 2014...

野球Hack!(続き)~Pythonを用いた野球サービス構築 #bpstudy