読者です 読者をやめる 読者になる 読者になる

Lean Baseball

Engineering/Baseball/Python/Agile/SABR and more...

「野球×統計は最強のバッテリーである」を読んで、データスタジアムさんのデータでセイバーメトリクスしてみた

セイバーメトリクス 野球 データ分析 Python

この本がクッソ面白かったのでちょこっと書評を書いてみたのと、本日(8/30)現在のセパ両リーグのセイバーメトリクス指標を調べてみました。

結論から言うと、

野球好き・データ好きの人はこの本買いです!必読です!!

野球×統計は最強のバッテリーである - セイバーメトリクスとトラッキングの世界

マスメディアやプロチームに野球やサッカーのデータを提供しているデータスタジアム*1の野球サイエンティスト達が、

セイバーメトリクスの考え方や各指標の解説、最近流行っているトラッキングシステム(Pitch f/x)について解説している本です。

(出版社は異なりますが)事実上この本の続編っぽいです。

勝てる野球の統計学――セイバーメトリクス (岩波科学ライブラリー)

書評

  • 対象となる読者
  • 何が書かれているのか
  • 総評

対象となる読者

本の中では特に言及されていませんでしたが、私が読んだ感じだと以下の方々にオススメかと思われます。

  • 野球好きで、データ特に「セイバーメトリクス」について興味がある人
    • ネットの文字速報や野球選手名鑑といった「データ」が大好物
    • 野球大喜利なんJの野球スレが好き
  • セイバーメトリクスを使う人。通称「セイバーメトリシャン」と呼ばれる人種の皆さま
  • データサイエンティストやデータを扱うエンジニア・ビジネスマンの皆さま

基本的には「セイバーメトリクスとはなにか?を知りたい野球好きに贈る本」ということになっています。

...なのですが、読み進めると、最近流行りの「データを元に経営・ビジネスの課題を解決する」アプローチで仕事をされている、

データサイエンティストやエンジニア、ビジネスマンの方に結構刺さるんじゃないかと思いました(理由は後ほど)。

ちなみに私は「野生の野球アナリスト」と名乗る「セイバーメトリシャン」なので買いました。

何が書かれているのか

はじめに

序章として、今年の7/3(金)に発生した「セ・リーグ全チーム借金事件」*2を題材に、「ピタゴラス勝率」の解説が書かれています。

「得失点差で勝敗が予測できるんだぜ」っていうアレ*3です。

話のオチは読んでのお楽しみということで明言は避けますが、序章として結構良い話題&説明がかなりわかりやすくて良かったです。

あと、「野球データファンの視点」という章で野球ファン(一般のファンかデータオタクか)、チームの人(選手・監督又はオーナー・GM)とで、

野球の見方とデータの解釈が如何に違うか、という説明があり、これが結構読み応えありました。

本に載っていた絵を元に私はこんな感じで解釈しました。

f:id:shinyorke:20150830184146p:plain

【絵】セイバーメトリクスとファン、チームの人の関係図

この絵、書いてみて思ったのですが、「野球チーム」をそのまま「自分の仕事・プロジェクト」に置き換えるとそのまま成立するんですよねえ~

セイバーメトリクス

本編は半分セイバーメトリクス、半分トラッキングシステムの話で構成されています。

セイバーメトリクス編は、

の二つの章で構成されていて、「何か」の部分では、

  • 「映像(目の前のプレー)」で主観的な評価はするな、「数値(データ)」で客観的に評価せよ
  • 買うのは「選手」ではなく「勝利」
  • 選手は「得点と失点への貢献度」で評価せよ
  • ラッキングシステムがもたらすセイバーメトリクスの変化

といった、セイバーメトリクスのそもそもの観点からこれからのセイバーメトリクス(というよりむしろ今現在の主流)についての説明が載っています。

また、ほんの少しですがデータ駆動による課題解決サイクル(課題発見&仮説作成→収集と集計→解析→レポート→課題解決)とセイバーメトリクスは一緒だよ、

という話にも触れられています。

私はサイエンティストではありませんが、これって新人さんがデータサイエンスな仕事をする際の教科書になるのでは?と思いました。←データサイエンティストな人々にオススメな理由

また、早わかり解説では、

といった、自分で計算が出来るシンプルな指標と、

  • 守備指標(DER、UZR)
  • 総合評価(WAR)

といった、煩雑な指標を2014年の日本プロ野球を例にシンプルに解説しています。

ラッキングシステムの世界

メジャーリーグにて全本拠地に導入、日本でも導入が進んでいる「トラッキングシステム」がもたらすこれからの野球についての話がメインです。

ここだけは座談会方式で、野球ライターのキビタキビオ*4さんもパネラーに入っていました。

個人的にはココが一番面白かったです!!!

ラッキングシステムは投手の投球をロギングして分析するPITCHf/x、野手の動きを同じくロギング&分析するFIELDf/xがあるよ、という話から始まり、

  • ストレートってそもそもナンだ?
  • ストレートは全てシュートしている
  • リベラ*5カットボールは本当に魔球だった
  • 松井裕樹*6の投球フォームはあの人に似ている?

といった、データ分析的に興味深いテーマからほぼネタっぽいモノまで、トラッキングシステムのデータを元に丸裸にしよう!

という、初心者には絶対向かないマニアックなコンテンツになっていました!w

総評

初心者・初学者向けのセイバーメトリクス本としては最高の一冊だと思います!!!

一方でちゃんとマニアの心を揺さぶるネタも入ってて最高です!

正直、本の内容の2/3はデータを除き知ってる内容が大半で、「人に薦めるのには最高だけど自分で読むのにはちょっと弱いな」って思いましたが、

ラッキングシステムの章は知らないことが多かったし考え方とか見方がちょっと難しいしという感じで読み応え抜群でした。

野球好き、データ好きの人は絶対読むべき一冊です!!

【オマケ】試しに今シーズンのセパ両リーグのセイバーメトリクス指標を出してみた

、、、とまあ本を読んだ後に、試しにセイバーメトリクス指標を計算してExcelに出すコードをPythonで書いてみました。

成果は以下のリポジトリにございます!

Shinichi-Nakagawa/xp2015_baseball_tools · GitHub

楽しみたい方はPython 3.4.3をインストールし、pip、

pip install -r requirements.txt

とか入れてライブラリを突っ込んだ後に、

python example_npb_stats.py

とやってみると今日時点での成績が楽ちんに拾えます。

「山田哲人のOPSどうなってんやろ?」「まえけんのBB/9凄そう」「そういや丸の出塁率って」

とかそんな事が気になる方、是非お試しあれ。

コードの解説とかその他は、、、要望があれば別エントリーで。

日ハムソフトバンク引分悔しいぞ!!!

*1:Yahoo!の一球速報のほか、グノシーの野球速報でも使われていますね

*2:セ、史上初の全球団借金 首位から5位まで0・5差 - 野球 : 日刊スポーツ、ちなみに同じ事象が7/21にもありました

*3:ピタゴラス勝率 - Wikipedia

*4:この人のネタは本当にやばい

*5:マリアノ・リベラのこと。ヤンキースで抑え一筋、ストレートとカットボールだけでMLB通算トップの652セーブを稼いだ化け物。2013年引退。

*6:東北楽天ゴールデンイーグルスの守護神。2013年ドラ一左腕。監督が変わったら先発になるんだろうなあ(願望含め)