Lean Baseball

No Engineering, No Baseball.

エンジニア&データサイエンティストの為の「ビックデータベースボール」書評

ご無沙汰していますこんにちは.

5ヶ月ぶりの野球ネタです、気がついたらGW気がついたら野球が開幕してました*1.

つい先日、一部の野球ファンとデータサイエンティストな人を唸らせるこんな本が出ました.

ちょこっと出遅れた感ありますが、野球エンジニア的な読書感想文と考察を簡単に述べたいと思います.

野球とデータが好きな野球バカもしくはエンジニアの人が一人でも多くGWの課題図書にしてくれることを祈ります!

【書評】ビッグデータ・ベースボール

Starting Member

  • あらすじ
  • 見どころ・読みどころ
  • 【所感】ビックデータベースボールを読むべき人に贈る言葉
  • 【次回予告】PyCon JP 2016について〜今年はビックデータベースボールやるぜ!

あらすじ

本の宣伝をそのまま引用するとこんな感じです.

“常識”という難敵に“数学”という武器で挑んだ男たちの物語。

「ほかのチームから見向きもされなかったベテラン選手、多額の契約金で入団したドラフト指名選手、古い教えを受けたコーチ、数学の天才から成る寄せ集めのチームが、個々の能力を合計したよりも大きな力を発揮して、ここまで到達したのだ。彼らは新しい意見、新しい考え方、共同作業を受け入れなければならなかった。それが2013年の彼らの物語であり、彼らの成果だった。」

1992年から2012年(書籍の舞台となっている2013年の前年)まで、20シーズン(20年連続)負け越しの不名誉記録を打ち立てた米大リーグの弱小球団、ピッツバーグ・パイレーツが、

  • 他のチームから不要品同然の体で追い出されたベテラン選手
  • 数多くの期待を受けて入団してきた若き有望選手
  • 古い野球の常識・慣習を受けた監督・コーチ
  • データの力、数学・統計の応用でチームを改善に導いたフロントスタッフ

どこからどう見ても相容れないであろう、四者四様の背景を持つ人々が、「ピッツバーグ・パイレーツ」という一艘の海賊船でメジャーリーグの荒波に出て無事チームがプレーオフに行くまでの姿が描かれたノンフィクション小説です.

扱っているテーマはとしては、ブラッド・ピットが5年前に主演した野球映画「マネー・ボール」の原作と似ていますが、マネー・ボールは2003年、ビックデータベースボールは2013年で10年の月日が経過しており、その間に変わった野球観についても事細かく描かれています.

見どころ・読みどころ

2つのテーマで見どころ・読みどころを紹介します.

マネー・ボールからビックデータの時代へ〜マネー・ボールはもう古い

マネー・ボールで描かれていた野球統計学セイバーメトリクス」ですが、マネー・ボールの時代(2003)からビックデータベースボールの時代(2013)の10年間で、恐ろしく進化を遂げました.

一言で言うと、

選手自身や周りからは見えにくい・見えないデータを取得、分析・可視化することが出来るようになりました

マネー・ボール時代のセイバーメトリクス

  • 成績ベースでの振り返りがメイン、既存のデータを活用
    • スコアブック
    • 選手・チーム成績
  • シンプルな計算式・簡単な統計で評価
  • スコアブック・成績に出ないデータの評価はほぼ不可能*2
    • 守備範囲
    • 足の速さ
    • 球のスピード・キレ

ビックデータベースボールのセイバーメトリクス

  • 高性能スピードガン「PITCHf/x」、打者のプレーデータを取る「Statcast」で取得した多くのデータ(ビックデータ)で評価
    • 投手の球速、ストライク・ボールのゾーン分析、球のキレ(初速・終速・回転数etc...)
    • 野手の打球スピード・回転、守備範囲、肩の強さ(投球スピード&コントロール)etc...
    • 今まで取れなかったデータが取れるように!!!
  • 野球的な観点での仮説を元に指標を定義&仮説検証
    • 対戦打者の打球の傾向(引っ張るのか流すのかまんべんなく打つのかetc...)
    • 平均的なキャッチャーと比べてストライクを多く重ねるキャッチャーは何が違うのか?
    • ビッグデータのおかげで仮説検証がより細かく複雑に!
  • スコアブック・成績に出ないデータの評価が可能に
    • 守備範囲
    • 足の速さ
    • 球のスピード・キレ

このようなデータが取れるようになった経緯を解説しつつ、ピッツバーグ・パイレーツが繰り返した「仮説検証」と「実験」が数多く乗っている、中々読み応えがある内容となっています.

仮説検証と実験(ビックデータベースボール)

  • 不調の先発左腕は優秀なキャッチャーとの組み合わせで再生するのか?(F・リリアーノとR・マーティン)
  • 内野・外野の守備シフトはどこまで有効なのか?(クリントン・バームズ、スターリング・マルテ)
  • 故障明けの投手の投球スタイルを変えることは出来るのか?(チャーリー・モートン

詳しい内容は読んでのお楽しみということで.

古い野球観と新しい野球観の宗教戦争

マネー・ボールでも描かれていた「古い野球観と新しい野球観の宗教戦争」ですが、ビックデータベースボールでもかなりのページを割いて触れられています.

ちなみに、野球観の古い・新しいはざっくり言うとこんな感じです.

古い野球観

  • 選手・コーチ・監督等、野球のプレーと采配に関する経験が尊重される
  • よそ者(フロント・観客など)の意見は尊重されない
  • 「塁に出たら盗塁」「バントは有効」等、昔からの習慣も尊重される

新しい野球観

  • 選手・コーチ・監督のみならず、野球を支えている人たち、見ている人たちの意見も尊重される
  • よそ者の意見・プレーしている者の意見関係なく、意味のある意見・仮説が尊重される
  • 昔の習慣・データに対して「なぜ」を持つところから考え始める

ビックデータで野球の見えない部分が見えるようになった一方、古い野球の人たちは受け入れるのが難しい・そもそも受け入れたくない!

...というわかりやすい図式がこの本にも描かれていて、お互いが分かり合うために、

  • 上から目線でデータを導入、ではなく、データの価値・意味をわかってもらいながら伴走して導入
  • データ分析官(データサイエンティスト)がチームに帯同してコミュニケーションをとる
  • 古い野球観を全て否定する、ではなく尊重・正しいことは受け入れる
    • 例えば選手のメンターだったりトレーニング方法、プレーヤーが見ないとわからない所など

現場の野球経験と知識、フロント(データ分析官)のデータや統計に関する知識を融合して如何にチームを作るのか?といった辺りも読みどころの一つです.

ちなみに余談ですがこの辺自分が読んだ時には「Fearless Change」っぽいなと思いました.*3

Fearless Change アジャイルに効く アイデアを組織に広めるための48のパターン

Fearless Change アジャイルに効く アイデアを組織に広めるための48のパターン

【所感】ビックデータベースボールを読むべき人に贈る言葉

この本は表題ほど優しい本ではなく、

野球の知識があり、データの解釈・読み方に対するリテラシーが高い人じゃないとそうそう読めない

レベルの書籍だと思いました.

ビックデータベースボールを読む人に求められる知識とスタンス

  • 最低限の野球ルールとデータの読み方を理解
  • マネー・ボールに書かれている指標や背景を理解
  • 何故このようなデータが取れる・仮説になるのか?が自分なりに把握できる

結構キッツい感じですがそれぐらいややこしかったです.

ちなみに言うと、メジャーリーグの知識そのものは無くても読める、むしろ無いほうが先入観なく読めると思うのでいいかな?と思っています.

そして、私が是非とも読んでほしいなと思っている方はだいたいこんな人々です.

ビックデータベースボールを読んで欲しい・読むべき人々

  • 野球が大好きなデータサイエンティスト
  • 野球Hack!的なプログラミングやデータ分析がしたいエンジニア
  • 野球、特にセイバーメトリクスが大好きで自分でもやってみたい!と思っている非エンジニアな野球ファン

いずれにしても野球好きじゃない・好きだけどデータの解釈・読み方が苦手な人は読めないんじゃないかなと思っています.

幸いにも私は野球もデータも大好きで、スコアデータを見ない日が無いくらい大好きでデータもいじれるエンジニアなので最高に楽しめました!

【次回予告】PyCon JP 2016について〜今年はビックデータベースボールやるぜ!

そんな、ビックデータベースボールに触発されて...というわけではないですが、今年のPyCon JPも野球をテーマにCfP(演題応募)をさせて頂きました.

pycon.jp

ビックデータベースボールのネタも頑張って織り込もうと思っていますので、「話を聞きたいな!」と思う方は是非シェアなどしていただけると幸いですm(__)m

お後がよろしいようで〜

*1:下馬評が低かったアスレチックスが意外と調子いい一方、中継ぎと外野が崩壊して低迷してる日ハムさんェ...orz

*2:簡易的な指標はあります

*3:実際Fearless Changeっぽい組織の変え方してる、偶然だと思いますが.