Lean Baseball

Engineering/Baseball/Python/Agile/SABR and more...

野球好きが統計学を覚える為の学習フローを作ってみました〜解説を添えて

こんにちは.野球(とグルメ)の人です.*1

ビックデータや統計学が相変わらずアツい話題になっている中,野球好きとデータ好きをうならせるこんな本が出版されました.

[プロ野球でわかる! ]はじめての統計学

[プロ野球でわかる! ]はじめての統計学

  • 作者: 株式会社DELTA,佐藤文彦,student,岡田友輔
  • 出版社/メーカー: 技術評論社
  • 発売日: 2017/03/14
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る

この本,早速読ませてもらってとても良い!感銘を受けた!!という感じなのですが,

  • そもそも世の中に野球統計学(セイバーメトリクス)の本が増えてきた
  • (野球好きでも)初心者がいきなり読んだら辛い本もあるぞ!
  • ???「ワイも野球データを集めて分析したいンゴ」

…などなど,クエスチョンやテーマができたので,

今まで学んだ・実践した野球統計学の学び方・本・データを整理するのにいい機会だ!

…ということで,

  • レベル別の本の選び方
  • オススメ書籍(三行レビュー付き)
  • 野球データ分析のはじめかた
  • 【オマケ】野球統計学から派生したビジネス書籍

について一筆書きたいと思います!

なお,お気づきの方も多いかと思いますが,このエントリーは以下エントリーの野球バージョン的な位置づけです.

shinyorke.hatenablog.com

対象読者

  • 野球好き
  • 統計学を覚えたい
  • 野球統計学で分析したりアプリ作ったりしたい
  • ExcelやRを使えるor何かしらのプログラミング言語(推奨はPython)ができるとより良いかも

免責事項

Pythonの時のエントリーとほぼ同じですが一応書いときます.

  • あくまでも個人(shinyorke)の見解です,この内容が正解・銀の弾丸ではありません.
  • 世の中にある全ての野球本・Webサイト・手法を網羅しているモノではありません.「取り上げられていない野球本・Webサイトがダメ」ということではないのであしからず!
  • (当たり前ですが)所属企業・組織および,参加している団体・組織は一切関係ありません.

基本的に私の経験で書いてるものなのでご意見・フィードバックお待ちしております.

野球好きが統計学を覚える為の学習フローを作ってみました〜解説を添えて

というわけで,体系化してみた絵がこちらになります.

中身は順を追って解説します.

f:id:shinyorke:20170319101855p:plain

学習の順番とポイント

順を追って解説します.

野球のルール・データの読み方

球場やTV,ネットで一喜一憂して試合をみる…以上のルールおよびデータの解釈が必須です!

球場の情報やTV,ネットは試合を見るための最低の情報をうまく手に入れることはできますが,

  • 各指標(打率・打点・ホームラン)の本来の意味
  • 指標の算出方法
  • ヒット・アウト・得点etc…成績がつけられる条件とルールの把握

といった所での解釈を行うためには明確に学習が必要です.

暗記はしなくても良いので,是非とも公認野球規則(ルールブック)や審判向けの教本(実践向けのテクニックあり)を読むことをオススメします.

なお私のオススメは以下の二冊です!

野球規則を正しく理解するための野球審判員マニュアル―規則適用上の解釈について

野球規則を正しく理解するための野球審判員マニュアル―規則適用上の解釈について

公認野球規則は2017年版の発売を待ってます…2017年版がオススメです!

マネー・ボールは必読!

野球を統計学で革命した,マネー・ボールは必読の一冊です

物語としてもわかりやすく,重要なポイント(出塁率やOPS,DIPSなど)についてはうまい具合に文章でまとまっている…だけでなく,

  • 野球統計学の背景や歴史,使われ方が載っている
  • ノンフィクションですべて現実のため,明確にイメージが湧く
  • ほぼすべての野球統計学本は,マネー・ボールを読んでいる前提でかかれている!

最後のポイントは私の印象論的な意見も含んでいますが,多分外していないです.

というわけで,マネー・ボールは読みましょう!

マネー・ボール〔完全版〕 (ハヤカワ・ノンフィクション文庫)

マネー・ボール〔完全版〕 (ハヤカワ・ノンフィクション文庫)

なお,(娯楽としては素晴らしいですが)映画版だけで済ませるのはNGです!

なにかやりたいぞ!…何をやろう?

重度の野球好きがマネー・ボールを読むと,

  • 実際の野球と照らし合わせてみてみたい
  • 手元にデータが欲しい
  • データを使って何か遊びたい

という欲が出てくると思います.

私もそんな一人で,野球データHackを4年前からはじめました.

やりたいことを明確にしつつ,本を読んだりデータを探して実際に手を動かしてみると良いと思います!

オススメ書籍(三行レビュー付き)

上記の体系表に載せた本の簡単なレビューです.

気になった本は是非手に取ってもらえると!

マネー・ボールを読んだ後のオススメ

野球統計学を学ぶ

勝てる野球の統計学――セイバーメトリクス (岩波科学ライブラリー)

勝てる野球の統計学――セイバーメトリクス (岩波科学ライブラリー)

マネー・ボールを読んで,「ピタゴラス勝率をもっと知りたい」「WARってなんぞや!?」的な統計指標を知りたくなったらこの本が良いです.

参考データが2013年の日本プロ野球なので若干古いですが,イメージを掴みつつ覚えるのに最適かなと思います.

一般的な統計学から入る

[プロ野球でわかる! ]はじめての統計学

[プロ野球でわかる! ]はじめての統計学

  • 作者: 株式会社DELTA,佐藤文彦,student,岡田友輔
  • 出版社/メーカー: 技術評論社
  • 発売日: 2017/03/14
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る

非常にオススメな一冊です!

統計学の基礎からセイバーメトリクス(野球統計学)の話題に入りつつ,Excelで分析・可視化をするという流れがわかりやすいかつ,

書籍サイトにサンプルデータ(Excel)が公開されているので手元で試すことも可能です.*2

野球データの取り扱いや分析の楽しさ(苦しさ)を覚えるのに最適な一冊かもしれません!

最新事例を知りたい

メジャーリーグの最新事例は「ビッグデータ・ベースボール」,日本は「野球×統計は最強のバッテリーである」がオススメです.

ビッグデータ・ベースボール 20年連続負け越し球団ピッツバーグ・パイレーツを甦らせた数学の魔法

ビッグデータ・ベースボール 20年連続負け越し球団ピッツバーグ・パイレーツを甦らせた数学の魔法

野球×統計は最強のバッテリーである - セイバーメトリクスとトラッキングの世界 (中公新書ラクレ)

野球×統計は最強のバッテリーである - セイバーメトリクスとトラッキングの世界 (中公新書ラクレ)

いずれも,最新のデータ取得手法,具体的には

  • Pitch f/x*3
  • TrackMan*4

といったものでデータを取得してそのあとどう分析するか?という話が詳しく書かれています.

個人的には「ビックデータ・ベースボール」にある「フレーミング」の話が面白くておすすめです.*5

野球データでなにかをやる!

日本プロ野球の統計データを知る

詳しいデータ解説や充実度を含め,「セイバーメトリクスリポート」がおすすめです.

プロ野球を統計学と客観分析で考えるセイバーメトリクス・リポート5

プロ野球を統計学と客観分析で考えるセイバーメトリクス・リポート5

  • 作者: 岡田友輔,道作,三宅博人,蛭川皓平,高多薪吾,Student,水島仁,神事努,森下義隆,神原謙悟,竹下弘道,市川博久,大南淳
  • 出版社/メーカー: 水曜社
  • 発売日: 2016/05/25
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログ (1件) を見る

メジャーリーグの統計データを知る

こちらはWebサイトがオススメです.

読みやすいのはBaseball Reference,マニアックかつ深いのがFAN GRAPHSですね.

www.baseball-reference.com

www.fangraphs.com

なお,上記サイトからスクレイピング…はちょっと大人げないので,Baseball Reference相当のデータ(一部無いデータあり)も貼っておきます.

Sean Lahman | Database Journalist ※選手名鑑&試合結果データ

Retrosheet ※試合&打席結果

Retrosheetで何ができるかはこちらのエントリーが参考になります(手前味噌パート1)

shinyorke.hatenablog.com

Rで分析をする

英語書籍かつ若干お値段が高いですが,R Studioを使った野球統計学の基礎…的な本があります.

Analyzing Baseball Data with R (Chapman & Hall/CRC The R Series)

Analyzing Baseball Data with R (Chapman & Hall/CRC The R Series)

R使いの方はこちらを写経してはじめるのも良いかもしれません.*6

アプリを作る,Pythonでコードを書く

こちらもこのブログのエントリーでいくつかあります(手前味噌パート2)

shinyorke.hatenablog.com

shinyorke.hatenablog.com

shinyorke.hatenablog.com

shinyorke.hatenablog.com

野球データ分析のはじめかた

シンプルに,

  • 好きなチーム・選手を分析する
  • プログラミングや統計の勉強ネタとする
  • とにかく触って楽しむ!

がいいかなと,と思います.

私がはじめたキッカケもそんな感じで,野球のソーシャルゲーム「fantasy baseaball」で何が何でも勝ちたくなったのがキッカケでメジャーリーグの分析をはじめました.

ここはやはり「好きこそものの上手なれ」が基本だと思います.

【オマケ】野球統計学から派生したビジネス書籍

最近読んだ本ですが,野球統計学,特にマネー・ボールから派生して出てきた良著があるので紹介します.

シグナル&ノイズ

シグナル&ノイズ 天才データアナリストの「予測学」

シグナル&ノイズ 天才データアナリストの「予測学」

野球選手の成績予測モデルおよびシステムを作ったネイト・シルバーが米国大統領選で野球統計学を駆使した話を中心に,データの取り扱いについて語っています.

採用学

採用学 (新潮選書)

採用学 (新潮選書)

会社における採用とは…という本で一見すると野球統計学と全く関係がなさそうなのですが,

統計学を駆使してお金持ち(ヤンキースやレッドソックス)に貧乏球団(アスレチックス)が勝った考え方と行動は現在の採用活動の大きなヒントだよ!

という序章から始まっており,言い得て妙だなと思いました.

野球選手の「補強・獲得」を会社における「採用活動」に例える,という点で良かったので是非ともオススメします!

というわけで,

素敵な野球統計学ライフを!

*1:ここ二ヶ月でTVに出たり体重が4キロ減ったりなど,色々ありました

*2:なお私は試していません

*3:高性能スピードガンのこと.ボールの速度だけでなく,回転数や座標位置,角度を元に球種や球威を取得できるすごいマシン

*4:打球の速度や走塁,野手の動きを記録(トラッキング)してデータ化する計測器.日本でも導入が進んでいる

*5:捕手がストライクを取る能力を示す指標.平たく言うと「いかに審判を騙してストライクをとっているか」がわかる

*6:なおこの本のデータセットを手に入れるPythonのlibraryを開発して公開しています. https://github.com/Shinichi-Nakagawa/pitchpx