Lean Baseball

No Engineering, No Baseball.

【野球】30分でわかるセイバーメトリクス

※2019/12/1更新:30分で理解するセイバーメトリクスの教科書 - 野球を統計的に楽しもう - Lean Baseballとして最新版を書きました

プロ野球もメジャーリーグも夏真っ盛りですねこんにちは!

今日は(自称)野球アナリスト*1らしく、セイバーメトリクスの話をちょこっとしてみようと思います!

初心者・初学者向けに30分で理解が進むように書いた、、、つもりです(汗)

セイバーメトリクスってなに?

セイバーメトリクス(SABRmetrics)は野球におけるデータ(選手成績、試合の結果、球場のスペックetc...)を統計学的に分析を行い、選手の能力、チームの強さなどといった事を分析、チームの経営や戦略に役立てる手法や考え方のことです。

単なる野球データおたくだったビル・ジェームズ*2氏が1970年代に提唱、2000年代にオークランド・アスレチックスをはじめとする先進的なチーム・球団幹部が活用して成果を上げ、現在では野球のみならずサッカーやアメフトといった他のスポーツでも手法や思想が活かされています。

余談ですが書籍・テレビドラマ「ルーズヴェルト・ゲーム*3」においても、セイバーメトリクスが登場しています。

セイバーメトリクスの例

実際の活用例ですが、セイバーメトリクスをチームに取り入れ、「安くて強い」チームを作ったビリー・ビーンGMの半生を描いた「マネーボール」という書籍・映画に詳しく描かれています。

「マネーボール」に出てきたセイバーメトリクスの例
  • 選手・チームの攻撃力を測る指標として、従来の打率・打点を用いず、「アウトにならない率」である出塁率を重視
  • 速球派の投手をクローザーに仕立ててセーブを沢山稼がせ、セーブを必要以上に評価*4している他球団にトレードして有望な選手を獲得*5
  • チームの総得点および総失点からチームの勝利数(敗北数)を予測、予測値に従い選手の補強・解雇を行った*6

他にも、「選手の得点能力を指標化*7」、「投手の投球・プレーから”運”の要素を除外して評価*8」といった考え方や例も紹介されています。

興味がある方は是非とも「夏休みの課題図書」として読んでみるといいかもです。

かんたんなセイバーメトリクスとむずかしいセイバーメトリクス

セイバーメトリクスは沢山の考え方・手法があるのですが、大きく分けると2つのカテゴリーに分類されます。

【悲報】野球コラムでもボツ原稿を喰らった件で: やまもといちろうBLOG(ブログ)

こちらのブログでやまもといちろう氏がこんな事を語っていました。

誰でも見られるSTATS(選手成績)からその選手の活躍を予想するセイバーメトリクスが第一世代だとすると、いまのセイバーメトリクスはサッカーから来た選手のパフォーマンスで能力把握や疲れなどの体調を見て選手采配やスタメン起用に活かす第二世代が出てきた感じです。

この一文を読んで「おお!」って思わずうなづきました。確かにその通り。

普段読んでいる新聞やテレビ、ネットの情報、すなわち「誰でも見られる選手成績」から計算したり評価を行えるのが「かんたんなセイバーメトリクス」。

スコアラーやカメラなんかで選手のプレーを録画・記録して情報を収集、「プロしか見られない選手のパフォーマンス」から計算したり評価を行う「むずかしいセイバーメトリクス」。

ざっくり分けるとこの2つに大別されます。

かんたんなセイバーメトリクス(第一世代)の特徴
  • スコアブック、打席情報、選手成績といった、書籍・ネット等で誰でも入手可能な情報で指標の計算・評価が可能
  • 計算の難易度が低い。電卓、Excelを扱える人なら誰でも出来る
  • 主な指標値:出塁率、OPS(出塁率+長打率)*9、QS(クオリティ・スタート)*10、ピタゴラス勝率など。
むずかしいセイバーメトリクス(第二世代)の特徴
  • 打球の速度・角度・着地点*11、投手が投げたボールのコース、球速、球種*12etc...、一般のファンが目にすること無いデータを用いて計算・評価を行う。
  • 計算の難易度が高い。回帰分析、機械学習といったいわゆる「ビッグデータ分析」に必要なスキルが要求される。
  • 主な指標値:UZR*13、WAR*14など。走力や体力といったフィジカルが直結する守備の指標に多い。

個人的にはひと目でわかるかつ、頑張れば自分で計算できる「かんたんなセイバーメトリクス」が好きです。

むずかしい方は自分でデータをいじれない*15悔しさもあり、眺めるだけで手一杯です(泣)

興味をもった人は、、、

まずは本を読むことをオススメします。

以下の二冊がやさしいかつ、内容に奥深さがあってオススメです。

マネー・ボール〔完全版〕

マネー・ボール〔完全版〕

勝てる野球の統計学――セイバーメトリクス (岩波科学ライブラリー)

勝てる野球の統計学――セイバーメトリクス (岩波科学ライブラリー)

プロ野球、メジャーリーグそして甲子園。

野球の暑い夏、試合もいいけどたまにはデータのお勉強をして違った視点での野球を見られるといいかもしれません!

おしまい

*1:この辺に成果があります、興味ある方は是非 http://www.manaslink.com/gadget_baseball

*2:彼の半生はマネーボール(書籍)が詳しい。警備員のバイトをしながら余暇でデータの研究を行ってたそうです。 http://ja.wikipedia.org/wiki/%E3%83%93%E3%83%AB%E3%83%BB%E3%82%B8%E3%82%A7%E3%83%BC%E3%83%A0%E3%82%BA

*3:リアルな野球とくらべてどうかと思うツッコミは多々あったけど面白いドラマだった!

*4:勝利、ホールド、セーブといった「実力だけでは評価できない」指標はセイバーメトリクス的にあまり意味が無いものとして定義されています。

*5:マネーボールの中では「クローザー売却益」と呼ばれている

*6:ピタゴラス勝率 http://ja.wikipedia.org/wiki/%E3%83%94%E3%82%BF%E3%82%B4%E3%83%A9%E3%82%B9%E5%8B%9D%E7%8E%87

*7: RC(Run Create) http://ja.wikipedia.org/wiki/RC(野球)

*8: DIPS http://ja.wikipedia.org/wiki/DIPS(野球)

*9:On-base Plus Sluggingの略。選手の攻撃力を評価する指標。出塁率と長打率の和が選手の大雑把な得点力に相関するという仮説の元生まれた指標で、メジャーリーグの公式記録にもなっている。

*10:先発投手の能力を表す指標。6回以上を投げて自責点3未満の試合数を数えて出す。ヤンキースの田中将大が連続QS記録!という話題により認知度が高まりつつある。

*11:打球情報のこと。Batted Ballと呼ばれる。

*12:Pitch f/xという発展型スピードガンで計測される

*13:アルティメット・ゾーン・レーティングの略。野手の守備力を評価する指標。

*14:投手と野手を並べて評価できるという夢のような指標。計算方法は非常に煩雑。

*15:スキルは勉強すればなんとかなるけどデータが絶対手に入らないorz