読者です 読者をやめる 読者になる 読者になる

Lean Baseball

Engineering/Baseball/Python/Agile/SABR and more...

野球好きが統計学を覚える為の学習フローを作ってみました〜解説を添えて

野球 統計学 セイバーメトリクス データ分析

こんにちは.野球(とグルメ)の人です.*1

ビックデータや統計学が相変わらずアツい話題になっている中,野球好きとデータ好きをうならせるこんな本が出版されました.

[プロ野球でわかる! ]はじめての統計学

[プロ野球でわかる! ]はじめての統計学

この本,早速読ませてもらってとても良い!感銘を受けた!!という感じなのですが,

  • そもそも世の中に野球統計学(セイバーメトリクス)の本が増えてきた
  • (野球好きでも)初心者がいきなり読んだら辛い本もあるぞ!
  • ???「ワイも野球データを集めて分析したいンゴ」

…などなど,クエスチョンやテーマができたので,

今まで学んだ・実践した野球統計学の学び方・本・データを整理するのにいい機会だ!

…ということで,

  • レベル別の本の選び方
  • オススメ書籍(三行レビュー付き)
  • 野球データ分析のはじめかた
  • 【オマケ】野球統計学から派生したビジネス書籍

について一筆書きたいと思います!

なお,お気づきの方も多いかと思いますが,このエントリーは以下エントリーの野球バージョン的な位置づけです.

shinyorke.hatenablog.com

対象読者

免責事項

Pythonの時のエントリーとほぼ同じですが一応書いときます.

  • あくまでも個人(shinyorke)の見解です,この内容が正解・銀の弾丸ではありません.
  • 世の中にある全ての野球本・Webサイト・手法を網羅しているモノではありません.「取り上げられていない野球本・Webサイトがダメ」ということではないのであしからず!
  • (当たり前ですが)所属企業・組織および,参加している団体・組織は一切関係ありません.

基本的に私の経験で書いてるものなのでご意見・フィードバックお待ちしております.

野球好きが統計学を覚える為の学習フローを作ってみました〜解説を添えて

というわけで,体系化してみた絵がこちらになります.

中身は順を追って解説します.

f:id:shinyorke:20170319101855p:plain

学習の順番とポイント

順を追って解説します.

野球のルール・データの読み方

球場やTV,ネットで一喜一憂して試合をみる…以上のルールおよびデータの解釈が必須です!

球場の情報やTV,ネットは試合を見るための最低の情報をうまく手に入れることはできますが,

  • 各指標(打率・打点・ホームラン)の本来の意味
  • 指標の算出方法
  • ヒット・アウト・得点etc…成績がつけられる条件とルールの把握

といった所での解釈を行うためには明確に学習が必要です.

暗記はしなくても良いので,是非とも公認野球規則(ルールブック)や審判向けの教本(実践向けのテクニックあり)を読むことをオススメします.

なお私のオススメは以下の二冊です!

公認野球規則は2017年版の発売を待ってます…

マネー・ボールは必読!

野球を統計学で革命した,マネー・ボールは必読の一冊です

物語としてもわかりやすく,重要なポイント(出塁率OPS,DIPSなど)についてはうまい具合に文章でまとまっている…だけでなく,

  • 野球統計学の背景や歴史,使われ方が載っている
  • ノンフィクションですべて現実のため,明確にイメージが湧く
  • ほぼすべての野球統計学本は,マネー・ボールを読んでいる前提でかかれている!

最後のポイントは私の印象論的な意見も含んでいますが,多分外していないです.

というわけで,マネー・ボールは読みましょう!

なお,(娯楽としては素晴らしいですが)映画版だけで済ませるのはNGです!

なにかやりたいぞ!…何をやろう?

重度の野球好きがマネー・ボールを読むと,

  • 実際の野球と照らし合わせてみてみたい
  • 手元にデータが欲しい
  • データを使って何か遊びたい

という欲が出てくると思います.

私もそんな一人で,野球データHackを4年前からはじめました.

やりたいことを明確にしつつ,本を読んだりデータを探して実際に手を動かしてみると良いと思います!

オススメ書籍(三行レビュー付き)

上記の体系表に載せた本の簡単なレビューです.

気になった本は是非手に取ってもらえると!

マネー・ボールを読んだ後のオススメ

野球統計学を学ぶ

マネー・ボールを読んで,「ピタゴラス勝率をもっと知りたい」「WARってなんぞや!?」的な統計指標を知りたくなったらこの本が良いです.

参考データが2013年の日本プロ野球なので若干古いですが,イメージを掴みつつ覚えるのに最適かなと思います.

一般的な統計学から入る

[プロ野球でわかる! ]はじめての統計学

[プロ野球でわかる! ]はじめての統計学

非常にオススメな一冊です!

統計学の基礎からセイバーメトリクス(野球統計学)の話題に入りつつ,Excelで分析・可視化をするという流れがわかりやすいかつ,

書籍サイトにサンプルデータ(Excel)が公開されているので手元で試すことも可能です.*2

野球データの取り扱いや分析の楽しさ(苦しさ)を覚えるのに最適な一冊かもしれません!

最新事例を知りたい

メジャーリーグの最新事例は「ビッグデータ・ベースボール」,日本は「野球×統計は最強のバッテリーである」がオススメです.

いずれも,最新のデータ取得手法,具体的には

  • Pitch f/x*3
  • TrackMan*4

といったものでデータを取得してそのあとどう分析するか?という話が詳しく書かれています.

個人的には「ビックデータ・ベースボール」にある「フレーミング」の話が面白くておすすめです.*5

野球データでなにかをやる!

日本プロ野球の統計データを知る

詳しいデータ解説や充実度を含め,「セイバーメトリクスリポート」がおすすめです.

プロ野球を統計学と客観分析で考えるセイバーメトリクス・リポート5

プロ野球を統計学と客観分析で考えるセイバーメトリクス・リポート5

  • 作者: 岡田友輔,道作,三宅博人,蛭川皓平,高多薪吾,Student,水島仁,神事努,森下義隆,神原謙悟,竹下弘道,市川博久,大南淳
  • 出版社/メーカー: 水曜社
  • 発売日: 2016/05/25
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログ (1件) を見る

メジャーリーグの統計データを知る

こちらはWebサイトがオススメです.

読みやすいのはBaseball Reference,マニアックかつ深いのがFAN GRAPHSですね.

www.baseball-reference.com

www.fangraphs.com

なお,上記サイトからスクレイピング…はちょっと大人げないので,Baseball Reference相当のデータ(一部無いデータあり)も貼っておきます.

Sean Lahman | Database Journalist ※選手名鑑&試合結果データ

Retrosheet ※試合&打席結果

Retrosheetで何ができるかはこちらのエントリーが参考になります(手前味噌パート1)

shinyorke.hatenablog.com

Rで分析をする

英語書籍かつ若干お値段が高いですが,R Studioを使った野球統計学の基礎…的な本があります.

Analyzing Baseball Data with R (Chapman & Hall/CRC The R Series)

Analyzing Baseball Data with R (Chapman & Hall/CRC The R Series)

R使いの方はこちらを写経してはじめるのも良いかもしれません.*6

アプリを作る,Pythonでコードを書く

こちらもこのブログのエントリーでいくつかあります(手前味噌パート2)

shinyorke.hatenablog.com

shinyorke.hatenablog.com

shinyorke.hatenablog.com

shinyorke.hatenablog.com

野球データ分析のはじめかた

シンプルに,

  • 好きなチーム・選手を分析する
  • プログラミングや統計の勉強ネタとする
  • とにかく触って楽しむ!

がいいかなと,と思います.

私がはじめたキッカケもそんな感じで,野球のソーシャルゲーム「fantasy baseaball」で何が何でも勝ちたくなったのがキッカケでメジャーリーグの分析をはじめました.

ここはやはり「好きこそものの上手なれ」が基本だと思います.

【オマケ】野球統計学から派生したビジネス書籍

最近読んだ本ですが,野球統計学,特にマネー・ボールから派生して出てきた良著があるので紹介します.

シグナル&ノイズ

シグナル&ノイズ 天才データアナリストの「予測学」

シグナル&ノイズ 天才データアナリストの「予測学」

野球選手の成績予測モデルおよびシステムを作ったネイト・シルバーが米国大統領選で野球統計学を駆使した話を中心に,データの取り扱いについて語っています.

採用学

採用学 (新潮選書)

採用学 (新潮選書)

会社における採用とは…という本で一見すると野球統計学と全く関係がなさそうなのですが,

統計学を駆使してお金持ち(ヤンキースレッドソックス)に貧乏球団(アスレチックス)が勝った考え方と行動は現在の採用活動の大きなヒントだよ!

という序章から始まっており,言い得て妙だなと思いました.

野球選手の「補強・獲得」を会社における「採用活動」に例える,という点で良かったので是非ともオススメします!

というわけで,

素敵な野球統計学ライフを!

*1:ここ二ヶ月でTVに出たり体重が4キロ減ったりなど,色々ありました

*2:なお私は試していません

*3:高性能スピードガンのこと.ボールの速度だけでなく,回転数や座標位置,角度を元に球種や球威を取得できるすごいマシン

*4:打球の速度や走塁,野手の動きを記録(トラッキング)してデータ化する計測器.日本でも導入が進んでいる

*5:捕手がストライクを取る能力を示す指標.平たく言うと「いかに審判を騙してストライクをとっているか」がわかる

*6:なおこの本のデータセットを手に入れるPythonのlibraryを開発して公開しています. https://github.com/Shinichi-Nakagawa/pitchpx

野球とデータ好きエンジニアの為の野球選手名鑑の選び方

野球 Baseball セイバーメトリクス

今年初の野球ネタな気がする.

こんばんは,野球Pythonの人(もしくはスクラムマスター)です.*1

プロ野球オープン戦がはじまり,WBCも来週から一次リーグ…ということで,野球大好きな皆さんはきっと野球選手名鑑を買われていたり,どこの名鑑を買うか悩んでる頃合いかと思います.

そんな野球大好きな皆さま,特にデータが好きな・気になるエンジニアにとって最適な野球選手名鑑の選び方を紹介したいと思います.

なお,完全に私の主観なので異論は認めます!

野球選手名鑑とは?

このエントリーを読んでる方には説明不要かと思いますが念のため.

いわゆる,「今シーズン開幕直前の選手の一覧とデータが載ってる」名鑑のことです.

野球選手名鑑を選ぶ時のポイント

完全に私の主観ですが,こんな感じで選んでいます.

重要視するポイント

これがないと選ばないし買わないぐらいのポイント.

  • セイバーメトリクス指標が複数掲載されている
  • 指標に合わせたビジュアライゼーション.具体的には絵図やグラフが多いこと
  • 出版社・著者の主観ではなく,データを元にした客観的な選手・チームの評論がのっている

あれば嬉しい

データに加えて,想像力を掻き立てられる情報.

これらがあると読んでて凄く楽しい

  • 過去5年,最低でも過去3年の主要成績
  • 年齢,出身校,ドラフト順位など,最低限のプロフィールがわかる情報
  • 読んでて何の役にたつかわからない,笑えるエピソード(例:左腕だけどギターは右利き,ペットボトルにゴ◯ブリを入れて飼育)

無くても良い

  • ググれば分かる程度のエピソードとか数字
  • 「和製ランディー・ジョンソン!」「◯◯のイチロー」とかいう微妙な例え話
  • 「シュアなバッティング」「走攻守三拍子揃った」とかいう希望的観測

オススメの野球選手名鑑(NPB/MLB)

実はここ3年同じ名鑑だったりするw

NPB

  • データスタジアムとSluggerがタッグを組んで作ってる
  • WAR,OPS,FIPなどほしい指標が全て乗ってる
  • ビジュアライゼーションのセンスが凄く良い
  • でいて,選手のエピソードがいい意味でくだらないw

  • ポケットに入る系では一番完成度高い
  • 得意なバッティングゾーンや投球割合が小さいスペースでもわかりやすく載ってる
  • セイバーメトリクス指標がないのが惜しい

MLB

  • 日本語で一番詳しいMLB選手名鑑
  • セイバーメトリクス指標が詳しいのみならず,選手のタイプ(積極/待球,ゴロ/フライ)などがわかり易く掲載されている
  • 40人Rosterもしっかりのせてる
  • 何気に首脳陣やフロントメンバーの解説があって面白い

さらにマニアックな指標や考えを知りたい方へ

毎年新作が出ているセイバーメトリクスレポートなんかもオススメです.

なおちょっと高いです&割と専門的な知識が必要なことを付け加えておきますw

プロ野球を統計学と客観分析で考えるセイバーメトリクス・リポート5

プロ野球を統計学と客観分析で考えるセイバーメトリクス・リポート5

  • 作者: 岡田友輔,道作,三宅博人,蛭川皓平,高多薪吾,Student,水島仁,神事努,森下義隆,神原謙悟,竹下弘道,市川博久,大南淳
  • 出版社/メーカー: 水曜社
  • 発売日: 2016/05/25
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログ (1件) を見る

なお,まだ発売前ですがこんな本もあるみたいです.

[プロ野球でわかる! ]はじめての統計学

[プロ野球でわかる! ]はじめての統計学

むすび&(少しだけ)宣伝

そら(面白いデータとグラフと)

そう(どうでもいいエピソードがあったほうが選手名鑑として面白いに)

よ(決まってるじゃないか)

そしてちょっと宣伝ですが今年も #BPStudy の野球版, Baseball Play Studyでやきうの統計学についてお話をさせてもらうことになりました!

bpstudy.connpass.com

日ハムの今季をデータで分析…と見せかけて,ソフトバンクホークスのネタをやらせていただこうと思っています!*2

皆様ぜひ遊びに来てください!

*1:なお社内では略して「スクマス」と呼ばれています

*2:PyCon mini Kumamoto 2017の壁打ちだったりする

1月をふりかえる - 転職後どうなの?&野球統計の授業ほか

日記

久々に日記らしい日記を書こうと思います.

こんばんは,野球の人です.

嵐のように過ぎ去った1月をふりかえりつつ,2月のことをちょこっと書こうと思います.

ポエムではありませんがほぼほぼ自分メモに近い内容ですのでちょっと読みにくかったらごめんなさい.

日記のテーマは,

  • RettyにJOIN後1ヶ月のあれこれ
  • 野球統計学の授業を受けました
  • Pythonのあのエントリーと今年のPythonistaな活動について
  • プライベート&2月について

です.

RettyにJOIN後1ヶ月のあれこれ

自分の意志と周りの助け,そして様々なご縁があってRettyにJOINしたことは先月(¼)のエントリーでご報告させてもらいました.

shinyorke.hatenablog.com

1/10からJOINして約一ヶ月経過した,今のステータスと気持ちをつらつらっと書きます.

野球の人はRettyで何をしているのか

転職エントリーでは具体的に何をしているか?の言及は無かったので,ここで改めて.

現在(2/7)現在での自分の役割は,

  • 主にお店さん*1が使うサービスのエンジニアチームのLead Engineer(Tech Lead)
  • DevOps/Agile/Scrumといったプロセス・アプローチを使った開発チームのコミュニケーションや業務改善
  • 採用系エンジニア兼IT芸人エンジニアちっくな広報

その他,インターンさんのメンター(予)や社内の機械学習もくもく会(Python)のプロデュースなど,エンジニアがやりそうな役割はほぼやってる感あります.

お店さんが使うサービスのLead Engineerとしては,

  • チームのスクラム化(ほぼほぼScrum master業務)
  • 技術負債の解消やKPI・数値の見える化
  • Webサイトそのものの安定稼働のためのプロダクトオーナー業務

というかんじで日々奮闘していて,スクラムの役割的には,

7:1:2(Scrum master:Product Owner:Engineer)

ぐらいの比率で帽子をかぶり変えつつやってます.

なお,チームについてはみんな学習ややることの吸収が早く,プロダクトオーナーが強烈なオーナーシップを握ってくれる&ほぼ99%の事を任せてもらえているため,史上最高にやりやすいです.

また,DevOps/Agile/Scrumなお仕事は他のチームにも入ってやっていて(社内アジャイルコーチ的な役割が近いかも),こちらのお陰で自チーム以外とのコミュニケーションがとれたり,お互いの認知が早くなったりと早くも効果がでている気がします.

そして前職から引き続き担当させてもらっている採用系エンジニア&広報エンジニア業では(Pythonエンジニア仲間を増やすため?)PyData.TokyoでLTをキメたり,

社内勉強会で公開してかなりいい感じだったアジャイル導入&スクラムやろうぜ!な勉強会資料を公開したりなど,チームRettyの協力の元様々な事をさせてもらっています.

www.slideshare.net

www.slideshare.net

「全部お前のLTじゃねーか!」というツッコミはさておき(笑),資料の磨き込みやアドバイスなどで全員が協力してくれたり,資料公開については大変オープンで寛大なところがあったりと,「広める努力」「協力を惜しまない心」は本当に凄いなと感心しました.

そんな一ヶ月はこんな出来事もあったりしてまあ良かったのでは満足(とほんの少しの悔しさ)を感じています.

今月は本気で月間MVPめざしてがんばります(真顔)

JOIN後のHappyとTry

JOIN後のHappy(良かったこと)とTry(がんばる)ところをサクッと.

Happy

「信じてまかせる」文化

JOINして数日の私にいきなり採用の仕事が回ってきたり,スクラムマスターとして必要な道具や権限をプロダクトオーナーに相談→即答でOK…などなど,

User Happyのために必要なことはすべて信じて任せてくれる文化は素晴らしいと思いました.

いままでのチームはしばらくの間権限無かったり承認リレーが続いたり等など大変でしたが,すべてを信じて任せてもらえるお陰でスピーディーかつ熱量が下がる前にミッションをDone!できたりととても気持ちが良かったです.

「とにかく話す・対話する」「お互いの話を聞く」やさしい世界

対話・話す・相手を尊重する,と言ったところが全メンバーに浸透しており,何か議論になったときにもしっかりお話を聞き,咀嚼して対話するという事がシンプルにできていると思いました.

また,普段のコミュニケーションはSlackで行っているのですが,オリジナルのスタンプやスレッド機能を上手く使って腹落ちするまでコミュニケーションをとっており,「うやむやのままで終わる」事が殆どないことに驚きを感じました.

Try

木を見て森を見る習慣を浸透させる,プロセスで

隣のチームやプロダクトを巻き込みながら成長する,Rettyでは「Ownership」と呼んでいるWayがあってこのお陰で成長はしてる実感はある一方,「巻き込み」の為の情報取得にコストが掛かってる感があるので,こちらは徹底的な見える化や文化づくりでもっと楽に・もっと巻き込みを進めたいなあと思っています.

これは結果がでたらアジャイルな文脈で外に出られたらいいなと夢想しています(個人の見解です)

ゼロベースで大きく考える

日々のKPIやQuarterのミッション,だけでなく「ゼロから考えて物事を大きく考える・推進する」ような「ゼロトゥーワン」な考え方もちょっと入れていきたいなと.

RettyのWayにも「Think Big」という項目があるので,もっと大きく考えて動いていければなと思っています,すっごくコミュニケーションがとれていいチームなので.

野球統計学の授業を受けました

恒例の野球Hack(野球×Python)の完成度をより高めるため,2017年に入ってからこんな講座を受けていました.

www.wuext.waseda.jp

野球データ分析・統計専門の組織DELTAのノウハウを教える1時間半×4コマの授業をつい先日(2/4)まで受講していました.

内容はセイバーメトリクスや日本プロ野球の2017年展望,野球統計モデルの基礎といった内容で,授業の内容そのものはNDAなので触れることはできませんが,大凡以下のエントリーに書いてること・本を理解できたら普通にわかるんじゃないか?という内容でした.

shinyorke.hatenablog.com

shinyorke.hatenablog.com

今思えば独学&野球Hackで授業の内容の7割程度を理解してたことをココに素直に報告します*2…が,ゼロから学びたい方にとっては安い授業料で濃厚な時間を過ごせるかと思うので,ホントにオススメです!

Pythonのあのエントリーと今年のPythonistaな活動について

「あのエントリー」の顛末

前回のエントリーが予想以上にバズり,とても驚いた&感謝しています.ありがとうございます(._.)

shinyorke.hatenablog.com

このエントリーの構想は去年の10月(PyCon JP 2016終了後)から密かにあったのですが,PyCon mini Hiroshimaや転職活動,プライベートのバタバタが続き書けなかった→年明け転職終わった後に「まあ200ブクマは集まるんじゃないか」という思いで書いた結果想像以上の大ヒットになりました(震え声)

個人的には,

  • プログラミング学習はそもそもどこからはじめるべきかを整理したかった,もっというと「本を読むだけが勉強じゃないんじゃ!」ってのを大きな声で言いたかった.
  • 「本当にプログラミングする必要あります?」「なんでPythonである必要があったのか?」などなどを自問自答するようなフローが欲しかった.
  • 人に会ったり相談を受けるたびに「Pythonはじめたい」と聞かれ同じ答えを334回(誇張)言うのに疲れた.

というテーマで一気に書き上げてホント良かったと思っています.

今年のPythonistaな活動(予定)

仕事でもPythonはちょこっと触りますが,まあやっぱり野球はやりたいなと思っています.

そして,Rettyでは「魚料理担当」という大好きかつ大きいワードの担当になったので,

魚料理×Pythonでなんかやるブログ

Pythonで作りたいと思っています.

なおキッカケはこちらです.

という訳でMezzanine*3デビューしようと思います.

mezzanine.jupo.org

プライベート&2月について

プライベート

1月にあったこと.

  • 転職祝をたくさん頂いた,ありがとうございました!!
  • Retty魚料理担当になったんだから!!!…という感じでいくつか飲み会をやってもらったりお店を紹介してもらった.いい寿司食ったり,野球の授業終わりに行った「焼鳥には打順があってレバーは3番」「南蛮漬けは総合格闘技」という謎理論が出てきた八丁堀の夜は最高だった.
  • 何故か2kgほど痩せた,いいもの食ってるのに.

2月(抱負)

  • 月間MVP目指して頑張りたい
  • PythonのためにMezzanineを覚える&Deep Learning本を読了する
  • しっかり体のケアして健康に過ごす

まだまだ寒かったり変な天気だったりするので健康には気をつけよう!

お後がよろしいようで.

*1:一般用語だと「クライアント」「店舗」なのですが,User Happyを大切にするRettyでは「さん付け」で呼んでいます.ちなみにユーザーは「ユーザーさん」です.

*2:受けてムダではなかったけどもうちょっと歯ごたえほしかったなあ…実際に計算するとかそういうのを期待してたのに残念

*3:一言で言うと「PythonWordPress」という感じのCMSDjangoがベースになってます&日本でも幾つか運用事例があるそうです.WordPressに疲れたのでPythonを(真顔)