Lean Baseball

No Engineering, No Baseball.

推しは推せるときに推せ - 北海道日本ハムファイターズの推しがどこまで成績を残すか?をAIに聞いてみました.

現役時代の阪神タイガース新庄剛志(現・北海道日本ハムファイターズBIG BOSS)に憧れて野球ファンになった人です.*1

今シーズンのここまでの流れで興奮しないはずがありません, 開幕三連敗?知らんがな*2.

もっとも, 「野球エンジニア」「野球データサイエンティスト」を趣味(もしくは人生の暇つぶし)としてやっているもうひとりの私は,

  • ぶっちゃけ今シーズンは「三年後に日本一を目指す」3ヵ年計画の1年目
  • 目の前の勝敗も当然大事だが, 若い選手が出場機会を重ねて成長するのが最も大事
  • 3年後(2025)に推しが無双する時に備えて「推しは推せるときに推せ」的なシーズンを過ごせばよいのでは!?

幸いにも, 私の手元には自ら開発した「メジャーリーガーの成績予測」および, 「TOKYO 2020侍ジャパン選出」を果たした「やきうAI」があります.

というわけで, このエントリーでは,

日ハムの推し若手が3年後...いや5年後どんな選手になるのか🤔

をやきうAIに聞いてみました.

なお, 今回取り上げるのは以下の5選手です(野手のみです, 投手編*3はやれたらやりたい).

  • 地元北海道出身*4, 内野のユーティリティとして使い勝手がウリ「佐藤龍世
  • 一発がある意外性の打撃と強肩が魅力のキャッチャー「清水優心
  • 左のアベレージヒッターで攻走守のバランスがとれたTHE外野手「淺間大基
  • 未来の四番打者, 長打力が魅力のサード「野村佑希
  • パワーとスピードを兼ね揃えた, フィジカルモンスター・タイプなプロスペクト「万波中正

なお, 私のイチオシは(奇しくもこの記事を書いている最中に第一号同点2ランを打った)万波くんです(先日札幌ドームでみました).

f:id:shinyorke:20220327135532j:plain
私の推しです

3.34秒で言うと

万波中正選手, 野村「ジェームズ」佑希の未来に自信ニキなので今後も推していくぞ!

浅間, 清水, 佐藤も頑張れ!

本日のスタメン

推しの未来をAIで占うための技術

まず, 今回用いた「やきうAI」ですが, 昨年「野球AIが選ぶTOKYO 2020侍JAPAN24名」のネタで使ったモノをそのまま利用しています.

shinyorke.hatenablog.com

予測に使ったデータはメジャーリーグのオープンデータ「Lahman’s Baseball Database」で,

  • 予測したい選手(推しの5人)に, 似ているメジャーリーガー150人を選出
    • 何故メジャーリーグかというと, 予測に必要な特徴量を手に入れるのに最も手っ取り早かったからです.
    • 同じ競技の同じ成績項目かつ, 何だったらメジャーリーグの方が歴史が長いので選手の類似性とかもよりリアルな可能性もあります.*5
  • 上記で選出した選手の成績(こちらはBaseball Referenceから抽出)を, 推しの年齢を元に抽出・パーセンタイルでそれっぽい値を算出
    • 例えば万波選手は現在21歳(今年22歳)なので, 似ているメジャーリーガーの22〜26歳までの成績を算出

という方法で算出しました.

成績は以下の項目を予測しました.

  • ヒット数(H)
  • 本塁打(HR)
  • 打点(RBI)
  • 打率(avg)

なんのひねりも無いので特に説明は不要かなと笑

なお, ちょこっとだけ雑談すると,

  • データがすべて英語(日本のデータは使ってないです)なのでグラフ内の表記も英語なことをご了承ください*6.
  • 収集したデータをGoogle BigQueryに保存後, Pythonでクラスタリングやら予測成績の算出を実施. 詳しくは過去記事にあります.

アルゴリズムの観点・考え方はこちらをご参考ください.

shinyorke.hatenablog.com

推しの未来日ハム編

という訳で推しの5人の成績をAIに聞いてみました.

佐藤龍世

うまく育って「和製ベン・ゾブリスト」になってほしいと思ってる佐藤選手.

5年間の成績推移予想はこうなりました.

f:id:shinyorke:20220327144259p:plain
これは隔年で活躍するやつ🤔

今年(25歳)は微妙で来年と4年後いい感じになりそうとやきうAIが言っています.

3年後

3年後(27歳)の予測成績

打率.230 5本塁打 35打点

143試合つかったらこうなりそう感ヤバいです, いや, 143試合使うならもっと頑張れなのか🤔

前述したとおり, やきうAIは隔年で活躍すると言っていまして,

  • 26歳の予測成績「打率.298 10本塁打 68打点」
  • 26歳の予測成績「打率.273 11本塁打 63打点」

前後の年が相当イケてるというのがわかりました.

清水優心

キャッチャーはどんぐりの背比べ感ある日ハムで頭一つ抜け出せるか?

f:id:shinyorke:20220327145135p:plain
こういうキャッチャーいるよね的な成績に

思ったよりありきたりなキャッチャーっぽい成績に収束するというお告げがでました.

3年後

3年後(28歳)の予測成績

打率.257 10本塁打 39打点

キャッチャーとしては合格点なのですが, 実際のところホームランはもっと打つんじゃない?感あります.

が, リアルにこの成績残しそうな気もしていてこれはこれで楽しみです.

先程の佐藤龍世もですが, キャッチャーと二遊間やれる内野手は守備の貢献も大事なのでそっちで頑張ればよいのかなとも思ったり.

淺間大基

左打ちで俊足巧打の外野手という日本の野球でいかにも好まれそうな浅間さん.

f:id:shinyorke:20220327145710p:plain
今回の調査で最も意外な結果に...

アベレージタイプかと思いきや, 「二桁そこそこホームランを打つ, 下位打線み溢れる」成績を残すと出てきました.

正直に言う, この予測外れてほしい.*7

3年後

3年後(28歳)の予測成績

打率.247 15本塁打 47打点

これでセンターだったらギリギリ許されるけど, ライトもしくはレフトだったら🤔

「率は残せませんよ」というこのAIは何を根拠に言ってるのかちょっと気になったのでこれは引き続き調査したいです.

個人的な感覚ではちゃんと年間通しで出られたら(体力がついたら).270は打ってくれそうな気がします.

野村佑希

守備はさておき, 長距離砲としてRBIマシーンとして期待したいジェームズさん.

f:id:shinyorke:20220327150155p:plain
3年後がキャリアハイという予測に!!!

これはキター!!!

エスコンフィールド不動の四番サードは決まったも同然かも.

3年後

3年後(24歳)の予測成績

打率.300 34本塁打 113打点

ガッツが現役時代に残しそうな数字に.

ここまできたら日ハムの四番どころか, 巨人岡本・ヤクルト村上と覇を競うサードになるぐらいのインパクト.

もっとも, ジェームズは故障がちで開幕一軍に入れなかった(二軍では試合に出ている)ので, まず怪我をしない強い体を作って欲しいお気持ちです.

万波中正

いよいよ来ました, 私のイチオシであるマンチュウさんです.

現役時代のBIG BOSSと最も近いんですよね, 「強肩強打の右打ち外野手(なお打撃は粗い)」

f:id:shinyorke:20220327150606p:plain
若手時代のBIG BOSSっぽい成績が来たぞ?

長打と打点を残すけど率は残らないという, いかにもな推移ですね.

3年後

3年後(24歳)の予測成績

打率.228 22本塁打 70打点

BIG BOSSも現役時代, 似たような成績残してなかったっけ?と思い調べてみた所24歳(1996年)の成績が,

打率.238 19本塁打 66打点

と奇しくも24歳時と同じような成績を残してましたw*8

これ, 今回イチの発見かもしれない.

万波の守備位置はライトもしくはセンターかと思うので, この予測成績はほんとに最低ラインの数字かもと思いました.

どう考えても打率を残すようなバッティングはしていないので, とにかく元気にバットを振ってホームランを量産, 守備で貢献してほしいと強く思いましたとさ.

BIG BOSS日ハムの未来は明るい

というわけで, 「推しは推せるときに推せ」と称して5人の選手の未来を紹介しました.

ジェームズが若干出木杉(&浅間と清水の評価が微妙に低い)のが気になった以外, ぽさが出ていて面白いと思いました.

なお, 他球団のやつもやろうと思えばできるので引き続きちょっと遊びたいと思います.

2022年プロ野球は始まったばかり, 盛り上げていきましょう⚾

Appendix - 真似をしたくなったら

この辺の書籍・ブログを御覧ください.

shinyorke.hatenablog.com

*1:という話は語ると長くなるのでこちらに譲ります.

*2:本当の開幕は札幌ドームとかいう説もあるらしいですが果たして?

*3:投手もやれなくも無いのですが, もうちょっと精度を磨きたいので今回は控えます...🙏

*4:調べてびっくりしたのですが、まさかの道東出身でした. 厚岸町は自分の故郷(斜里町)とそう離れていないという(北海道の感覚だと)

*5:どの特徴量を使ったかは秘密ですが, ポジションを考慮しているため, それなりの数字になりました.

*6:日本のデータを使ってないのは主にライセンスと使いやすさの問題

*7:万波もですが, フィジカルあって守備と走塁上手い外野手好きなので

*8:BIG BOSSの現役時代, 毎日打率を計算していた時期があったのでなんとなく覚えていました&Wikiとか見たら合ってた.