野球と春のG1🏇で浮かれている者です, どっちも結果は微妙ですが楽しくて最高ですね.*1
野球(メジャーリーグ)という球技でも, グラウンドの外*2でも話題を振りまいている大谷翔平(オオタニサン)という(現時点で)世界一有名な現役選手(私の私見です*3)がいます.
既報の通り, 昨年痛めた右肘とその治療の影響で本年は打者専念つまり「二刀流は封印」している訳ですが,
ワイ「打者専念したら三冠王だのトリプルスリー(3割30本30盗塁)だの周りは勝手に言ってるけどそんな単純な話でしたっけ???
という一つの疑問が生まれました. 確かに打者でしかプレーはしないものの, 投手としてのリハビリなりトレーニングだってあるはずなので単純な話じゃないぞ*4と.
私個人はいつの日かオオタニサンがトリプルスリーをやってもおかしくないし, 三冠王*5だって可能性はあると思っていますが,
取り急ぎ「今(2024年)のオオタニサンと去年(2023年)のオオタニサンの違いが知りたいぞ!?」と思ったのでちょこっとデータを調べてまとめてみました.
なお, データはいつもどおりStatcast(Baseball Savant)を使っています, 真似したい人はこのブログの過去記事から検索するか, 初歩的なモノであれば最近出たこちらの書籍が良かったので興味ある方は読むと良いのではないしょうか*6.
本ブログの読者の皆様, 大変おまたせしました2024年初かつ超久しぶりの野球ネタです⚾*7
2024年と2023年の違い
2024年のオオタニサンはフライな強い打球が多く, なんとなくキャラ変していると思われる. なお昨年の今時期はゴロ多めの「ゴロキング」でした.
意図的なのかわかりませんが, 少なくとも去年の前半戦と違う印象はあります.
2024年のオオタニサン
この手のデータ分析の基本として, 大雑把にデータを眺めてみました.
- Statcastが判定する打球の質. Barrel, Flare/Burner, Solid Contactが強い打球と判断.
- DIPS(プレーヤーの自己責任となる結果)の割合に基づく評価. 一言で言うと「自己責任となる比率が高いプレー*8」のこと.詳細な説明が厄介なので知りたい方は過去エントリーを御覧ください.
- スコアブック的な意味での打球の質. フライ性の当たりが多いか, ゴロが多いか, ポップフライが何本あるかetc...
打者も投手もこれらを見ると大凡の輪郭がつかめるのでおすすめです, 個人的には.
今年のオオタニサン, 強くてフライ気味の打球が多かったです.
韓国で開催された開幕戦の時は割と鋭い当たりが多かったので, 打球の強さはイメージ通りでしたがフライ比率が割とあったのは意外でした.
もうちょい掘った考察は...2023年の傾向を見た後に.
2023年前半戦のオオタニサン
同じ視点で2023年4月期のデータを見ました. 厳密な試合数は違う気がしますが, あくまで雰囲気を掴むのが目的なのでご容赦ください🙏
今年との違いは所属チーム(ドジャースとエンジェルス*9), WBCの開催有無そして通訳*10ぐらいでしょう.
なんか思っていたイメージと違った...去年の記憶が曖昧ってのもありますが.
ただ, 「オオタニサン以外が抜けがち」な2023年のエンジェルス打線と, 「仮にオオタニサンが抜けても, オオタニサン以外の1人2人が抜けても強そう*13なドジャース打線」の質がぜんぜん違うのはよくわかります*14.
少し比較してみる
2024年と2023年(4月)の傾向の違いがなんとなくわかりました.
もうちょっと中身を見てみたいので,
打球の到達位置
: 逆方向(レフト方向, いわゆる「流し打ち」)が多いのか引っ張っているのか?打球速度と角度
: 最近(と言っても5年以上経過していますが)の理論である「バレルゾーン」に着目. このゾーンは「打球速度」「打球角度」で大凡の傾向がわかるのでそれを確認.
この2つを眺めることにしました.
打球の到達位置
2023年と2024年で傾向が真逆.
2024年(今年)は長打(二塁打, 三塁打, 本塁打)が逆方向からセンター, いわゆる「流し」が多く, シングルが引っ張り.
2023年(去年)はややサンプルが足りないものの, 雰囲気的に長打は引っ張り.
チームが変わったのかプレーが変わったのか(またはその両方)かわかりませんが, ちょっと傾向が違うのは面白いなと思いました.
なお, 打順については考慮していませんが今年は2番, 昨年も1, 2, 3番をうろついてたと思うので打順の考慮はまあいらない気がします.*15
打球速度と角度
2024年は「フライボーラー・オオタニサン」で2023年は「ゴロキング」っぽさあり.
縦軸: 打球角度, 横軸: 打球速度
で表したグラフでざっくり見ました.
オオタニサンの本塁打は昨年まで「打球速度が180km/hに迫るor超える」「打球角度は思ったより低い」傾向な印象でしたが今年は逆.
角度がついていて, 打球速度がほどほどでした. 「ほどほど」と言ってもオオタニサン比で低いだけで十分速すぎる*16打球なのですが...
ただ, 全体の打球速度が下がってるようには見えず, むしろエグい当たりも量産しているので怪我とか不調がなければそのまま量産モードに入りそうな気もします.
そして昨年4月期のデータはこちら.
あくまでも私の印象・感想ですがこのデータはイメージ通り. 打球速度が速いとホームラン, 低いと他の結果. わかりやすい.
125km/hちょいの二塁打がありますが, これは多分足で稼いだ「内野二塁打」かもしれません.
【おまけ】今年デビューの人たち
ここでブログとして終わってもいいのですが, 今年からメジャーでプレーしているこの二人もついでに見てみました.
- 山本由伸
- 今永昇太
山本由伸
いい意味で「想定通り」メジャーで通用している印象, ドジャースでエースになる可能性待ったなし.
開幕二戦目のデビュー戦の惨劇でどうなるかと心配しましたが*17, だいぶ温まって来たのか心配は杞憂に終わりそうです.
三振取れていてかつゴロ性の当たりが多いというのはバックの守備が強力(ですよね?多分)なドジャースだったら勝ち星量産してもおかしくなさそう.
何よりも球種が多彩かつ, 160km/hに迫る4シームがあって制球効くのはずるい.
今永昇太
今のところ順調ですが, 若干注意が必要(運に恵まれてる可能性もある).
なお, 今日(現地時間4/13)のデータはまだありません🙏*18
「左の速球派は制球さえ効けば簡単に打てない」と自分は勝手に思っている(それが先発ならなおのこと)のですが, それにハマってる感あります.
流石の奪三振マシーンぶりですが, フライ系の打球判定が多いのでそのうち「メジャーの洗礼」を浴びそうな予感もしています.
結び
というわけで, 気になっていた「オオタニサンのモデルチェンジ」について書いてみました.
ここまで好き勝手書いて言うのもアレですが言うてまだ開幕して半月程度なので今年の傾向はまた変わる可能性はあります.
オオタニサンが突然ゴロキングになっても, 今永がずっと無双しても, 由伸が突然炎上しても驚かない様に野球データサイエンティストとして今後も客観的な数字と視点(と野球愛)に真摯に向き合ってネタを出していきたいと思います.
ここまでお付き合いいただきありがとうございました, もっと野球を楽しみましょう!
【次回予告】野球データをシュッと分析・可視化する技術
今回のグラフ・素材は自作した野球データ分析システムで作成しました.
自作のデータ分析システムがいい感じに稼働し始めたので色々試している.
— Shinichi Nakagawa / 中川 伸一 (@shinyorke) 2024年4月14日
Yoshinobu Yamamotoさんの投球がエグいなーー.
今はデータの可視化だけだが「なんちゃってな数式」でもいいから3D表示とか変化量もそろそろ出したい(そんな開発時間があるかは別として). pic.twitter.com/beWbStQuHj
データ基盤およびインフラはGoogle Cloud, メイン開発言語はGoとPython*19, グラフ描画およびダッシュボードのシステムはdashのOSS版(Python)を用いています*20.
Google Cloud関連の技術記事はこちらを御覧ください&GW前後を目処にdashの話はこちらのブログで公開します.
ちなみに弊ブログはあくまでも「技術ブログ」なのでこの手の話こそ真摯に取り扱います💻
*1:厳密に言えば日ハムが勝率5割前後でウロウロしているのは満足行く結果ではあります, この後本当に勝ち進んでいくのか謎ですが(小声). なお馬券は聞かないでください.
*2:飼い犬とご結婚そして違法ブックメーカーに手を染めた通訳の件であることは言わずもがな. なお, この「Lean Baseball」というブログは技術と野球に真摯に向き合うメディアなのでこのネタには一切触れません(そっち方面で話したい人は他のメディアを御覧ください).
*3:と言っても言い過ぎではないでしょう.
*4:世の中のメディアだとここに対するツッコミが無いのが気になります. 投手が肘とか肩とかやったときってリハビリが実戦以上に辛い気がするのですが.
*5:トリプルスリーは盗塁数, 三冠王は打率が足かせになりそうですが. どっちと言われたらトリプルスリーの方が現実味ありそう(今のメジャーリーグはルール改変で盗塁し放題のため).
*6:感想ブログとして書く予定はありませんが確かなのは野球好きな方がデータ分析を学ぶのには良い本です, おすすめします.
*8:本塁打, 三振, 四球が該当. 野手の守備や運・イベントでの影響が少ないプレーが該当.
*9:ユニフォームの色以上に違うなーって思いますね(こなみ)
*10:違いがどれぐらいプレーに影響するかはセイバーメトリクスでもデータサイエンスでも無いのでここでは割愛.
*11:読売のレジェンドでヤンキースで活躍したあの方の渾名ですがそれは気にしないでください, 言い回しが便利だったので使っただけです(同じ左の強打者なので).
*12:余談ですが元祖ゴロキングも1年だけエンジェルスに在籍しています(ヤンキースの後に).
*13:特にムーキー・ベッツが異常. 二遊間をハイレベルに守る本職外野手がトリプルスリー待ったなしな打撃を毎年のようにしているのはずるいと思う(褒め言葉).
*14:本線と関係ありませんが, エンジェルスというよりトラウトはいい加減ちゃんと試合に出る努力をすべきかなと. いつまでセンターに居座っているのか(レフトかライトいや1塁でも良いかと)
*15:これは私の好みの問題ですが分析する時にあまり打順は考慮してません. 理由はシンプルで「使いたい打者ほど若い打順を打つはず」だからです(若い打順の方が試合でより機会が巡るため).
*16:データで見ると分かるのですが, 打球速度が180km/h超える選手はたいてい化け物です. 通常は160km/h超えたら一流レベル.
*17:真面目な話, 「右のigawa」扱いされてもおかしくなかった結果だと思ってます.
*18:明日の朝になればデータはあるのですが待てなかったので今回は断念.
*19:この辺は今年のPyCon JPにCfP出したいと思っています.
*20:余談ですがデータ基盤のWorkflowはprefectです.