Lean Baseball

No Engineering, No Baseball.

セイバーメトリクス

阪神の「アレ」の秘密は投打ともに「お散歩」だった - セイバーメトリクスで「そら、そうよ」と納得した理由

阪神タイガースさん「アレ」おめでとうございます(今更感) 野球ファンの歴史を阪神ファン(厳密に言えば新庄剛志のファン)でスタートした私(参考文献), 今は日ハムのファンなれど阪神18年ぶりの「アレ」は心からうれしく思います. 現在は野球とは無縁の…

地味すぎる強打者「ブレント・ルッカー」に着目せよ - メジャー屈指の弱小チームで突然打ち出した理由を考える

日本プロ野球は北海道日本ハムファイターズ, メジャーリーグはオークランド・アスレチックスのファンをやっている者です. この両チーム, 共通点がまあまあありまして, 監督が外野手かつ現役時代が当該チームのセンター(もちろんスタメン)*1 良く言えばチー…

私たちはラーズ・ヌートバーがWBC2026侍JAPANに来ることを期待してよいか? - AIに約200ドル投げて占った結果

WBC2023侍JAPAN優勝で興奮している皆さんこんにちは*1. 野球知識と野球愛, エンジニアとしての技術力そして私の週末となけなしのお小遣いを犠牲にして野球ネタをお届けするブログ「Lean Baseball」のお時間がやってまいりました*2. 皆さんに伺いたい. 今年1…

君は「ラーズ・ヌートバー」という選手を知っているか? - 侍JAPAN入りすべき3つの理由

皆さんこんにちは. 野球がオフシーズンな今時期はシーズン開幕に向けてデータを整理・眺めたり, 個人的な野球データ分析システムを構築しているマンです. いきなり本題ですが, ラーズ・ヌートバーという野球選手をご存知だろうか? ja.wikipedia.org 阪神の(…

メジャーリーグの守備できるマンとそうでもないマンの違いは?外野守備能力の可視化と分析やりました.

新庄剛志氏(元BIG BOSS)の現役時代の守備に憧れて野球が大好きになった人です. エグい守備範囲, 糸を引くような速くて美しくて強いバックフォームと強肩, どれも完璧でしたよねと*1. どうしても気になる外野手の守備, なんとか評価と可視化ができないかな…

オオタニサンのキャラ変とその未来 - 2022年, 投手としての成績からの気付き

ドラフト会議前に一位指名を公言するのって何かのトレンドですか?って思ってる人です.*1 今年いや, 去年からずっと野球関連のリアルなトレンドは「何かしらのオオタニサン」で間違いないと思います. 打者として規定打席到達(わかる) ついでに2年連続30本塁…

StatcastデータとPlotlyを使って「打球の到達位置」を可視化する - オオタニサンの打球の行方は!?

先に言っておくとStatcastデータの仕様を翻訳・解説して例も作ったよという前回エントリーの続きです. 「メジャーリーガーの一挙手一投足を事細かに記録したデータ」であるStatcastは, つい先日10勝20ホーマーというベーブ・ルース以来の(ある種恐ろしい)…

野球好きとデータ好きのためのStatcastデータ入門 - スポーツデータ解析の第一歩

【2022/8/13更新】打球位置のプロット例を追加しました(解説ブログのリンクを含む) プライベートの時間はウイニングポスト9*1で自家生産の馬を育てるか, 野球データと戦っている人です. 野球のデータは見れば見るほど面白いです, どれぐらい面白いかと言う…

野球ファン目線での野球AI開発と実践 - 突然ですが"成績"占ってもいいですか?

日米ともに突然の加藤球投高打低時代が戻ってきて今年の野球面白すぎでは?と思ってるマンです.*1 野球をテーマにした趣味プロジェクト・個人開発を始めてから実は10年が経とうとしているのですが, つい先日「これは最高傑作なのでは!?」っていうネタが完成…

推しは推せるときに推せ - 北海道日本ハムファイターズの推しがどこまで成績を残すか?をAIに聞いてみました.

現役時代の阪神タイガース新庄剛志(現・北海道日本ハムファイターズBIG BOSS)に憧れて野球ファンになった人です.*1 今シーズンのここまでの流れで興奮しないはずがありません, 開幕三連敗?知らんがな*2. もっとも, 「野球エンジニア」「野球データサイエン…

ビッグボス新庄剛志様にお願いしたい, 来シーズンのファイターズをいい感じにしてくれ!っていうはなし(セイバーメトリクス風味)

いつもの野球エンジニア&データサイエンスブログ,,, というよりファンの熱い思いと思って読んでください(真顔) 1995年頃の阪神タイガース, 新庄剛志外野手と藪恵壹投手を見て野球ファンになった者です. blog.hatenablog.com そして、どっぷりと野球にはま…

野球AIが選ぶTOKYO 2020侍JAPAN24名 - 機械学習で忖度無く選んでみた.

※【注意】あくまでもお遊びです, 冗談半分で読んでください! 「野生の野球データサイエンティスト」です. 本日ついにTOKYO2020侍ジャパン, 24名の内定選手が発表となりました. www.japan-baseball.jp 24名の選出って難しいですよね...中の方は色々ご苦労と…

チームでもっとも貢献している(足を引っ張っている)打者は誰なのか?12球団の打者パフォーマンスを可視化してみた

2021年プロ野球が開幕して一ヶ月半くらい. 佐々木朗希がついに一軍デビューしたり, 伝統の一戦「巨人阪神戦」が昨日で通算2,000試合になったり, 日々話題に欠ける事無く楽しいですね. 日々流れてくるニュースも気になるとは思いますが, 贔屓チームを推してる…

ダルビッシュ有さんは今シーズン何勝するのか? - 39歳までの成績をデータサイエンスで予測してみました

プロ野球とメジャーリーグの開幕が待ち遠しい人です⚾ 日米ともにオープン戦もはじまり, 球春が盛り上がってまいりました. 個人的には贔屓球団の動向*1がすごく気になるのですが, full-count.jp 昨年34歳にして初の最多勝, サイ・ヤング賞を惜しくも逃した*2…

日本シリーズの途中ですが, チームの主砲は契約期間中に何本ホームランを打つか?AIに聞いてみました.

誰のことかは本文に答えが! かなり久しぶりに日本プロ野球のネタやってみました⚾️ 今年の野球も残すところは日本シリーズと(一番大好きな)ストーブリーグになりました. その日本シリーズですが, news.yahoo.co.jp 訓練された日ハム(パ・リーグ)ファンの…

野球好きのデータ分析初心者は「Rによるセイバーメトリクス入門」から探索するといいかもしれない

読売巨人軍, 福岡ソフトバンクホークスがリーグ優勝, ロサンゼルスドジャースが世界一となった今シーズンの野球ももうそろそろ終わりが見えてきました. CSで盛り上がったり日本シリーズに思いを馳せたり*1, 気持ちは2021年に向いていたり(?)それぞれ楽し…

機械学習を使った野球データサイエンス - 打者・大谷翔平選手の20代をシュッと占ってみた

やったことは非常にシンプルでして. 大谷翔平選手の26〜29歳(2020〜2024年)までの打撃成績を, 一般的な打撃成績データ(安打, 本塁打, 三振etc...)を使った機械学習でそれっぽく出してみました 大谷翔平さんはやっぱ凄い(詳細はこの後で) まだまだ改良…

野球の防御率はたまに嘘をつくのでDIPSと合わせて見てみよう - データサイエンスから学ぶセイバーメトリクス

前回は打者成績の話をしたので(予告通り)投手の成績の話をします. 投手をシーズン成績(または通算成績)で見る時, 代表的な指標として以下の3つがあります(いわゆる, 「投手三冠」の対象). 勝利数(その名の通り, 投げて勝利した回数) 奪三振(打者か…

打者の成績を数字で理解する三つの視点 - データサイエンスから学ぶセイバーメトリクス

私達が大好きなプロ野球, どうやら開幕の目処が立ちそうです⚾ www.nikkansports.com とはいえ(この記事を書いてる5/10時点では)正式発表ではないかつ, 仮に6/19開幕としてもあと一ヶ月と少し時間がありますね...ということでまだまだ #StayHome をやってく…

野球のための特徴量エンジニアリング - データサイエンスから学ぶセイバーメトリクス

新型コロナウイルスに我々はかならず勝つ!というお気持ちでずっと #StayHome している私達ですが, 野球が待ち遠しい事は変わりありません.*1 お家にいながら野球どうやってやろう :thinkingface: ...と考えた結果, 「野球データで遊ぶならずっと #StayHome …

「アイツと似ている」野球選手をPythonでいい感じにスコア化してみた - 2020年注目の選手の特徴とは

2019年のプロ野球が終わり, セイバーメトリクスと分析・解析には良いシーズンになりました. 改めましてこんにちは. @shinyorkeと申します. このエントリーでは, セイバーメトリクスで「打者の類似性」を算出する方法論と実装例(なおPython) メジャーリーグ…

30分で理解するセイバーメトリクスの教科書 - 野球を統計的に楽しもう

このブログをはじめた当初に「大好きな野球のデータ分析をもっと知ってほしい」というモチベーションでこんな記事を書きました. shinyorke.hatenablog.com 執筆・公開した5年前(2014年)と比べ, 野球に限らず, スポーツ界隈全体で公開データが増えた. 例え…

メジャーリーガーの「撮れ高」を可視化する - 得点期待値で遊ぼう

誰のグラフかは、最後に登場しますお見逃し無く! 本当はこのイベントでLTする予定の内容でした*1. bpstudy.connpass.com 結果的に「有言不実行」となってしまい悔しいのと、何気に分析とストーリーはできてたのでちゃんと供養したいと思います. Basball Pla…

Baseball Play Studyと私の5年間〜発表は人生を変えるという話 #BPStudy

エイプリルフールに合わせてなにかセイバーメトリクスっぽい指標のネタを考える...暇もなく仕事してた&野球見てた自分です. 来年(2019)のエイプリルフールこそ,セイバーメトリクスで適当な指標作ろうと思った野球エンジニアですこんにちは.*1 さてさて,先…

メジャーリーグ全162試合,約72万球のデータをBigQueryに保存する方法(なお分析はまだ) #大晦日ハッカソン

やきう大好きなら,こういうのやりたいでしょ?(なおメジャーリーグ). という,野球好きの為のHackを年末にやってみました. なお,こちらは本年(2017年)の#大晦日ハッカソン成果物のメモです. #大晦日ハッカソンは毎年大晦日に好きな場所で成果を呟きながら…

野球データ分析を支えるPythonなノウハウ〜Jupyter notebookとpandas,SQLを添えて

※2017/12/19 20:45 この分析結果の詳細スライドを追加 Top写真(サムネイル)は雰囲気です,あまり気にしなくてOK.*1 Jupyter Advent Calendar 2017 19日目の記事です. ここでは,本年私がやった野球ネタの主に分析環境まわりについての話をサンプルや選定理由…

\横浜優勝/が未遂に終わった件をデータでふりかえる-日本シリーズの続き

来年は...\横浜優勝/なんだ(^○^) 今年もプロ野球とMLB終わっちゃいましたねこんばんは.*1 プロ野球は日ハム,MLBはアスレチックス推しの私ですが両方共8月から教育リーグに旅立ってしまったので(涙)*2, イチ野球ファンとして何のプレッシャーもなく楽しん…

「PythonユーザのためのJupyter[実践]入門」の感想と野球版サンプルを作った #jupyterbook #mokupy

今年も野球は終わりですね*1...こんにちは,野球の人です. このエントリーは,PyCon JP 2017で発表した内容の続きであり, 前回のエントリーの続きでもあります.*2 Scrapyでスクレイピング&SQLite3に保存したデータを, Jupyter pandas matplotlib で分析と可視…

プロ野球の打者における「得点力」を長方形の面積で求めてみる #野球Hack #Python

日米ともに贔屓チームが蚊帳の外におかれて辛い私ですこんにちは.*1 PyCon JP 2017の準備(詳しくは最後に触れます!)の際に興味深い野球ネタを見つけた&早速真似したので披露したいと思います. 優勝争いしているチームのファンもそうじゃないファンもお楽…

プロ野球全12球団の得点力を可視化してみた〜 #DevLOVE 野球の続き

日ハムが連敗中で心が痛い私ですこんばんは.*1 先日公開して好評だった, こちらのエントリーの最新版を作ったので簡単に紹介したいと思います.*2 shinyorke.hatenablog.com Starting Member Starting Member 要約すると 計算のルールと数字の読み方 wRAAの読…