Lean Baseball

No Engineering, No Baseball.

セイバーメトリクス

日本シリーズの途中ですが, チームの主砲は契約期間中に何本ホームランを打つか?AIに聞いてみました.

誰のことかは本文に答えが! かなり久しぶりに日本プロ野球のネタやってみました⚾️ 今年の野球も残すところは日本シリーズと(一番大好きな)ストーブリーグになりました. その日本シリーズですが, news.yahoo.co.jp 訓練された日ハム(パ・リーグ)ファンの…

野球好きのデータ分析初心者は「Rによるセイバーメトリクス入門」から探索するといいかもしれない

読売巨人軍, 福岡ソフトバンクホークスがリーグ優勝, ロサンゼルスドジャースが世界一となった今シーズンの野球ももうそろそろ終わりが見えてきました. CSで盛り上がったり日本シリーズに思いを馳せたり*1, 気持ちは2021年に向いていたり(?)それぞれ楽し…

機械学習を使った野球データサイエンス - 打者・大谷翔平選手の20代をシュッと占ってみた

やったことは非常にシンプルでして. 大谷翔平選手の26〜29歳(2020〜2024年)までの打撃成績を, 一般的な打撃成績データ(安打, 本塁打, 三振etc...)を使った機械学習でそれっぽく出してみました 大谷翔平さんはやっぱ凄い(詳細はこの後で) まだまだ改良…

野球の防御率はたまに嘘をつくのでDIPSと合わせて見てみよう - データサイエンスから学ぶセイバーメトリクス

前回は打者成績の話をしたので(予告通り)投手の成績の話をします. 投手をシーズン成績(または通算成績)で見る時, 代表的な指標として以下の3つがあります(いわゆる, 「投手三冠」の対象). 勝利数(その名の通り, 投げて勝利した回数) 奪三振(打者か…

打者の成績を数字で理解する三つの視点 - データサイエンスから学ぶセイバーメトリクス

私達が大好きなプロ野球, どうやら開幕の目処が立ちそうです⚾ www.nikkansports.com とはいえ(この記事を書いてる5/10時点では)正式発表ではないかつ, 仮に6/19開幕としてもあと一ヶ月と少し時間がありますね...ということでまだまだ #StayHome をやってく…

野球のための特徴量エンジニアリング - データサイエンスから学ぶセイバーメトリクス

新型コロナウイルスに我々はかならず勝つ!というお気持ちでずっと #StayHome している私達ですが, 野球が待ち遠しい事は変わりありません.*1 お家にいながら野球どうやってやろう :thinkingface: ...と考えた結果, 「野球データで遊ぶならずっと #StayHome …

「アイツと似ている」野球選手をPythonでいい感じにスコア化してみた - 2020年注目の選手の特徴とは

2019年のプロ野球が終わり, セイバーメトリクスと分析・解析には良いシーズンになりました. 改めましてこんにちは. @shinyorkeと申します. このエントリーでは, セイバーメトリクスで「打者の類似性」を算出する方法論と実装例(なおPython) メジャーリーグ…

30分で理解するセイバーメトリクスの教科書 - 野球を統計的に楽しもう

このブログをはじめた当初に「大好きな野球のデータ分析をもっと知ってほしい」というモチベーションでこんな記事を書きました. shinyorke.hatenablog.com 執筆・公開した5年前(2014年)と比べ, 野球に限らず, スポーツ界隈全体で公開データが増えた. 例え…

メジャーリーガーの「撮れ高」を可視化する - 得点期待値で遊ぼう

誰のグラフかは、最後に登場しますお見逃し無く! 本当はこのイベントでLTする予定の内容でした*1. bpstudy.connpass.com 結果的に「有言不実行」となってしまい悔しいのと、何気に分析とストーリーはできてたのでちゃんと供養したいと思います. Basball Pla…

Baseball Play Studyと私の5年間〜発表は人生を変えるという話 #BPStudy

エイプリルフールに合わせてなにかセイバーメトリクスっぽい指標のネタを考える...暇もなく仕事してた&野球見てた自分です. 来年(2019)のエイプリルフールこそ,セイバーメトリクスで適当な指標作ろうと思った野球エンジニアですこんにちは.*1 さてさて,先…

メジャーリーグ全162試合,約72万球のデータをBigQueryに保存する方法(なお分析はまだ) #大晦日ハッカソン

やきう大好きなら,こういうのやりたいでしょ?(なおメジャーリーグ). という,野球好きの為のHackを年末にやってみました. なお,こちらは本年(2017年)の#大晦日ハッカソン成果物のメモです. #大晦日ハッカソンは毎年大晦日に好きな場所で成果を呟きながら…

野球データ分析を支えるPythonなノウハウ〜Jupyter notebookとpandas,SQLを添えて

※2017/12/19 20:45 この分析結果の詳細スライドを追加 Top写真(サムネイル)は雰囲気です,あまり気にしなくてOK.*1 Jupyter Advent Calendar 2017 19日目の記事です. ここでは,本年私がやった野球ネタの主に分析環境まわりについての話をサンプルや選定理由…

\横浜優勝/が未遂に終わった件をデータでふりかえる-日本シリーズの続き

来年は...\横浜優勝/なんだ(^○^) 今年もプロ野球とMLB終わっちゃいましたねこんばんは.*1 プロ野球は日ハム,MLBはアスレチックス推しの私ですが両方共8月から教育リーグに旅立ってしまったので(涙)*2, イチ野球ファンとして何のプレッシャーもなく楽しん…

「PythonユーザのためのJupyter[実践]入門」の感想と野球版サンプルを作った #jupyterbook #mokupy

今年も野球は終わりですね*1...こんにちは,野球の人です. このエントリーは,PyCon JP 2017で発表した内容の続きであり, 前回のエントリーの続きでもあります.*2 Scrapyでスクレイピング&SQLite3に保存したデータを, Jupyter pandas matplotlib で分析と可視…

プロ野球の打者における「得点力」を長方形の面積で求めてみる #野球Hack #Python

日米ともに贔屓チームが蚊帳の外におかれて辛い私ですこんにちは.*1 PyCon JP 2017の準備(詳しくは最後に触れます!)の際に興味深い野球ネタを見つけた&早速真似したので披露したいと思います. 優勝争いしているチームのファンもそうじゃないファンもお楽…

プロ野球全12球団の得点力を可視化してみた〜 #DevLOVE 野球の続き

日ハムが連敗中で心が痛い私ですこんばんは.*1 先日公開して好評だった, こちらのエントリーの最新版を作ったので簡単に紹介したいと思います.*2 shinyorke.hatenablog.com Starting Member Starting Member 要約すると 計算のルールと数字の読み方 wRAAの読…

プロ野球全球団の得点源な選手(または足を引っ張ってる選手)を野球統計学とPythonで出してみた

2017年プロ野球,全球団の得点源と足を引っ張ってる選手を可視化 できる何かを作ったので,私の考察とともにお見せしたいと思います. ・ 贔屓チームが強い(弱い)のはなぜ!? ・ 野球統計学なにそれ美味しいの? ・ Pythonでデータをいじりたいのだが! を直感的…

野球好きが統計学を覚える為の学習フローを作ってみました〜解説を添えて

こんにちは.野球(とグルメ)の人です.*1 ビックデータや統計学が相変わらずアツい話題になっている中,野球好きとデータ好きをうならせるこんな本が出版されました. [プロ野球でわかる! ]はじめての統計学作者: 株式会社DELTA,佐藤文彦,student,岡田友輔出版社…

野球とデータ好きエンジニアの為の野球選手名鑑の選び方

今年初の野球ネタな気がする. こんばんは,野球Pythonの人(もしくはスクラムマスター)です.*1 プロ野球もオープン戦がはじまり,WBCも来週から一次リーグ…ということで,野球大好きな皆さんはきっと野球選手名鑑を買われていたり,どこの名鑑を買うか悩んでる頃…

野球統計学で2016年広島東洋カープの強さを証明しよう!〜PyCon mini Hiroshima 2016レポート

本日開催のPyCon JPの地方版, PyCon mini Hiroshima 2016にて, 「広島東洋カープの強さをPyDataと野球統計学"セイバーメトリクス"で証明したよ!」 というお話をさせていただきました! 発表スライド Py "Baseball" Data入門 - 広島東洋カープ編 #pyconhiro …

エンジニア&データサイエンティストの為の「ビックデータベースボール」書評

ご無沙汰していますこんにちは. 5ヶ月ぶりの野球ネタです、気がついたらGW気がついたら野球が開幕してました*1. つい先日、一部の野球ファンとデータサイエンティストな人を唸らせるこんな本が出ました. ビッグデータ・ベースボール 20年連続負け越し球団ピ…

MLBの野球データを用いた分析と可視化のサンプル(Python)を公開しました

思ったよりプレミア12が面白くて盛り上がってる私ですこんばんわ!*1 PyCon JP 2015のトークセッション「野球Hack!~Pythonを用いたデータ分析と可視化」で披露した、MLBのオープンデータ「RETROSHEET」を用いたデモを披露させてもらいました。 そのデモで使…

ゴールデングラブ賞はデータで選ぶべきか印象で選ぶべきか?

ネット記事を読んで「おやおや?」って思ったので書きます。 ちょっとポエムっぽい内容ですがご容赦を。 9/15付、Yahoo!(というよりベースボールチャンネル)からオススメされた記事より。 zasshi.news.yahoo.co.jp この記事の内容に4割納得しつつ、6割納得…

XP祭り2015「俺も!!」参加レポート-野球とアジャイルな一日とPyCon JP #xpjug #pyconjp

昨日の懇親会が楽しすぎて若干二日酔いですこんにちは! 昨日、Pythonコミュニティ同様、私のやきう活動の原点であるXP祭りで初めて登壇しました(ただしLTを除く) XP祭り2015「俺も!!」レポート 当日の発表内容&補足 当日の様子(他のセッションなど) …

「野球×統計は最強のバッテリーである」を読んで、データスタジアムさんのデータでセイバーメトリクスしてみた

この本がクッソ面白かったのでちょこっと書評を書いてみたのと、本日(8/30)現在のセパ両リーグのセイバーメトリクス指標を調べてみました。 結論から言うと、 野球好き・データ好きの人はこの本買いです!必読です!! 野球×統計は最強のバッテリーである …

アジアの野球Hackは日本だけじゃなかった!~PyCon APAC Taiwan 2015より

モーリス強いねー、堀厩舎凄いねー。 競馬の春ですねこんばんは!*1 Pythonカンファレンスのアジア太平洋地域Ver.、PyCon APAC/Taiwan 2015にて、野球をPython(?)でHackしました!的な発表があったそうです。 Play Data, Play Ball! - pyconapac2015 by Summ…

MLBの選手情報データ「Sean Lahman Baseball Database」で野球ゲームのドラフト対策をPython+Excelでやってみた

昨日のエントリーが思ったより盛り上がっててビックリしてる私ですこんばんは!*1 今日もPython + 野球ネタですが、今度は野球好き、特にセイバーメトリクスやファンタジーベースボールが好きなキッズ達に刺さるネタを書こうと思います。 MLBの選手情報デー…

最強の野球オープンデータ「Retrosheet」をPython+Vagrant+Ansibleで誰でも使えるようにしました

2ヶ月前のエントリーにはてブが入りまくった件で「そういえば続編書いてないや」と気が付き、エントリーしますた。 「誰でも」の定義および、このエントリーの対象読者について 「誰でも」というのは、 (エンジニアなら)誰でも という意味です。 より具体…

#bpstudy で野球の話をします(1年ぶり2回目) - BPStudy#91「Baseball Play Study 2015 NPB開幕直前スペシャル」

ござ先輩のブログでも言及されていましたが、こちらでも宣伝させてください。 2007年から続いてる老舗Web勉強会*1、「◯◯Study」の元祖・BPStudy 今年も野球の件が3/25(水)に開催されます!!! BPStudy#91 (2015/03/25 19:00〜) BPStudy #91 - Baseball Play…

最強の野球オープンデータ「Retrosheet」をPythonでHackしてゲームに勝つる何かを作ろう(序章)

※このエントリーの内容ですが、ソースコード公開含めパワーアップして別のエントリーにまとめました!!!新しい方を見るといいかもです!!!! 最強の野球オープンデータ「Retrosheet」をPython+Vagrant+Ansibleで誰でも使えるようにしました - Lean Baseb…