Lean Baseball

No Engineering, No Baseball.

データ分析

打者専念の大谷翔平2024は二刀流だった2023年と何が違うのか? - 山本由伸と今永昇太の話もあるよ

野球と春のG1で浮かれている者です, どっちも結果は微妙ですが楽しくて最高ですね.*1 野球(メジャーリーグ)という球技でも, グラウンドの外*2でも話題を振りまいている大谷翔平(オオタニサン)という(現時点で)世界一有名な現役選手(私の私見です*3)…

地味すぎる強打者「ブレント・ルッカー」に着目せよ - メジャー屈指の弱小チームで突然打ち出した理由を考える

日本プロ野球は北海道日本ハムファイターズ, メジャーリーグはオークランド・アスレチックスのファンをやっている者です. この両チーム, 共通点がまあまあありまして, 監督が外野手かつ現役時代が当該チームのセンター(もちろんスタメン)*1 良く言えばチー…

自分のデータ分析のためにRedashを構築した話 - 個人開発におけるデータ分析環境つくりとコストについて

久々に個人開発のはなしです. 昨年(2020)の話になりますが, 自分が気になる世の中のニュース(野球とかグルメとかいろいろ)だけをいい感じに集めてまとめて読みたい その中でも特に⚾, 速報とかいい感じに通知させたい ...という目的でデータ収集と通知の…

「PythonユーザーのためのJupyter実践入門」はPythonとデータサイエンスをする人の入り口だ

待望のJupyter本, 改訂版来ました! Pythonでデータサイエンスとエンジニアリングするマンとしてかなり待望していた「PythonユーザのためのJupyter[実践]入門 改訂版」がついに来ました.*1 改訂版 Pythonユーザのための Jupyter[実践]入門作者:池内 孝啓,片…

30分で理解するセイバーメトリクスの教科書 - 野球を統計的に楽しもう

このブログをはじめた当初に「大好きな野球のデータ分析をもっと知ってほしい」というモチベーションでこんな記事を書きました. shinyorke.hatenablog.com 執筆・公開した5年前(2014年)と比べ, 野球に限らず, スポーツ界隈全体で公開データが増えた. 例え…

入門pandas - 明日からはじめるデータ分析のきほん

こういうことやぞ サムネイルで描いた事がこのエントリーの全てです. Pythonでは、「pandas」というライブラリを使ってデータ分析や解析をすることが非常に多いです. でも、「利用方法(またはユースケース)」に合わせた入門ってあんまりない気がします. と…

メジャーリーガーの「撮れ高」を可視化する - 得点期待値で遊ぼう

誰のグラフかは、最後に登場しますお見逃し無く! 本当はこのイベントでLTする予定の内容でした*1. bpstudy.connpass.com 結果的に「有言不実行」となってしまい悔しいのと、何気に分析とストーリーはできてたのでちゃんと供養したいと思います. Basball Pla…

うわっ…私のpandas、遅すぎ…?って時にやるべきこと(先人の知恵より)

※あくまでもイメージです(適当) 仕事じゃなくて、趣味の方の野球統計モデルで詰まった時にやったメモ的なやつです.*1 一言で言うと、 約19万レコード(110MBちょい)のCSVの統計処理を70秒から4秒に縮めました. # 最初のコード $ time python run_expectan…

Python本まとめ・2019年版 - Webとデータ分析を初心者が仕事にするまで

毎年恒例、Pythonの本と学び方のまとめ・2019年バージョンとなります. ※2021/1/11更新:2021年版あります ※2020/1/9更新:2020年版もあります, こちらもよろしくおねがいします! ※ちなみに昨年版はこちら 改めましてこんにちは、Pythonと野球を仕事にしてい…

nuxt-coreuiでデータサイエンスの可視化ダッシュボードを自作してみる

このエントリーは、Vue.js #3 Advent Calendar 2018アドベントカレンダー初日の記事です. 開幕投手をつとめます、@shinyorkeと申します. この記事では、「データサイエンスもいいけど自前で可視化ダッシュボード作ると面白いぞ!」っていうテーマで、 nuxt-c…

すべてのエンジニアに「言語化」「選球眼」の大切さを伝えたい!という話 #PyDataOkinawa #PyBegiOkinawa

ワールドカップと野球、絶妙にタイムゾーンが違ってて丸一日楽しい私ですこんばんは.*1 沖縄から帰ってまいりました.*2 以前のエントリーで「基調講演するよ!」と話をさせてもらった 「PyData.Okinawa + PythonBeginners沖縄 合同勉強会」ですが、(悪天候…

ホームランのひみつ(MLB編)〜バレルゾーンをPythonとBigQueryで可視化してみた

このグラフは2017年MLB(メジャーリーグベースボール)の打球データ約11万レコード(球)を打球速度×打球角度で可視化したものです. ちょっとした傾向が見えますね,,,それを解説するのがこのエントリーのゴールです. こんにちは,野球エンジニアです. TL;DR 「…

ダルビッシュ有さんが2017年に投げた投球データをPythonとBigQueryで軽く調べてみた

今日で週休七日生活が終わる野球エンジニアこと@shinyorkeです. 昨年末に,BigQueryに突っ込んだ野球データでダルビッシュ有さん(@faridyu)の投球データについてかる~く調べてみました. 「今年こそPythonでデータ分析するぞ!」 「BigQueryをPythonから使…

メジャーリーグ全162試合,約72万球のデータをBigQueryに保存する方法(なお分析はまだ) #大晦日ハッカソン

やきう大好きなら,こういうのやりたいでしょ?(なおメジャーリーグ). という,野球好きの為のHackを年末にやってみました. なお,こちらは本年(2017年)の#大晦日ハッカソン成果物のメモです. #大晦日ハッカソンは毎年大晦日に好きな場所で成果を呟きながら…

\横浜優勝/が未遂に終わった件をデータでふりかえる-日本シリーズの続き

来年は...\横浜優勝/なんだ(^○^) 今年もプロ野球とMLB終わっちゃいましたねこんばんは.*1 プロ野球は日ハム,MLBはアスレチックス推しの私ですが両方共8月から教育リーグに旅立ってしまったので(涙)*2, イチ野球ファンとして何のプレッシャーもなく楽しん…

データを「飼いならしたい」人のための「Pythonではじめるデータラングリング」(書評)

今日は野球の話...ではなく,最近読んだPython本で感動した書籍があるので紹介&簡単な書評を記したいと思います. 今年(2017)の4月に発行された「[ Pythonではじめるデータラングリング」という書籍です. 仕事およびプライベート(主に野球)でよくデータラ…

AirflowとDockerで俺々データ分析基盤をつくってみた&Imageを公開してみた #kwskrb

ライフワーク(&将来の仕事)としている野球データ分析の基盤をAirflow + Docker他で作りました. このハナシはkawasaki.rb #051 5年目突入LT大会で披露したLTの続きであり, PyConJP 2017のトークネタ「野球を科学する技術〜Pythonを用いた統計ライブラリ作…

プロ野球の打者における「得点力」を長方形の面積で求めてみる #野球Hack #Python

日米ともに贔屓チームが蚊帳の外におかれて辛い私ですこんにちは.*1 PyCon JP 2017の準備(詳しくは最後に触れます!)の際に興味深い野球ネタを見つけた&早速真似したので披露したいと思います. 優勝争いしているチームのファンもそうじゃないファンもお楽…

野球好きが統計学を覚える為の学習フローを作ってみました〜解説を添えて

こんにちは.野球(とグルメ)の人です.*1 ビックデータや統計学が相変わらずアツい話題になっている中,野球好きとデータ好きをうならせるこんな本が出版されました. [プロ野球でわかる! ]はじめての統計学作者: 株式会社DELTA,佐藤文彦,student,岡田友輔出版社…

エンジニア&データサイエンティストの為の「ビックデータベースボール」書評

ご無沙汰していますこんにちは. 5ヶ月ぶりの野球ネタです、気がついたらGW気がついたら野球が開幕してました*1. つい先日、一部の野球ファンとデータサイエンティストな人を唸らせるこんな本が出ました. ビッグデータ・ベースボール 20年連続負け越し球団ピ…

ゴールデングラブ賞はデータで選ぶべきか印象で選ぶべきか?

ネット記事を読んで「おやおや?」って思ったので書きます。 ちょっとポエムっぽい内容ですがご容赦を。 9/15付、Yahoo!(というよりベースボールチャンネル)からオススメされた記事より。 zasshi.news.yahoo.co.jp この記事の内容に4割納得しつつ、6割納得…

「野球×統計は最強のバッテリーである」を読んで、データスタジアムさんのデータでセイバーメトリクスしてみた

この本がクッソ面白かったのでちょこっと書評を書いてみたのと、本日(8/30)現在のセパ両リーグのセイバーメトリクス指標を調べてみました。 結論から言うと、 野球好き・データ好きの人はこの本買いです!必読です!! 野球×統計は最強のバッテリーである …