Lean Baseball

No Engineering, No Baseball.

野球

野球とPythonの「終わり」と「はじまり」-スポーツ界に「ひろがるPython」 #PyConJP

写真は誰も知らなかった「クリス・デービス(Khris Davis)」のデータです. いいバッターなのでぜひ覚えてやってください(震え 今年はじめの、野球エンジニア宣言(転職エントリー)で宣言したこの件 また,既に開催が決まっているPyCon JP 2018については, …

Baseball Play Studyと私の5年間〜発表は人生を変えるという話 #BPStudy

エイプリルフールに合わせてなにかセイバーメトリクスっぽい指標のネタを考える...暇もなく仕事してた&野球見てた自分です. 来年(2019)のエイプリルフールこそ,セイバーメトリクスで適当な指標作ろうと思った野球エンジニアですこんにちは.*1 さてさて,先…

ホームランのひみつ(MLB編)〜バレルゾーンをPythonとBigQueryで可視化してみた

このグラフは2017年MLB(メジャーリーグベースボール)の打球データ約11万レコード(球)を打球速度×打球角度で可視化したものです. ちょっとした傾向が見えますね,,,それを解説するのがこのエントリーのゴールです. こんにちは,野球エンジニアです. TL;DR 「…

ダルビッシュ有さんが2017年に投げた投球データをPythonとBigQueryで軽く調べてみた

今日で週休七日生活が終わる野球エンジニアこと@shinyorkeです. 昨年末に,BigQueryに突っ込んだ野球データでダルビッシュ有さん(@faridyu)の投球データについてかる~く調べてみました. 「今年こそPythonでデータ分析するぞ!」 「BigQueryをPythonから使…

夢は正夢〜「野球エンジニア」としてのキャリアのはじまり

写真は野球好きの同志(同僚)から餞別&メッセージとして頂いた「栗山魂」です.*1 なお,サインは栗山英樹(北海道日本ハムファイターズ監督)さん直筆とのこと. TL;DR 野球エンジニアになります,2月から. 「夢は正夢」〜「なるんだ!」という強い気持ちであ…

メジャーリーグ全162試合,約72万球のデータをBigQueryに保存する方法(なお分析はまだ) #大晦日ハッカソン

やきう大好きなら,こういうのやりたいでしょ?(なおメジャーリーグ). という,野球好きの為のHackを年末にやってみました. なお,こちらは本年(2017年)の#大晦日ハッカソン成果物のメモです. #大晦日ハッカソンは毎年大晦日に好きな場所で成果を呟きながら…

\横浜優勝/が未遂に終わった件をデータでふりかえる-日本シリーズの続き

来年は...\横浜優勝/なんだ(^○^) 今年もプロ野球とMLB終わっちゃいましたねこんばんは.*1 プロ野球は日ハム,MLBはアスレチックス推しの私ですが両方共8月から教育リーグに旅立ってしまったので(涙)*2, イチ野球ファンとして何のプレッシャーもなく楽しん…

「PythonユーザのためのJupyter[実践]入門」の感想と野球版サンプルを作った #jupyterbook #mokupy

今年も野球は終わりですね*1...こんにちは,野球の人です. このエントリーは,PyCon JP 2017で発表した内容の続きであり, 前回のエントリーの続きでもあります.*2 Scrapyでスクレイピング&SQLite3に保存したデータを, Jupyter pandas matplotlib で分析と可視…

「人とWebに優しい」Scrapyの使い方サンプル〜 #PyConJP 2017のつづき(なお野球)

PyCon JP 2017で発表した野球×Pythonの分析ネタの詳細解説です.*1 プレゼンテーション:野球を科学する技術〜Pythonを用いた統計ライブラリ作成と分析基盤構築 | PyCon JP 2017 in TOKYO speakerdeck.com youtu.be 時間および諸々の都合(察し)で公開できな…

プロ野球の打者における「得点力」を長方形の面積で求めてみる #野球Hack #Python

日米ともに贔屓チームが蚊帳の外におかれて辛い私ですこんにちは.*1 PyCon JP 2017の準備(詳しくは最後に触れます!)の際に興味深い野球ネタを見つけた&早速真似したので披露したいと思います. 優勝争いしているチームのファンもそうじゃないファンもお楽…

プロ野球全12球団の得点力を可視化してみた〜 #DevLOVE 野球の続き

日ハムが連敗中で心が痛い私ですこんばんは.*1 先日公開して好評だった, こちらのエントリーの最新版を作ったので簡単に紹介したいと思います.*2 shinyorke.hatenablog.com Starting Member Starting Member 要約すると 計算のルールと数字の読み方 wRAAの読…

プロ野球全球団の得点源な選手(または足を引っ張ってる選手)を野球統計学とPythonで出してみた

2017年プロ野球,全球団の得点源と足を引っ張ってる選手を可視化 できる何かを作ったので,私の考察とともにお見せしたいと思います. ・ 贔屓チームが強い(弱い)のはなぜ!? ・ 野球統計学なにそれ美味しいの? ・ Pythonでデータをいじりたいのだが! を直感的…

野球好きが統計学を覚える為の学習フローを作ってみました〜解説を添えて

こんにちは.野球(とグルメ)の人です.*1 ビックデータや統計学が相変わらずアツい話題になっている中,野球好きとデータ好きをうならせるこんな本が出版されました. [プロ野球でわかる! ]はじめての統計学作者: 株式会社DELTA,佐藤文彦,student,岡田友輔出版社…

野球とデータ好きエンジニアの為の野球選手名鑑の選び方

今年初の野球ネタな気がする. こんばんは,野球Pythonの人(もしくはスクラムマスター)です.*1 プロ野球もオープン戦がはじまり,WBCも来週から一次リーグ…ということで,野球大好きな皆さんはきっと野球選手名鑑を買われていたり,どこの名鑑を買うか悩んでる頃…

Pythonを用いたWebスクレイピングの開発ノウハウ〜スポーツデータの場合(野球風味)

クローラー/Webスクレイピング Advent Calendar 2016 - Qiitaのクローザーとしてマウンドに立ちます@shinyorke(しんよーく)ともうします. このエントリーではみんな大好きな野球(メジャーリーグ)を題材に, Webスクレイパーを開発するコツ スポーツデータ特…

「独習Python入門」は一生付き合える入門本だと334回言いたい

私がリスペクトするエンジニアの一人であり、ITエンジニア界隈の三大野球バカの一人*1であるござ先輩が本を出版されました. gothedistance.hatenadiary.jp 大変ありがたい事に、献本を頂いたので久々に書評など書いてみようかなと思います. [書評]「独習Pyth…

投手大谷翔平のパフォーマンスをPythonでサクッと分析してみる

日ハム14連勝&レアードサヨナラ弾(通称弾)で気分が最高すぎますこんばんは. こちらの続編となる分析ネタやりましたので軽く紹介します.*1 shinyorke.hatenablog.com おしながき 大谷翔平投手の2016年 さくっと分析してみる MLBの二刀流投手と比較してみる …

エンジニア&データサイエンティストの為の「ビックデータベースボール」書評

ご無沙汰していますこんにちは. 5ヶ月ぶりの野球ネタです、気がついたらGW気がついたら野球が開幕してました*1. つい先日、一部の野球ファンとデータサイエンティストな人を唸らせるこんな本が出ました. ビッグデータ・ベースボール 20年連続負け越し球団ピ…

MLBの野球データを用いた分析と可視化のサンプル(Python)を公開しました

思ったよりプレミア12が面白くて盛り上がってる私ですこんばんわ!*1 PyCon JP 2015のトークセッション「野球Hack!~Pythonを用いたデータ分析と可視化」で披露した、MLBのオープンデータ「RETROSHEET」を用いたデモを披露させてもらいました。 そのデモで使…

ゴールデングラブ賞はデータで選ぶべきか印象で選ぶべきか?

ネット記事を読んで「おやおや?」って思ったので書きます。 ちょっとポエムっぽい内容ですがご容赦を。 9/15付、Yahoo!(というよりベースボールチャンネル)からオススメされた記事より。 zasshi.news.yahoo.co.jp この記事の内容に4割納得しつつ、6割納得…

「野球×統計は最強のバッテリーである」を読んで、データスタジアムさんのデータでセイバーメトリクスしてみた

この本がクッソ面白かったのでちょこっと書評を書いてみたのと、本日(8/30)現在のセパ両リーグのセイバーメトリクス指標を調べてみました。 結論から言うと、 野球好き・データ好きの人はこの本買いです!必読です!! 野球×統計は最強のバッテリーである …

Pandasとmatplotlibを使って日本の強打者Hideki Matsuiさんの打球の行方をグラフ化してみた #pyhack

本日のPython mini hack-a-thon #55で作ったネタです。 (第55回)Python mini Hack-a-thon (2015/07/11 11:00〜)pyhack.connpass.com 今日で #pyhack が55回目とのことで、55といえば我らが誇る強打者GodzillaことHideki Matsuiやろ! って事でRETROSHEETから…

PyDataをカジュアルにサクッとはじめるサンプル(なお野球)

社内勉強会用に「慌てて」作ったPythonでのデータ解析「PyData」の紹介スライドとサンプルコードです。 PyData入門(超初心者編)~野球のデータをカジュアルに可視化 from 伸一 中川 www.slideshare.net Shinichi-Nakagawa/pydata_baseball_sample · GitHub イ…

Golangはじめて半日後に野球のアプリ書いてLTしてきた ~ Go Conference 2015 summer Report #gocon

日ハム三連敗かなしいですこんばんは! 今日は運良く抽選を突破、「 #gocon (ゴーコン)」と言いたいだけ的なお祭でお馴染みのGo Conference に行ってきた&そんなゴーコンのためにHello World書いて24時間も経たない内にLTしてきたお!っていう報告をさせて…

アジアの野球Hackは日本だけじゃなかった!~PyCon APAC Taiwan 2015より

モーリス強いねー、堀厩舎凄いねー。 競馬の春ですねこんばんは!*1 Pythonカンファレンスのアジア太平洋地域Ver.、PyCon APAC/Taiwan 2015にて、野球をPython(?)でHackしました!的な発表があったそうです。 Play Data, Play Ball! - pyconapac2015 by Summ…

プログラミングおよびデータ解析で使える野球データの在り処についてまとめてみた

最近よく聞かれる&都度答えるのもアレだなと思い、まとめてみました。 とりあえず自分が把握している範囲で書きました 使うときの注意事項 ライセンスに気をつけましょう! スクレイピングもしくはHTMLをコピーして得たデータの二次利用は注意(公開したりお…

【野球Hack】エースの調子が悪くて心配なのでPython+pandas+matplotlibで可視化してみた

一ヶ月ぶり、こちらのエントリーの続編です。 最強の野球オープンデータ「Retrosheet」をPython+Vagrant+Ansibleで誰でも使えるようにしました - Lean Baseballshinyorke.hatenablog.com こちらで作ったデータですが、その後も粛々とデータの分析に使ったり…

【Python】bottle, Beautifulsoup, geopyを使って野球の地図を作ってみました

最近、Certified ScrumMaster(認定スクラムマスター)を無事GETした私ですこんばんは!*1 今日はこちらの勉強会(もくもく会)でいい感じのモノが出来たので、ちょいと紹介したいと思います。 第7回 Pythonもくもく会 @アライドアーキテクツ(恵比寿) (201…

MLBの選手情報データ「Sean Lahman Baseball Database」で野球ゲームのドラフト対策をPython+Excelでやってみた

昨日のエントリーが思ったより盛り上がっててビックリしてる私ですこんばんは!*1 今日もPython + 野球ネタですが、今度は野球好き、特にセイバーメトリクスやファンタジーベースボールが好きなキッズ達に刺さるネタを書こうと思います。 MLBの選手情報デー…

最強の野球オープンデータ「Retrosheet」をPython+Vagrant+Ansibleで誰でも使えるようにしました

2ヶ月前のエントリーにはてブが入りまくった件で「そういえば続編書いてないや」と気が付き、エントリーしますた。 「誰でも」の定義および、このエントリーの対象読者について 「誰でも」というのは、 (エンジニアなら)誰でも という意味です。 より具体…