Lean Baseball

No Engineering, No Baseball.

データサイエンス

データサイエンス・機械学習をやるためのエンジニアな本まとめ - 2019年版

ここ1〜2年くらいで、業務やプライベートのデータ分析・データサイエンスで参考にした本(と一部本じゃないもの)をまとめてみました(注:もちろん全部読んでいます).

入門pandas - 明日からはじめるデータ分析のきほん

こういうことやぞ サムネイルで描いた事がこのエントリーの全てです. Pythonでは、「pandas」というライブラリを使ってデータ分析や解析をすることが非常に多いです. でも、「利用方法(またはユースケース)」に合わせた入門ってあんまりない気がします. と…

うわっ…私のpandas、遅すぎ…?って時にやるべきこと(先人の知恵より)

※あくまでもイメージです(適当) 仕事じゃなくて、趣味の方の野球統計モデルで詰まった時にやったメモ的なやつです.*1 一言で言うと、 約19万レコード(110MBちょい)のCSVの統計処理を70秒から4秒に縮めました. # 最初のコード $ time python run_expectan…

プロ野球全12球団の得点力を可視化してみた〜 #DevLOVE 野球の続き

日ハムが連敗中で心が痛い私ですこんばんは.*1 先日公開して好評だった, こちらのエントリーの最新版を作ったので簡単に紹介したいと思います.*2 shinyorke.hatenablog.com Starting Member Starting Member 要約すると 計算のルールと数字の読み方 wRAAの読…

プロ野球全球団の得点源な選手(または足を引っ張ってる選手)を野球統計学とPythonで出してみた

2017年プロ野球,全球団の得点源と足を引っ張ってる選手を可視化 できる何かを作ったので,私の考察とともにお見せしたいと思います. ・ 贔屓チームが強い(弱い)のはなぜ!? ・ 野球統計学なにそれ美味しいの? ・ Pythonでデータをいじりたいのだが! を直感的…

エンジニア&データサイエンティストの為の「ビックデータベースボール」書評

ご無沙汰していますこんにちは. 5ヶ月ぶりの野球ネタです、気がついたらGW気がついたら野球が開幕してました*1. つい先日、一部の野球ファンとデータサイエンティストな人を唸らせるこんな本が出ました. ビッグデータ・ベースボール 20年連続負け越し球団ピ…