データサイエンス
プロ野球とメジャーリーグの開幕が待ち遠しい人です⚾ 日米ともにオープン戦もはじまり, 球春が盛り上がってまいりました. 個人的には贔屓球団の動向*1がすごく気になるのですが, full-count.jp 昨年34歳にして初の最多勝, サイ・ヤング賞を惜しくも逃した*2…
新年あけましておめでとうございます 年末年始は色々と手を動かしつつ*1, 積ん読を消化していたのですが, 昨年最後の読書 特にこの本にオッってなりまして読み終わる寸前には, これもうすぐ読み終わるのですが、なぜ積ん読にしてたワイはってぐらい名著でし…
読売巨人軍, 福岡ソフトバンクホークスがリーグ優勝, ロサンゼルスドジャースが世界一となった今シーズンの野球ももうそろそろ終わりが見えてきました. CSで盛り上がったり日本シリーズに思いを馳せたり*1, 気持ちは2021年に向いていたり(?)それぞれ楽し…
要約すると, データサイエンス・機械学習周りでよく聞かれること&回答を言語化しました. 「データサイエンティストやりたい」「機械学習エンジニアになりたい」というキャリア志望を持つ方は多いと思います. 私の周りでも, 公私ともにそんな志望者の相談を聞…
待望のJupyter本, 改訂版来ました! Pythonでデータサイエンスとエンジニアリングするマンとしてかなり待望していた「PythonユーザのためのJupyter[実践]入門 改訂版」がついに来ました.*1 改訂版 Pythonユーザのための Jupyter[実践]入門作者:池内 孝啓,片…
やったことは非常にシンプルでして. 大谷翔平選手の26〜29歳(2020〜2024年)までの打撃成績を, 一般的な打撃成績データ(安打, 本塁打, 三振etc...)を使った機械学習でそれっぽく出してみました 大谷翔平さんはやっぱ凄い(詳細はこの後で) まだまだ改良…
今年読んだデータサイエンスおよびPython本の中でも最良の一冊でした. ホントに待ち望んでいた一冊でした. 実は密かに楽しみにしてた(待ち望んでいた)*1, 「Pythonによる医療データ分析入門」, 一通り読ませていただきましたので, Pythonによる医療データ…
プロ野球が開幕し, メジャーリーグの開幕もほぼ決まり野球好きの私達に日常が徐々に戻ってきて喜びを感じている今日このごろ. 私と言えばプロ野球をガッツリ楽しみながら野球データサイエンスに勤しんでいますがこんな感じで新作ができたのでちょこっとお披…
前回は打者成績の話をしたので(予告通り)投手の成績の話をします. 投手をシーズン成績(または通算成績)で見る時, 代表的な指標として以下の3つがあります(いわゆる, 「投手三冠」の対象). 勝利数(その名の通り, 投げて勝利した回数) 奪三振(打者か…
私達が大好きなプロ野球, どうやら開幕の目処が立ちそうです⚾ www.nikkansports.com とはいえ(この記事を書いてる5/10時点では)正式発表ではないかつ, 仮に6/19開幕としてもあと一ヶ月と少し時間がありますね...ということでまだまだ #StayHome をやってく…
新型コロナウイルスに我々はかならず勝つ!というお気持ちでずっと #StayHome している私達ですが, 野球が待ち遠しい事は変わりありません.*1 お家にいながら野球どうやってやろう :thinkingface: ...と考えた結果, 「野球データで遊ぶならずっと #StayHome …
言いたいことはタイトルそのままです. ちょっと前の話ですが, 2/16に開かれた「Sports Analyst Meetup #6(通称#spoana )」というイベントでこんな話をさせてもらいました. 当日はイベントそのものが大盛況でしたし楽しかったです. 聞いていただいた皆様, …
このブログをはじめた当初に「大好きな野球のデータ分析をもっと知ってほしい」というモチベーションでこんな記事を書きました. shinyorke.hatenablog.com 執筆・公開した5年前(2014年)と比べ, 野球に限らず, スポーツ界隈全体で公開データが増えた. 例え…
サムネイルがまんま結論の一部です&タイトルでビビッと来たアナタ(+野球好き)が対象読者です. ちょっとやりたいことがあって, やりたいこと⚾のサンプルがたまたまRだった このあと自分で分析したりなにか作るんやったらPythonでやりたい せや!RからPython…
ここ1〜2年くらいで、業務やプライベートのデータ分析・データサイエンスで参考にした本(と一部本じゃないもの)をまとめてみました(注:もちろん全部読んでいます).
こういうことやぞ サムネイルで描いた事がこのエントリーの全てです. Pythonでは、「pandas」というライブラリを使ってデータ分析や解析をすることが非常に多いです. でも、「利用方法(またはユースケース)」に合わせた入門ってあんまりない気がします. と…
※あくまでもイメージです(適当) 仕事じゃなくて、趣味の方の野球統計モデルで詰まった時にやったメモ的なやつです.*1 一言で言うと、 約19万レコード(110MBちょい)のCSVの統計処理を70秒から4秒に縮めました. # 最初のコード $ time python run_expectan…
日ハムが連敗中で心が痛い私ですこんばんは.*1 先日公開して好評だった, こちらのエントリーの最新版を作ったので簡単に紹介したいと思います.*2 shinyorke.hatenablog.com Starting Member Starting Member 要約すると 計算のルールと数字の読み方 wRAAの読…
2017年プロ野球,全球団の得点源と足を引っ張ってる選手を可視化 できる何かを作ったので,私の考察とともにお見せしたいと思います. ・ 贔屓チームが強い(弱い)のはなぜ!? ・ 野球統計学なにそれ美味しいの? ・ Pythonでデータをいじりたいのだが! を直感的…
ご無沙汰していますこんにちは. 5ヶ月ぶりの野球ネタです、気がついたらGW気がついたら野球が開幕してました*1. つい先日、一部の野球ファンとデータサイエンティストな人を唸らせるこんな本が出ました. ビッグデータ・ベースボール 20年連続負け越し球団ピ…