Lean Baseball

No Engineering, No Baseball.

自分のデータ分析のためにRedashを構築した話 - 個人開発におけるデータ分析環境つくりとコストについて

久々に個人開発のはなしです. 昨年(2020)の話になりますが, 自分が気になる世の中のニュース(野球とかグルメとかいろいろ)だけをいい感じに集めてまとめて読みたい その中でも特に⚾, 速報とかいい感じに通知させたい ...という目的でデータ収集と通知の…

ダルビッシュ有さんは今シーズン何勝するのか? - 39歳までの成績をデータサイエンスで予測してみました

プロ野球とメジャーリーグの開幕が待ち遠しい人です⚾ 日米ともにオープン戦もはじまり, 球春が盛り上がってまいりました. 個人的には贔屓球団の動向*1がすごく気になるのですが, full-count.jp 昨年34歳にして初の最多勝, サイ・ヤング賞を惜しくも逃した*2…

誠意は言葉ではなくコードを書くこと - 2021年の目標・行動・スタンスについて

写真は近所で散歩した時に適当に撮ったやつです, 特に深い意味はありません. このエントリーはいわゆる「今年の抱負」的なやつです. 気がつけば1月も終わり, 2月も半分が過ぎ, 雪が溶けて河になって流れてゆく季節が近づいてるのお〜という気候になってしま…

自分でシュッとデータ分析をできる人になろう - 「データ分析人材になる。」から学んだこと

新年あけましておめでとうございます 年末年始は色々と手を動かしつつ*1, 積ん読を消化していたのですが, 昨年最後の読書 特にこの本にオッってなりまして読み終わる寸前には, これもうすぐ読み終わるのですが、なぜ積ん読にしてたワイはってぐらい名著でし…

2020年の振り返りと2021年にやりたいこと

つい最近のビール駆動開発です 久々に技術でも本でも無い, 普通のブログです. 改めましてこんにちは, 早いもので2020年最後のエントリーになります. 今年2020年は(少なくとも人類として)生きとし生けるものすべて「COVID-19」に振り回された一年だったと思…

個人開発のプロダクトにおけるクラウド料金のはなし - GCPの年間コストをランチ一回分に抑えた話

GCP(Google Cloud Platform)を個人開発プロダクトの中心として使っているマンです. AWSやAzureなど他のクラウドサービスもそうですが, クラウドサービスを自分の財布から使ってる時ってめちゃくちゃドキドキしませんか?特にお金の話 gigazine.net 例えば…

Pythonで仕事をする人のための書籍まとめ2021 - 学習, 業務効率化, アプリ開発からデータサイエンスまで

2020年も多くの素晴らしい技術書がたくさん出ました. その中でも(昨今のトレンド・流行りも手伝ってか)Python本の多さ・充実度合いは目立つものがあります. (このエントリーを執筆した12/19時点で)Amazonの本カテゴリで「Python」と検索すると1,000件以…

Jupyterで計算・分析した何かをアプリっぽくプレゼンするまで - 33分4秒ではじめるStreamlit「雑」入門

サムネイルで出してる内容がそのままこのエントリーのテーマです. Pythonアドベントカレンダー2020の9日目です. JX通信社のシニアエンジニアで, 趣味で野球*1とヘルスケア*2なデータを分析してるマンの@shinyorkeと申します. ちょっとしたデータサイエンスで…

日本シリーズの途中ですが, チームの主砲は契約期間中に何本ホームランを打つか?AIに聞いてみました.

誰のことかは本文に答えが! かなり久しぶりに日本プロ野球のネタやってみました⚾️ 今年の野球も残すところは日本シリーズと(一番大好きな)ストーブリーグになりました. その日本シリーズですが, news.yahoo.co.jp 訓練された日ハム(パ・リーグ)ファンの…

野球好きのデータ分析初心者は「Rによるセイバーメトリクス入門」から探索するといいかもしれない

読売巨人軍, 福岡ソフトバンクホークスがリーグ優勝, ロサンゼルスドジャースが世界一となった今シーズンの野球ももうそろそろ終わりが見えてきました. CSで盛り上がったり日本シリーズに思いを馳せたり*1, 気持ちは2021年に向いていたり(?)それぞれ楽し…

エンジニアの辛い仕事をいい感じにする技術 - コンサルの仕事術・思想から学べること

エンジニアの辛い仕事を消す本かも(多分) 2014年の秋にリクルートに転職してから何社か経て今も自社サービスのエンジニアとして働いてるマンです. リクルートに入ったとき, そしてその後の転職先*1などなどで, 社内外問わずのコミュニケーションの辛さ. 社…

データエンジニアの私が機械学習・データサイエンスでオススメしたいスキルマップと本まとめ - 2020年版

要約すると, データサイエンス・機械学習周りでよく聞かれること&回答を言語化しました. 「データサイエンティストやりたい」「機械学習エンジニアになりたい」というキャリア志望を持つ方は多いと思います. 私の周りでも, 公私ともにそんな志望者の相談を聞…

40歳のPay-Off Pitch, 41歳のFirst Pitch

正直, 写真には特に意味も匂わせもありません. タイトルの通り, 40歳を終えて41歳になりました. ちなみに「Pay-Off Pitch」は野球用語で言うところの「フルカウント(3ボール2ストライク)からの一球」で*1, 「First Pitch」は言うまでも無く始球式のことで…

PyCon JP 2020を終えて - ⚾️の話とチームの話

ちょっと日が経ちましたが, 感想書いてこそ終われるのでちゃんと残します. pycon.jp オンライン開催のPyCon JP 2020, 皆さんおつかれさまでした!! 参加者の皆さんはもちろんのこと, 登壇者・スポンサーそして何よりもカンファレンスを支えた運営・スタッフ…

野球ではじめる機械学習 - 特徴量エンジニアリングとPython, Rを用いた成績予測

本日のPyCon JP 2020にてお話しました以下の発表に関する補足・解説ブログとなります. スポーツデータを用いた特徴量エンジニアリングと野球選手の成績予測 - PythonとRを行ったり来たり このエントリーではスライドのスクショとともに, 参考資料 細かすぎて…

「PythonユーザーのためのJupyter実践入門」はPythonとデータサイエンスをする人の入り口だ

待望のJupyter本, 改訂版来ました! Pythonでデータサイエンスとエンジニアリングするマンとしてかなり待望していた「PythonユーザのためのJupyter[実践]入門 改訂版」がついに来ました.*1 改訂版 Pythonユーザのための Jupyter[実践]入門作者:池内 孝啓,片…

機械学習を使った野球データサイエンス - 打者・大谷翔平選手の20代をシュッと占ってみた

やったことは非常にシンプルでして. 大谷翔平選手の26〜29歳(2020〜2024年)までの打撃成績を, 一般的な打撃成績データ(安打, 本塁打, 三振etc...)を使った機械学習でそれっぽく出してみました 大谷翔平さんはやっぱ凄い(詳細はこの後で) まだまだ改良…

「Pythonによる医療データ分析入門」は分析100本ノック後に必読な探索的データサイエンス本だった

今年読んだデータサイエンスおよびPython本の中でも最良の一冊でした. ホントに待ち望んでいた一冊でした. 実は密かに楽しみにしてた(待ち望んでいた)*1, 「Pythonによる医療データ分析入門」, 一通り読ませていただきましたので, Pythonによる医療データ…

未来のダルビッシュ有を探してみよう! - 機械学習を用いてダルさんっぽい有望株を探してみた

プロ野球が開幕し, メジャーリーグの開幕もほぼ決まり野球好きの私達に日常が徐々に戻ってきて喜びを感じている今日このごろ. 私と言えばプロ野球をガッツリ楽しみながら野球データサイエンスに勤しんでいますがこんな感じで新作ができたのでちょこっとお披…

自分プロジェクトを挫折せず続ける技術 - 個人開発をはじめよう!

職業としてエンジニアをやりたい・やってるけど(サーバーサイド→アプリエンジニア, インフラ→機械学習エンジニア的な)ジョブチェンジをしたいという方は結構いらっしゃると思います(かつての私もそんな人達の一人でした*1). エンジニアをやりたい, 別の…

野球の防御率はたまに嘘をつくのでDIPSと合わせて見てみよう - データサイエンスから学ぶセイバーメトリクス

前回は打者成績の話をしたので(予告通り)投手の成績の話をします. 投手をシーズン成績(または通算成績)で見る時, 代表的な指標として以下の3つがあります(いわゆる, 「投手三冠」の対象). 勝利数(その名の通り, 投げて勝利した回数) 奪三振(打者か…

打者の成績を数字で理解する三つの視点 - データサイエンスから学ぶセイバーメトリクス

私達が大好きなプロ野球, どうやら開幕の目処が立ちそうです⚾ www.nikkansports.com とはいえ(この記事を書いてる5/10時点では)正式発表ではないかつ, 仮に6/19開幕としてもあと一ヶ月と少し時間がありますね...ということでまだまだ #StayHome をやってく…

野球のための特徴量エンジニアリング - データサイエンスから学ぶセイバーメトリクス

新型コロナウイルスに我々はかならず勝つ!というお気持ちでずっと #StayHome している私達ですが, 野球が待ち遠しい事は変わりありません.*1 お家にいながら野球どうやってやろう :thinkingface: ...と考えた結果, 「野球データで遊ぶならずっと #StayHome …

小さいプロダクト開発におけるGCP利用の勘どころ - 個人的なプロダクトを三日でローンチした話

私個人の話なのですが. 最近は仕事でAWSやGCPのサーバレスアーキテクチャにふれる機会が増えた*1と同時に, 自分が気になる世の中のニュース(グルメとかいろいろ)だけをいい感じに集めてまとめて読みたい その中でも特に⚾, 速報とかいい感じに通知させたい …

「イシューからはじめよ」はデータサイエンスも同じだよって話をSports Analyst Meetupでしてきた⚾

言いたいことはタイトルそのままです. ちょっと前の話ですが, 2/16に開かれた「Sports Analyst Meetup #6(通称#spoana )」というイベントでこんな話をさせてもらいました. 当日はイベントそのものが大盛況でしたし楽しかったです. 聞いていただいた皆様, …

シニア・エンジニアの簡単なお仕事 - デブサミ2020で登壇しました

【TL;DR】デブサミで喋ってきました. 高く飛び続けましょうって話でした. 事前登録から多くの方々にご登録いただき, (写真は自粛しましたが)壇上から見る限り, 立ち見も出ていたみたいで感謝感激でした. 数あるセッションの中からお越しいただき(+来られ…

強いシニアを目指す - 2020年の目標と行動・スタンスのあり方

新年あけましておめでとうございます! 本年もどうぞよろしくお願いいたします :bow: 年始なので忘れない内に抱負(的な何か)とか書いちゃおうと思います. ちなみに今年の年末年始は3年ぶりくらいに東京で過ごしており, 写真の通りコード書いたりしています…

RESTful APIをシュッと作る技術 - PythonとFastAPIでバックエンドを5時間ちょいで作ってみた

久々に開発ネタです. 大晦日ハッカソン2019 #大晦日ハッカソンで, 野球のデータをシュッと見るためのDashboardを作る(理由は後ほど). そんなDashboardのBackend APIをシュッと開発する. を目標に立て現在進行系でやってるのですが, 午後の進捗その2Docker…

シニアエンジニアの懺悔とこれから - 2019年の個人ふりかえり

理想の休日です(察し) 年末年始休暇でようやっと一息つけました. ビール片手に趣味コードの読み書きができる日々が戻ってきて最&高です.*1 今年もあと少しとなりました, ふりかえろう!っていう気持ちが残ってる間に書いときます. 2019年の懺悔, 2020年ど…

Pythonを学ぶときに読むべき本2020年版 - 初心者からプロになるために

毎年恒例, Python本と学び方の総まとめです! プログラミング, エンジニアリングに機械学習と今年(2019年)もPythonにとって賑やかな一年となりました. 今年もたくさん出てきたPythonの書籍や事例などを元に, * 初心者向けの書籍・学び方 * 仕事にする方(…