Lean Baseball

No Engineering, No Baseball.

データサイエンティストとエンジニアがチームプレイでいい感じにプロダクトをつくるためには? - なんちゃってClean Architectureとテストを添えて

このエントリーを書いてる今日(9/29)と明日で有給消化期間が終わるマンです. 20日間, Banksy展を楽しんだ&新しいメガネを求めて新宿に行った以外, 地元の杉並区〜吉祥寺エリアからほぼ動きませんでした. Stay Home的な意味合いもあるのですが, 10/16(土)…

Webな事業をする会社のエンジニアから再びコンサルの世界に戻るはなし - 42歳シニアエンジニアの大冒険のはじまり

文脈的には「誕生日迎えましたやでー」という前回エントリーの続きです. まず報告ですが, 今日がJX通信社最後の出社でした。今月いっぱい休んで次に備えます。データ基盤からAIワクチン接種予測から何から何まで最高のお仕事を最高のチームでさせてもらいま…

41歳のPay-Off Pitch, 42歳のFirst Pitch - 誕生日なので近況報告など

近況報告も兼ねてたまには日記として書きます. 今日で42歳になりました. コロナ渦の中でも, 健康に元気に仕事もプライベートも生きていけているのは友人・職場の同僚・両親に家族そしてこのブログを含めて応援してくださっている方々のおかげです. いつもい…

野球のビッグデータをGCPとPySparkでいい感じに使いやすくしてみた - DataprocとGCFを使った緩いデータ基盤

最近の野球界隈の出来事が斜め上すぎて驚いてるマンです.*1 本業の仕事および, 本業じゃない個人開発や趣味プログラミングにおいて, データの量が多くて 単位やフォーマットが不揃いで それでも仕事(もしくは趣味の分析)をこなすため, いい感じの使いやす…

「実践Django」から学ぶ「プロとして学ぶ・実践すべきWebアプリケーション開発」のこと

PythonでWebアプリケーションをよく作るマンです. 来週(7/19)に発売となる, 「実践Django Pythonによる本格Webアプリケーション開発」の書籍レビューに参加させていただきかつ, 執筆者の@c_bata_さん, 出版元の翔泳社様のご厚意により一冊いただきました. …

仕事する前に知っておくと幸せかもしれないpandasのきほん - read関数にはとりあえずURL渡しておけ

お仕事や, (個人的には)趣味のデータ分析・開発などでpandasをよく使う人です. pandasはPythonでデータサイエンスやデータ分析(解析)をやってると必ずと言っていいほどよく使うライブラリだと思います. お仕事で同僚やインターンが書いたnotebookをよく…

野球AIが選ぶTOKYO 2020侍JAPAN24名 - 機械学習で忖度無く選んでみた.

※【注意】あくまでもお遊びです, 冗談半分で読んでください! 「野生の野球データサイエンティスト」です. 本日ついにTOKYO2020侍ジャパン, 24名の内定選手が発表となりました. www.japan-baseball.jp 24名の選出って難しいですよね...中の方は色々ご苦労と…

チームでもっとも貢献している(足を引っ張っている)打者は誰なのか?12球団の打者パフォーマンスを可視化してみた

2021年プロ野球が開幕して一ヶ月半くらい. 佐々木朗希がついに一軍デビューしたり, 伝統の一戦「巨人阪神戦」が昨日で通算2,000試合になったり, 日々話題に欠ける事無く楽しいですね. 日々流れてくるニュースも気になるとは思いますが, 贔屓チームを推してる…

"自分のために書いたブログ"が結果的に人の助けになる - 私が技術ブログを書き続けるモチベーションとその背景

こういう話です 昨日(4/26)の話になりますが, 週刊はてなブログの企画「エンジニアのブログ探訪」で“ブログを書き続けること #とは ”をテーマに受けたインタビューが公開されました. blog.hatenablog.com はてなブログおよびその周りの関係者および, イン…

「仕事ではじめる機械学習 第2版」を読んで思った「ソフトウェアエンジニアとデータサイエンティスト, ML Ops」のこと

このエントリーのテーマです このエントリーは, 「仕事ではじめる機械学習 第2版」出版お祝いのエントリーとなります. 仕事ではじめる機械学習 第2版作者:有賀 康顕,中山 心太,西林 孝オライリージャパンAmazon 私自身, 第1版登場の2018年頃*1から「機械学習…

自分のデータ分析のためにRedashを構築した話 - 個人開発におけるデータ分析環境つくりとコストについて

久々に個人開発のはなしです. 昨年(2020)の話になりますが, 自分が気になる世の中のニュース(野球とかグルメとかいろいろ)だけをいい感じに集めてまとめて読みたい その中でも特に⚾, 速報とかいい感じに通知させたい ...という目的でデータ収集と通知の…

ダルビッシュ有さんは今シーズン何勝するのか? - 39歳までの成績をデータサイエンスで予測してみました

プロ野球とメジャーリーグの開幕が待ち遠しい人です⚾ 日米ともにオープン戦もはじまり, 球春が盛り上がってまいりました. 個人的には贔屓球団の動向*1がすごく気になるのですが, full-count.jp 昨年34歳にして初の最多勝, サイ・ヤング賞を惜しくも逃した*2…

誠意は言葉ではなくコードを書くこと - 2021年の目標・行動・スタンスについて

写真は近所で散歩した時に適当に撮ったやつです, 特に深い意味はありません. このエントリーはいわゆる「今年の抱負」的なやつです. 気がつけば1月も終わり, 2月も半分が過ぎ, 雪が溶けて河になって流れてゆく季節が近づいてるのお〜という気候になってしま…

自分でシュッとデータ分析をできる人になろう - 「データ分析人材になる。」から学んだこと

新年あけましておめでとうございます 年末年始は色々と手を動かしつつ*1, 積ん読を消化していたのですが, 昨年最後の読書 特にこの本にオッってなりまして読み終わる寸前には, これもうすぐ読み終わるのですが、なぜ積ん読にしてたワイはってぐらい名著でし…

2020年の振り返りと2021年にやりたいこと

つい最近のビール駆動開発です 久々に技術でも本でも無い, 普通のブログです. 改めましてこんにちは, 早いもので2020年最後のエントリーになります. 今年2020年は(少なくとも人類として)生きとし生けるものすべて「COVID-19」に振り回された一年だったと思…

個人開発のプロダクトにおけるクラウド料金のはなし - GCPの年間コストをランチ一回分に抑えた話

GCP(Google Cloud Platform)を個人開発プロダクトの中心として使っているマンです. AWSやAzureなど他のクラウドサービスもそうですが, クラウドサービスを自分の財布から使ってる時ってめちゃくちゃドキドキしませんか?特にお金の話 gigazine.net 例えば…

Pythonで仕事をする人のための書籍まとめ2021 - 学習, 業務効率化, アプリ開発からデータサイエンスまで

2020年も多くの素晴らしい技術書がたくさん出ました. その中でも(昨今のトレンド・流行りも手伝ってか)Python本の多さ・充実度合いは目立つものがあります. (このエントリーを執筆した12/19時点で)Amazonの本カテゴリで「Python」と検索すると1,000件以…

Jupyterで計算・分析した何かをアプリっぽくプレゼンするまで - 33分4秒ではじめるStreamlit「雑」入門

サムネイルで出してる内容がそのままこのエントリーのテーマです. Pythonアドベントカレンダー2020の9日目です. JX通信社のシニアエンジニアで, 趣味で野球*1とヘルスケア*2なデータを分析してるマンの@shinyorkeと申します. ちょっとしたデータサイエンスで…

日本シリーズの途中ですが, チームの主砲は契約期間中に何本ホームランを打つか?AIに聞いてみました.

誰のことかは本文に答えが! かなり久しぶりに日本プロ野球のネタやってみました⚾️ 今年の野球も残すところは日本シリーズと(一番大好きな)ストーブリーグになりました. その日本シリーズですが, news.yahoo.co.jp 訓練された日ハム(パ・リーグ)ファンの…

野球好きのデータ分析初心者は「Rによるセイバーメトリクス入門」から探索するといいかもしれない

読売巨人軍, 福岡ソフトバンクホークスがリーグ優勝, ロサンゼルスドジャースが世界一となった今シーズンの野球ももうそろそろ終わりが見えてきました. CSで盛り上がったり日本シリーズに思いを馳せたり*1, 気持ちは2021年に向いていたり(?)それぞれ楽し…

エンジニアの辛い仕事をいい感じにする技術 - コンサルの仕事術・思想から学べること

エンジニアの辛い仕事を消す本かも(多分) 2014年の秋にリクルートに転職してから何社か経て今も自社サービスのエンジニアとして働いてるマンです. リクルートに入ったとき, そしてその後の転職先*1などなどで, 社内外問わずのコミュニケーションの辛さ. 社…

データエンジニアの私が機械学習・データサイエンスでオススメしたいスキルマップと本まとめ - 2020年版

要約すると, データサイエンス・機械学習周りでよく聞かれること&回答を言語化しました. 「データサイエンティストやりたい」「機械学習エンジニアになりたい」というキャリア志望を持つ方は多いと思います. 私の周りでも, 公私ともにそんな志望者の相談を聞…

40歳のPay-Off Pitch, 41歳のFirst Pitch

正直, 写真には特に意味も匂わせもありません. タイトルの通り, 40歳を終えて41歳になりました. ちなみに「Pay-Off Pitch」は野球用語で言うところの「フルカウント(3ボール2ストライク)からの一球」で*1, 「First Pitch」は言うまでも無く始球式のことで…

PyCon JP 2020を終えて - ⚾️の話とチームの話

ちょっと日が経ちましたが, 感想書いてこそ終われるのでちゃんと残します. pycon.jp オンライン開催のPyCon JP 2020, 皆さんおつかれさまでした!! 参加者の皆さんはもちろんのこと, 登壇者・スポンサーそして何よりもカンファレンスを支えた運営・スタッフ…

野球ではじめる機械学習 - 特徴量エンジニアリングとPython, Rを用いた成績予測

本日のPyCon JP 2020にてお話しました以下の発表に関する補足・解説ブログとなります. スポーツデータを用いた特徴量エンジニアリングと野球選手の成績予測 - PythonとRを行ったり来たり このエントリーではスライドのスクショとともに, 参考資料 細かすぎて…

「PythonユーザーのためのJupyter実践入門」はPythonとデータサイエンスをする人の入り口だ

待望のJupyter本, 改訂版来ました! Pythonでデータサイエンスとエンジニアリングするマンとしてかなり待望していた「PythonユーザのためのJupyter[実践]入門 改訂版」がついに来ました.*1 改訂版 Pythonユーザのための Jupyter[実践]入門作者:池内 孝啓,片…

機械学習を使った野球データサイエンス - 打者・大谷翔平選手の20代をシュッと占ってみた

やったことは非常にシンプルでして. 大谷翔平選手の26〜29歳(2020〜2024年)までの打撃成績を, 一般的な打撃成績データ(安打, 本塁打, 三振etc...)を使った機械学習でそれっぽく出してみました 大谷翔平さんはやっぱ凄い(詳細はこの後で) まだまだ改良…

「Pythonによる医療データ分析入門」は分析100本ノック後に必読な探索的データサイエンス本だった

今年読んだデータサイエンスおよびPython本の中でも最良の一冊でした. ホントに待ち望んでいた一冊でした. 実は密かに楽しみにしてた(待ち望んでいた)*1, 「Pythonによる医療データ分析入門」, 一通り読ませていただきましたので, Pythonによる医療データ…

未来のダルビッシュ有を探してみよう! - 機械学習を用いてダルさんっぽい有望株を探してみた

プロ野球が開幕し, メジャーリーグの開幕もほぼ決まり野球好きの私達に日常が徐々に戻ってきて喜びを感じている今日このごろ. 私と言えばプロ野球をガッツリ楽しみながら野球データサイエンスに勤しんでいますがこんな感じで新作ができたのでちょこっとお披…

自分プロジェクトを挫折せず続ける技術 - 個人開発をはじめよう!

職業としてエンジニアをやりたい・やってるけど(サーバーサイド→アプリエンジニア, インフラ→機械学習エンジニア的な)ジョブチェンジをしたいという方は結構いらっしゃると思います(かつての私もそんな人達の一人でした*1). エンジニアをやりたい, 別の…