Lean Baseball

No Engineering, No Baseball.

40歳のPay-Off Pitch, 41歳のFirst Pitch

f:id:shinyorke:20200905113453j:plain

正直, 写真には特に意味も匂わせもありません.

タイトルの通り, 40歳を終えて41歳になりました.

ちなみに「Pay-Off Pitch」は野球用語で言うところの「フルカウント(3ボール2ストライク)からの一球」で*1, 「First Pitch」は言うまでも無く始球式のことです.

なお, 例のリストです, ご査収ください.

このエントリーでは, 来年の今頃自分がふりかえったり何かを確認できたりできるよう,

  • 40歳のPay-Off Pitch(ふりかえり)
  • 41歳のFirst Pitch
  • もう少し先のはなし

ぐらいで色々書きたいと思います.

40歳のPay-Off Pitch(ふりかえり)

このエントリーはまさに40歳最後の日(9/5)に書いてます.

仕事と外部活動

まず, 40歳最初の年(2019/9〜2020/8)は,

  • 転職
  • デブサミ・PyCon JP登壇(いずれも2年ぶり)
  • 本格的な副業(技術顧問ほか)
  • 本格的なリモートワークへの移行(理由は言うまでもなく流行病のアレ)

ふりかえると色々ありました.

大きなイベントとしては, 40歳というタイミングに合わせたかのように野球エンジニア(仕事の方)を卒業, 現職であるJX通信社に転職しました.

shinyorke.hatenablog.com

自分が常に心にもっている, 「生涯イチ・エンジニア」「No Engineering, No Baseball.」を貫く意味でも欠かせない転機でしたし, (面倒くさいので細かい話は省きますが)新天地としてJX通信社を選択したのは間違っていなかったです.

年度単位(弊社, 新年度が9月スタートなのです)で振り返って出てきた一言がこれなのでそうなのでしょう(適当)

話の軸を去年に戻すとして, 入社した10月〜デブサミに登壇した2月くらいまでは, 会社のミッションとしてやりたいこと, エンジニアな自分としてどういうキャリアを形成していくか🤔, をかなり真剣に悩み・考えていた気がします.

一つのアクションとして, 「過去を清算(まさにPay-Off Pitch!笑)して未来の話をしよう」と思い立ち, デブサミに応募して通ったのでやったりました.

shinyorke.hatenablog.com

「前回(2018年)の登壇で高らかに野球エンジニア宣言したけどテノヒラクルーしてすまんな」報告を兼ねてのキャリアの話, 自分自身の脳内整理としてよかったです.

機会を頂いた皆様ありがとうございました🙇‍♂️

仕事は...色々やった気がします.

ainow.ai

tech.jxpress.net

外に出る成果としてはこんな感じでしょうか.

社内のデータ基盤を整えながら,

  • 超優秀な同僚たち, インターンの皆さんと一緒にデータドリブンでひたすら改善サイクルを回す
  • データ活用しようぜ活動(社内もくもく会など)

をかなり試行錯誤しながらやりました. 一つ一つのタスク・仕事は既視感ある事でしたが総合的には色んな学びや経験を積めた気がします.

あとエンジニアリング関係だと微力ながらも新型コロナウイルス関連の弊社サービスの開発にコントリビュートしたことかな...サービスを通してインパクトあることをやれたの最高でした.

また, (ビジネスマンとしての私の強みの一つである)採用・広報(主にエンジニア方面)もがんばりました.

これは言えないことだらけなので省略しますが, 言えることがあるとするならばPyCon JP 2020において, JX通信社として過去最高に存在感を出せたことかなと思います.

shinyorke.hatenablog.com

登壇資料・ブログ合わせて5本のホットエントリー + 実況配信システム*2ってすごくないですか?

チームとしてこのイベントを乗り切ったのが最高でした. 初日夜に社内Zoom飲みしたの最高🍻

個人的な活動

(仕事でやってることの延長線上ではありますが)個人OKRを半期ごとに立てて自分をドリブンするようなリズムに変えました.

note.com

note.com

自分自身の目標ややりたいことがブレる事無いよう, 常に目標をもって取り組みたいマンとしてOKRというFrameworkはメッチャしっくり来ています.

今までは誕生日と年末年始でふりかえっていましたが今後はOKRガツッとやろうと思います(気が変わらない限り)

野球の研究ですがこの一年でやったことはPyCon JP 2020の発表としてまとまっています.

shinyorke.hatenablog.com

仕事でやってるデータ基盤整備と分析に加え, 「野生の野球エンジニア」「野生の野球データサイエンティスト」としてガチ機械学習で予測タスクをこなしたのは最高に良かった.

また, 今までの経験値を活かして(かつ, 大切な仲間たちからのお誘いもあり)技術顧問的な副業もスタートしました.

note.com

作業スペースを拡張したり, 元々オンラインで働ける状況を作っていたことが色々とプラスに働きました.

ちなみに副業は, 今若干余裕あるので(本職に影響しない事を条件に*3)オファー, お待ちしております.

もう少しプライベートな話をすると, コロナ渦の中でも運動をしたり節制したりで健康に気を使ったり, 引きこもり時間が長くなったのでゆるい趣味プログラミングをしたり(かなり制限あるけど)婚活*4がんばったりしてます.

41歳のFirst Pitch

じゃあ41歳どうすんの?って話ですが, 直近はココに書いてあるOKRが物語っている説あります(本日二度目の登場)

note.com

ガツッとバリューを出して魅力的な40代男性であるよう, 「明日の自分は今日の自分を超えるやで」的なウザい意識の高さでやっていこうと思います.

ちなみに近況めいた所で言うと,

  • 仕事のミッションかわりました. データ基盤・分析マンからフルスタックなミッションに変貌.
  • 「野生の野球データサイエンティスト・エンジニア」活動的には今月から新章スタート.
  • プライベート, もうちょっと大事にします.

的な所で動いたり変えたりしています.

大変ありがたい事に, 心身ともに元気で今の所マイナスで考えるような事も少ないので(無理無茶しない程度に)攻めるような動きをできたらと思います.

とはいえ, (リーマン・ショックや311で色々と大変な経験に遭遇したマンとしては)この先の変化に備える・構えることも必要かなと思っています.

その変化があってもぶれない・驚かないようにいい感じにやっていきたいですね.

もう少し先のはなし

これは自分が結婚したり家庭持ったり的な前提もあるかもですが(今は無いが).

生活の拠点を二箇所(例えば東京と地元北海道)にしたいとか, そもそも東京じゃなくても良くね?とか考えたりもしています.

人生設計という意味でもこの2〜3年は特に大事に過ごしたいなと思います.

最後になりましたが, いつも支えてくださっている皆様(家族, チームメンバー, 素晴らしき友人たち)すべてに感謝いたします🙇‍♂️

今後ともよろしくどうぞ⚾️

*1:日ハム戦の中継聞いてる人にはおなじみのワードかと笑

*2:ちなみに私は開発にコントリビュートし...ませんでした

*3:具体的には時間とか対象の業界ですね. 流石にニュース系・報道系はアカンとか.

*4:何がどうなのかはここではノーコメントで

PyCon JP 2020を終えて - ⚾️の話とチームの話

ちょっと日が経ちましたが, 感想書いてこそ終われるのでちゃんと残します.

pycon.jp

オンライン開催のPyCon JP 2020, 皆さんおつかれさまでした!!

参加者の皆さんはもちろんのこと, 登壇者・スポンサーそして何よりもカンファレンスを支えた運営・スタッフの皆さんが一番大変だったんじゃないかなと...ホントおつかれさまでした!!

f:id:shinyorke:20200902225305j:plain

Speaker Tシャツもしっかり頂きました, ありがとうございます!*1

このエントリーでは例のごとくPyCon JP 2020のふりかえりを,

  • 自分の話⚾️
  • チームの話
  • 全体を通して&来年どうする

的な話をシュッと残したいと思います.

自分の話⚾️ - 登壇しました

前のエントリーでも触れたとおり, 登壇しました.

shinyorke.hatenablog.com

話の内容や補足は上記のスライドとエントリーに譲ります*2.

発表動画はアーカイブで公開...のハズなのでお待ちいただければと思います.*3

ずーーーっと前からやろうと思ってやれていなかった,

  • 成績予測モデルを作る
  • ↑のアプローチとして機械学習ネタをやる

これらをすべてやりきりました.

ちなみに発表中は中々盛り上がりました.

togetter.com

ライブで見た方はご存知かと思いますが, 「やきうのじかんだあああああ」は事前に仕込みました.

オンラインでも一体感ほしいなといろいろ考えた結果, 一番乗りやすいやつがいいかなと.*4

個人的なPyCon JP 2020屈指の名シーンでした.

チームの話 - JX通信社のあれこれ

言うまでもなく, 自分がコントリビュートしているチーム, JX通信社の話です.

会社としては,

  • シルバースポンサーとして協賛
  • SNS(Twitter)実況配信システムの新規開発&提供
  • @YAMITZKYさんと私の2名が登壇

ということで, 色々とやりきってやりました.

jxpress.net

目に見える反響としては, (先程紹介した自分のスライド・ブログ含めて)4本 + 1本の発表資料・ブログがホットエントリー入りしたことですかね.

tech.jxpress.net

yamitzky.hatenablog.com

実況システムに@YAMITZKYさんの登壇と, チームで参加できた感は最高でした.

社内では業務の合間に実況システムの開発に何人かのメンバーがコントリビュートしたり*5, CfPや登壇資料を複数人のメンバーで社内オンラインもくもく会をしながら執筆&相互レビューしたりと, チームの強みを発揮できたのは最高に良かったです.

当日も実況システムの運用・通常業務の合間を縫って発表を見守ってくれたりと嬉しかったです, 社内Slackの反響はすごかったなそういえば(もちろんお見せできません!笑)

また個人的には,

この夢がかなったのがすごく嬉しかったです.*6

実現に動いてくださった, JX通信社のチームの皆様おつかれさまでしたそしてホントに本当にありがとうございました🙇‍♂️

全体を通して & 来年どうする

全体を通しての感想として, オンラインの不安と期待(特に前者)はあったのですが終わってみたらいい感じに盛り上がったし良かった感あります.

個人的には初日(8/28)が自分の発表の最終調整&リハーサル, 二日目(8/29)が発表疲れ&所用でほとんど参加できなかったのが惜しかった...懇親会ちょっとでも顔出せばよかった.

トークについても初日の基調講演の最後の方と, @YAMITZKYさんの発表をライブで見て, その他は気になるものをアーカイブで見た以外あんまり追えていません, オススメあったらクレメンス.

ちなみに来年の事はまったく考えていませんが, オンラインだろうがリアル開催だろうが決まったら参加しますし, なんやかんやで登壇したり登壇に向けてコンテンツを作る・磨くのは最高に好きなので何かしらの形でコントリビュートしたいというお気持ちです.

野球の研究だってまだまだ続きます, 次回作にご期待ください.*7

なお, PyCon JP 2020の後夜祭...って訳じゃないですが自分のもくもく会コミュニティで緩くふりかえりたいと思っていますのでお時間ある方ぜひ来てください!(オンラインです)

jisyupy.connpass.com

大切なので二度言いますが,

参加者の皆さんはもちろんのこと, 登壇者・スポンサーそして何よりもカンファレンスを支えた運営・スタッフの皆さんが一番大変だったんじゃないかなと...ホントおつかれさまでした!!

*1:一度も袖を通してないとか大きな声では言えない(小声)

*2:どちらも多くの方に読んでもらえて嬉しいですありがとうございます!

*3:YouTube LIVEのアーカイブそのものは編集?かなにかで公開が切れていました...ので公開次第リンク貼ります🙇‍♂️

*4:というのも, 自分の⚾️ネタを毎度楽しみにするお友達が多く, その方が「やきうのじかんだあああああ」といつもつぶやいてくれるのでその皆さんへの感謝とリスペクトという意味もあります.

*5:余談ですが私はコントリビュートしませんでした(登壇+αの役割に全振りしたため)

*6:友人や知人の会社のプレスを見ていて正直羨ましかったのですが, この実績を自分も解除できてスッキリしました, ホント嬉しかった🤣

*7:次回作の構想はすでにあります, Pythonネタじゃない可能性も高いので出す場所どうしよう感はありますがデータサイエンスは絡むのでまあいいかなと.

野球ではじめる機械学習 - 特徴量エンジニアリングとPython, Rを用いた成績予測

本日のPyCon JP 2020にてお話しました以下の発表に関する補足・解説ブログとなります.

スポーツデータを用いた特徴量エンジニアリングと野球選手の成績予測 - PythonとRを行ったり来たり

このエントリーではスライドのスクショとともに,

  • 参考資料
  • 細かすぎて本編で話さなかったハナシ
  • もし真似してやるならこれぐらいは読んでおいたほうがいいよ

的な話を中心に, 過去記事のreference等を掲載しています.

スポーツデータを用いた特徴量エンジニアリングと野球選手の成績予測

これを読むと⚾️で特徴量エンジニアリングと機械学習がいい感じにできるかと思います👍

スタメン

CM

いきなり宣伝で恐縮ですが汗

JX通信社

f:id:shinyorke:20200828155737j:plain

月並みですが, Techブログはぜひ!

JX通信社エンジニアブログ

また, 本日は午前中に@YAMITZKYさんがTalkをしました.

Pythonもくもく自習室 #jisyupy

f:id:shinyorke:20200828160035j:plain

以前は #rettypy としてやっていたもくもく会です.

Pythonもくもく自習室 - connpass

なお次回は9/19(土)にオンライン開催します, 来てね.

jisyupy.connpass.com

特徴量エンジニアリングについて

今回の発表の第一の話でした.

f:id:shinyorke:20200828174015j:plain

まず, 特徴量エンジニアリングについては以下の名著を参考にしました.

これはマストハブです, 説明とかアプローチが良いです.

野球データの特徴量

f:id:shinyorke:20200828174152j:plain

野球の特徴量についてはこのブログで執筆した以下のエントリーが下敷きになっています.

shinyorke.hatenablog.com

shinyorke.hatenablog.com

shinyorke.hatenablog.com

どれも読み応えあるエントリーですが参考になると思います.

Python, R, SQLの違い

f:id:shinyorke:20200828174343j:plain

これも去年執筆したエントリーが元になっています.

shinyorke.hatenablog.com

それぞれの違いと特徴量エンジニアリングにおける視点で試したことを書いています.

野球ではじめる機械学習

f:id:shinyorke:20200828174703j:plain

まず, 全編を通してプロジェクトの進め方・ピボットのやり方は「仕事ではじめる機械学習」を参考にしました.

仕事ではじめる機械学習

仕事ではじめる機械学習

Planning

f:id:shinyorke:20200828174851j:plain

PECOTAはウィキペディアに書いてることが一番良い感じかもです.

ja.wikipedia.org

そしてネイト・シルバーがその後やったことはシグナル&ノイズで話が載ってるのでこれはオススメです.

また, Analyzing Baseball Data with Rはこちらです.

ちょっと高い書籍ですが約立つこと待ったなし.

Data Engineering

主にBigQueryのはなし.*1

f:id:shinyorke:20200828175236j:plain

エンジニアリング的にはBigQuery Client使おうという直球勝負でした.

f:id:shinyorke:20200828175453j:plain

これの元ネタはJX通信社Techブログにあります.

tech.jxpress.net

Feature Engineering

特徴量を出すために泥臭くやったところ.

f:id:shinyorke:20200828175744j:plain

これは特段追加コメント無いな...割愛.

Clustering

ANNでクラスタリングしました.

f:id:shinyorke:20200828180244j:plain

これは発表中でも触れたとおりこのブログでやってました.

shinyorke.hatenablog.com

そして本編の発表では寄り道になるので端折りましたが, 昔は「類似性スコア」という野球独特のアルゴリズムを使ってクラスタリングやってました.

shinyorke.hatenablog.com

Predict

f:id:shinyorke:20200828181430j:plain

その名の通り成績を作るタスクです.

f:id:shinyorke:20200828181620j:plain

マット・チャップマンはオークランド・アスレチックスの若手三塁手で攻守ともに優れたスーパースターです.

www.mlb.com

これも最初期のアルゴリズムはこんな感じでやってました.

shinyorke.hatenablog.com

ちなみに上記ブログのやつは発表したモノとちょっと違うアルゴリズムでやってます.

が, 雰囲気でいい感じにできたのでこれでPyCon大丈夫や!ってなりました.

Presentation

f:id:shinyorke:20200828181915j:plain

今多分おそらく流行っているStreamlitを使おう!と思い立ちやってみました.

www.streamlit.io

これは, Pythonもくもく自習室で@takapyさんのプレゼンをみて真似してやろうと決意し, やってみたら案外爆速でできて笑っちゃいました.

今回やったネタはいずれちゃんとこのブログでも書くつもり.

結び

特徴量エンジニアリングについてのまとめと個人開発について記載しました.

特徴量エンジニアリング

f:id:shinyorke:20200828182635j:plain

この辺は特徴量エンジニアリングおよび前処理大全に詳しいです.

この2冊をいい感じにやったらイケると思います.

個人開発と機械学習

f:id:shinyorke:20200828182813j:plain

これは以前書いたこちらのエントリーが下敷きになっています.

shinyorke.hatenablog.com

個人開発はデータサイエンスでも有効ですやってきましょ!

その他の参考書籍

アルゴリズムの選定・実装は機械学習図鑑が参考になりました.

ご清聴ありがとうございました

PyCon JP 2020の感想やその他の話は別途エントリーで触れたいと思います!

ご清聴・ご視聴ありがとうございました🙇‍♂️

*1:ホントは会社の仕事ネタでデータ基盤の話をCfPとして出していたのですが, そっちが落っこちたのでその名残でこの項を比較的厚めにやりました.