Lean Baseball

No Engineering, No Baseball.

「イシューからはじめよ」はデータサイエンスも同じだよって話をSports Analyst Meetupでしてきた⚾

言いたいことはタイトルそのままです.

ちょっと前の話ですが, 2/16に開かれた「Sports Analyst Meetup #6(通称#spoana )」というイベントでこんな話をさせてもらいました.

当日はイベントそのものが大盛況でしたし楽しかったです.

聞いていただいた皆様, 運営の皆様素敵な機会とフィードバックをいただきありがとうございました.

このエントリーはそんな#spoanaでお話させていただいたことを振り返りつつ, 原則論であり大切なアクションである「イシューからはじめよ」という話を交えて補足したいと思います*1.

TL;DR

このエントリーで言いたいことの要約です. あえて一言で言うと「イシューからはじめよ」を実践しましょう!

  • 「どこが問題か?を見極める」「数字じゃなくて答えを出す」ことにこだわり, やっていくとデータサイエンスは捗る(しそれが基本)
  • ガチでスポーツ・アナリティクスをやるなら, スタジアムに行く時間を削ってでもプログラミングと数学を頑張りましょう.
  • スタジアムに行けない今は悲しいですが, むしろデータサイエンス・分析のチャンスかもしれないよ?

スタメン

スポアナで話したこと

実は以前から話したいテーマでした.

  • データサイエンスでプログラミングはマストじゃない. ISSUEに合わせて道具を変えよう(≒道具への偏った拘りはナンセンス)
  • 「どこが問題か?を見極める」「数字じゃなくて答えを出す」にフォーカスしよう(大事なのは指標そのものじゃなくて課題設定とその答え)
  • 言うてもPythonとセイバーメトリクス楽しいやで!

...というのを, 「仕事としてスポーツアナリティクスをしたい人」「趣味としてスポーツアナリティクスを楽しみたい人」に話せればいいなと思い, いい感じに話をまとめました.

登壇のきっかけ

そもそものキッカケですが, 前回のスポアナに参加した際, 運営の皆さんに「もしよかったら次ロングトークとかしたいです」とお話した所, 早速オファーを頂いたのが登壇のキッカケでした.

時期的に, デブサミが近かったこと, どっちも野球の統計(セイバーメトリクス)の話を織り交ぜる前提だったので同時並行で準備を進めていい感じにやりました.*2

知らない人に”よく聞かれること”をタイトルに

話す内容は前述の通り,

  • ISSUEに合わせて道具を変えよう
  • 「どこが問題か?を見極める」「数字じゃなくて答えを出す」にフォーカス
  • Pythonとセイバーメトリクス is 最高!

だったのですが, 正味な話タイトル決めるのがおっくうで当面の間「イマドキなスポーツアナリティクスのためのプログラミング入門 - セイバーメトリクス風味」という仮タイトルで進行中, ふと書いたこの一枚のスライド.

f:id:shinyorke:20200227165335p:plain
ネタっぽく書いたやつがそのまま本タイトルに

これが発表の一週間前に降臨してきたのでそのまま採用しました.

実際問題, そもそも発表したかった背景の一つとして,

  • TwitterやFacebookなどで, はじめましての人・アカウントからくる最初のメッセージが「Pythonおしえてください」「野球のデータ分析やりたい」
  • 原則として, 自分のSNSはメンション・DMの返信は確約しない方針かつ, これらはノウハウの話も多分に含まれているためタダで返答はまずありえない.
  • とはいえホントにこれらのメッセ多いのと, いい加減共通回答あってもいいなぁ.

という課題を解決したかったのでやりました.

そんなエピソードを最初に軽くお話したのですが,

33.4%はいつもの鉄板ネタなので察しですが笑, 同じく当日ロングトークされていた廣澤さんをはじめ, 他数人の方から後日同じようなメッセ・問い合わせが来るなあって事で結果的には「プロもしくは元プロのスポーツアナリティクスな人」の共通課題として捉えてもらえたみたいでラッキーでした, こういう話はどこかしら年中あるわけで*3.

あなたのイシューはなんですか?

発表内容としては, セイバーメトリクスの統計モデル(類似性スコア)を使ったデモを先頭打者として, プログラミング言語や選び方の話, 学習の心構え(後述)などを話したのですが.

本命の話は,

「ISSUEの程度に合わせて道具を選ぼう, プログラミング云々を語るのはナンセンス」

でした.

f:id:shinyorke:20200227173024p:plain
すぐ出せるものか?段階を踏むものか?どっち??

昨今のデータサイエンスとか統計, AIブームもそうなのですがどうしても手法や手段の話題が先行しがちです.

が実際の仕事だと,

  • そもそも解きたい課題, いわゆる「イシュー」ってなんだ?それは解像度が高い(答えが出る)話なのか?
  • 雑でもいいからイシューに対する答えを出す, 答えから新しいイシューを作ってさらに実験していく
  • ドメイン知識も大事だが, まずは課題・事象を構造的に理解する&解像度が低ければ不要なものを捨てる.

ことが基本かつ, 上手くいくときはこれらがきれいに回るケースです(≒大抵の場合, これがきれいにできないから上手く行かない*4

仕事にしても趣味にしても, スポーツアナリティクスで成果を出したい!という人はぜひ,

  • やりたいこと・課題に感じていることをまず構造的に分解し, 言語化する
  • 言語化したことの「インプット」「アウトプット」を決め, 手を動かして実験してみる
  • 実験結果を#spoanaなり#bpstudy(Baseball Play Study)なりで話してみたり, ブログにしてみたりする

を繰り返しながら課題を作る・捉える力を養うと良いのかなって思っています.

そしてこれはそのまま「イシューからはじめる」話なのでぜひこれを参考にしてほしいかなとも思います.

イシューからはじめよ――知的生産の「シンプルな本質」

イシューからはじめよ――知的生産の「シンプルな本質」

  • 作者:安宅和人
  • 発売日: 2010/11/24
  • メディア: 単行本(ソフトカバー)

どんなにPythonやRを使いこなしても, データサイエンス・統計の知識に優れていても「本当にやるべきイシュー」が作れない・捉えられない人はこの手の仕事無理です.

っていうことです.

ファン心理は課題特定(と仕事にする時)の大きな障壁

「あなたのイシューはなんですか? 」は, スポーツアナリティクスのみならず, データサイエンスやる人の全員の共通事項かと思いますが.

スポーツアナリティクスの文脈で言うとこれが一番話したい内容でした.

f:id:shinyorke:20200227160934p:plain
一言で言うとこういう話でした.

本気でスポーツアナリティクスで結果出したければ球場に行く以上にプログラミングと数学に没頭しましょう, リソース割こうぜ!

そういう話です.

特に, スポーツアナリティクスを仕事にしたい人・希望している人からよく聞く話なのですが,

  • 「映画のマネー・ボール」にあこがれてスポーツデータ分析の仕事をしたくなりました
  • 野球は好きで, ○○のファンです&球場によく行きます, 応援歌をスラで歌えます, etc...
  • 「プログラミングに興味」があって「今勉強している最中」です

人それぞれ多少ブレはありますがこれがステレオタイプで, そんなあこがれを持たれている皆さんに,

若い人もミドル・シニアの人も, この現状でデータ分析の仕事に就くのは厳しいですよ?考え方・生活スタイル変えていかないとキッツイですよ??

というニュアンスでブログ等で発信している(つもり)なのでこれを敢えて明確に言うことにしました.

  • 映画のマネー・ボールは正直データ分析の話はありません, データサイエンスな話は書籍の方がより素晴らしいです.*5
  • 野球好きは私も一緒で, 球場によく行く人・応援や選手のことを知っている人は個人として深くリスペクトします. が, セイバーメトリクスや統計的な世界線ではたして役立つでしょうか?*6
  • プログラミングに興味・勉強中は素晴らしいし応援します. が, お給料を稼ぐレベルに到達するのは「興味」「勉強中」だけでは不足しています.*7

データアナリスト・サイエンティスト(とエンジニア)は色んな局面で客観性・言語化力を求められる職種な一方, 「ファンとしての心理・行動」は主観性が大変強いモノで相性はあんまり良くない, 趣味でスポーツアナリティクスをするときも「客観性」があればあるほどより良い内容になります.

発表中, 壇上から眺めた感じですとこの前後の話をした時が一番静かだった気がするのできっと伝わってるのかな?

ちょいと厳しい話・視点かもですが本気でやりたい方の刺激・参考になれば幸いです.

結び - スタジアムに行けない私たちが今すべきこと

これはまさについ最近のホットトピックスですが.

npb.jp

オープン戦がすべて無観客になったり, 他競技ですと公式戦の延期・無観客試合への変更も多く聞いています.

これは1ファンとしてのわたしも辛いです...が!?

「野生の野球データサイエンティスト的には仕込みの時間がもらえるぞ!!!」

というチャンス・モチベーションにもつながっています.

これは私が球場に行くより, ネットやTV観戦しながらデータを眺めたり分析するのが大好きだからってのもありますが,

本気でスポーツアナリティクスを目指す人, 特に仕事にしたい人はこのタイミングを活かして挑戦してみては?

と思っています&実際に仕事にした先輩としてもこれを強くおすすめします.

今度は#spoanaでもっとオタク(かつ良質なISSUEとしての)ネタをやりたいな...

*1:ホントはもうちょっと早く振り返るつもりでしたが, かなり良い感じのお祭りがあったため遅れました苦笑, この顛末の話はきっと会社のブログとかで披露できるはず&FASTALERTよろしくお願いいたします!

*2:という事情で, スライドの約2割はデブサミからの使い回しですが話の軸は全く異なる内容となっています.

*3:個人的な本音は「人に聞く前にまずやってみてからだろ」「人のノウハウ・知見は聞けばタダで教えてくれるようなもんじゃないぞ」なのですが, そこで突き放すのもアレなので発表にしたったって意味合いもあります.

*4:偉い人や上司に言われてAIプロジェクトが上手く行かない・頓挫するケースとかわかりやすいと思います, ちなみにこの手の話に不幸にも巻き込まれた時はポジティブにとらえて試したいことをやる, それを上手く成果として着地するようにすると良いでしょうとも思います(過去の経験より&スポアナでもそんな感想・フィードバックありました)

*5:データなオタクが救う風の話にまとまってる映画版は単体作品として面白いですが決してデータサイエンスな話ではありません.

*6:マーケティング等で約立つのはわかりますけどね.

*7:という話は去年機会あって話をしてみました.このエントリーを参照.