Lean Baseball

No Engineering, No Baseball.

自分でシュッとデータ分析をできる人になろう - 「データ分析人材になる。」から学んだこと

新年あけましておめでとうございます🎍

年末年始は色々と手を動かしつつ*1, 積ん読を消化していたのですが,

f:id:shinyorke:20210108222907j:plain
昨年最後の読書🍺

特にこの本にオッってなりまして読み終わる寸前には,

...という感想が出る程度にこちらの書籍に興奮しました.

データを使って仕事をする人は(データサイエンティストに限らず)サラッと読んだほうがええやぞ!

というぐらい良い本だったという話を2021年最初のブログとして書きたいと思います.

TL;DR

「データ分析はデータサイエンティスト・アナリストがやるもの」という考えは2020年で終わりです, 2021年以降は自走できる人になりましょう.

  • データサイエンティスト・アナリストとビジネスな人をつなぐ「ビジネストランスレーター」は良いキャリアパスになりそう.
  • 「データ分析」は, ある程度自分でやれる・理解できるとより仕事の幅が広がります.
  • データサイエンス, 統計も重要ですがまずは手を動かしてみよう(プログラミング・SQLはマストじゃない).

おしながき

【感想】データ分析人材になる

データ分析人材になる。目指すはビジネストランスレーター」は, 昨年10月に出版された書籍です.

ジャンルとしては「ビジネス書」といえる書籍で, Amazonの説明文によると,

「データ分析はデータサイエンティストの仕事」というのは、もはや古い考え方です。最近では「ビジネストランスレーター」という役割も重要視されています。「データサイエンティスト」でなければできない高度な分析はありますが、ビジネスで役立てるには、必ずしも高度な分析は必要ありません。

かなり刺激的なひと言から始まってますがホントそのとおりで,

  • データ分析・サイエンティストな仕事の成功事例・失敗事例の紹介.
  • データ分析な仕事・プロジェクトを進める「5Dフレームワーク*2」の紹介.
  • 5Dフレームワークを使いこなせるようなデータ分析人材の育成法.

という3つの軸で書かれています.

なお, この書籍は少なくとも初回は最初から最後まで読むのがすごくいいです(速読でもいいので*3).

2周目, 3周目と読むときにつまみ食いすると良さが出そうな感じがしました.

誰のための書籍か

タイトル的にも「データサイエンティスト・アナリストを目指している方」向け...に見えなくもないですが実際のところは,

何かしらのデータを使って意思決定したり分析したりする仕事・プロジェクトに携わっている人すべて

な印象を個人的には感じました.

もちろん, データサイエンティストやアナリスト, これらの職種につきたい方にもオススメでありますが,

  • プロジェクト・プロダクトのオーナーだったりリーダーな仕事をしている方
  • 上記のリーダー陣を束ねるような仕事をされている管理職な方

要約すると, 何かしらのマネジメントをされてる方はわかる範囲で良いので目を通すと幸せかもと思いました.

「この手の本って数学とか統計知らないと読めないのでは🤔」という心配もあるかもですが安心してください, Amazonの説明文によると,

本書を読むのに、データ分析の前知識は必要ありません。文系も理系も関係ありません。「データ分析はビジネスパーソンの基本スキル」となるのはもうすぐそこまで来ていると思います。「データ分析人材になる。」との決意を持って本書を読めば、ビジネスで役立つデータ分析の進め方が分かります。

実際数学もプログラミングも出てこない(ワードとしては出てくるが知識は問われない)ので割と誰でも読めるかと思います.

私の所感

最初に読んだときは「ああ, 積ん読してたの年内に読み切るか」ぐらいの軽い気持ちで読み始めたのですが,

  • 分析プロジェクト・タスクを5つの工程(Demand, Design, Data, Development, Deploy)に分ける
  • それぞれの工程での課題感や対象となる人・モノの違い
  • 成功事例・失敗事例から学べる「データ分析プロジェクトの落とし穴」

と言った所がいい感じに整理されていて, 思わず声が出るぐらい楽しくかつ深く読ませてもらいました.

この書籍に近い感じだと, 以前アクセンチュアのデータサイエンスな書籍こちらで紹介しましたが,

  • アクセンチュア本はプロフェッショナルなコンサルタント・データサイエンティストに寄せて書いてあるが, データ分析人材の方はプロフェッショナルに加えて他のビジネスマンにも伝わるように書いている.
  • アクセンチュア本は外部のお客さんから案件を受託して〜, というストーリー*4だが, データ分析人材の方は内製プロジェクトで使えるノウハウに・考え方が多い(ように見える)*5.
  • アクセンチュア本はプロジェクト推進のテクニック中心, データ分析人材はスタンス・考え方メイン.

と明確に対象読者・目的の違いがあり, それぞれ素晴らしい書籍だなと思いました.

個人的には両方読むのがベストかなと思います.

ビジネストランスレーターになろう

書籍の感想として以上なのですが,

shinyorke.hatenablog.com

以前, こちらのエントリーで,

  • 「アルゴリズム」「数学」「Python」完全に理解した!...では機械学習エンジニアになれない, 「ビジネススキル」「インフラスキル」も合わせて磨こう
  • 初心者〜中級者の方は「アルゴリズム」「数学」「Python」を磨きつつ, ビジネスの進め方も理解しよう.
  • ビジネス系はコンサルタント関係の書籍を読むとイメージが大分湧くのでかなりオススメです.

という考えの元,

f:id:shinyorke:20200929204131j:plain
【再掲】機械学習エンジニアのスキルマップ

こんなスキルマップを提唱していたのですが, これはあくまでエンジニア向けなので,

「エンジニア以外のデータ分析人材」なキャリアのヒントもあるといいかな?

と思いお絵かき・言語化しました.

自走できるデータ分析人材

完全に書籍の受け売りですが自分の理解・想いを絵図にしました.

f:id:shinyorke:20210108234139p:plain
【図】あるべきデータ分析人材

シンプルに言うとほんとこれで,

データサイエンティストやアナリストな「データ使うの強いマン」も, ビジネスの最前線にいる「現場の課題を把握マン」も「両方をつなぐマン」になるぞ!なキャリアが良さそう

だなと.

これは,

  • データサイエンティスト・アナリストはもっと現場のことを知りなさい
  • 昨今のビジネスマンたるもの, 「データで何ができるか」「ビッグデータとはなんぞや」ぐらい理解しなさい

という意味合いもある*6のですが私の見解としては,

ひとまず目の前にあるデータと向き合って見てみて考えようって所まで自分でやる習慣つけようぜ?

というシンプルなスタートでいいかなと思っています.

最終的にはデータサイエンティストもそうじゃない人も,

自分でシュッとデータ分析をやっていい感じにビジネスができる人になる

のを目指すといいかなと.

まずは手を動かそう

手を動かしてデータと向き合って見て考える...と言っても, 障壁はまあまああると思います.

自分が経験した中だと,

???「データ分析って統計とかデータサイエンスとかSQLとかPython知らないといけないんでしょう?無理無理( ´ー`)y-~~」

だいたいこういう感じが多い(このどれかに当てはまることが多い)のですが,

シュッとデータを取ってきて見る程度ならツールも難しい知識もいらなかったりします.

ツールは何でもいい

ここでいうツールは,

  • Excelやスプレッドシート等おなじみなモノ
  • Python, R, SQLといった何かしらをプログラミングしたり操作するための言語(スプレッドシートの関数とかも含むでしょう)
  • Tableau, Data Portal, Locker, Redashなどのデータ可視化・ビジュアライゼーションツール(有料・無料問わず)

という感じなのですが, ご自身の手に馴染むモノであれば何でもよくてプログラミングそのものは必須じゃないです.

プログラミングを(Hello world*7じゃなくて仕事で使うレベルで)覚えるのはまあまあ学習コストがかかる話ですが,

  • スプレッドシートやExcelは割とビジネスマン当たり前に使う
  • SQLは代表的なデータ操作言語でスタートまでのコストが低い
  • Tableauなどのツールはそもそもの操作をいい感じに楽にしてくれる

などあったりするので, 自分自身やチームに合わせたツール・手段を使うと割と誰でもイケると思います.

個人的には,

  • スプレッドシート・Excelの関数ぐらいは自前で理解して使う
  • 組織にDWH(データウェアハウス)的なDBがある場合は簡単なSQLを覚える. where句を使うselect文, 集計関数, group by, withを使えるだけでもだいぶ違う

これぐらいを最低限抑えるだけでも良い感じになると思っていますし*8, 実際の分析では,

数学や数式がたくさん出てくる統計学の教科書は、文系にとってみると目まいがしそうな感じがしますが、プログラミングという選択肢を捨て、市販の分析ツールを使ってみると実は四則演算以外はそんなに使う機会はありません。

※「データ分析人材になる。目指すはビジネストランスレーター」3-2-1より引用

だいたいこんなもん(全部ではないにしても)なので気軽にやるといいんじゃないかなと思います.*9

データを読んで考える習慣

まずは毎日データを眺める, 考える.

これを習慣化するだけでもだいぶデータ分析人材になれると思います.

分析の要望は曖昧なことが多いです。「○○が悪いから、売上が落ちているのではないか?」「こんなデータがあるから、こんなことができるのではないか?」という要望で、「分析してくれないか?」と頼まれることもあります。

※「データ分析人材になる。目指すはビジネストランスレーター」2-1-2より引用

データサイエンスにせよ, アナリスト的な仕事にせよしくじるときは「どんなデータがあるかわかっていない」「データの中身を把握していない」的な解像度不足からのミスコミュニケーションはまあまああるよねと思っていて, これを当事者である自分が(専門的なことを理解してるかは別として)日々見ている・変化がある事に気がつくだけでもこの不幸から抜けられる可能性があります.

少なくとも, 自分自身がデータへの解像度が高くなると人と一緒にやる・お願いする(外注する)ときにやりやすくて有利ですし, アプリやWebサービスなど日々変わるモノだと「何かの変化で健康状態*10の良し悪し」もわかったりして良い判断につながるので有効だったりします.

役職者もがんばりましょう

ここまでは実務する方に向けてのオススメだったりしますが昨今の風潮では,

マネジメント・組織運営を生業とする方も「データ分析で何ができるか?」ぐらいは把握するのはマスト

かなと思っています.

「仕事としての経験が少ないから自信ない」「社内のデータサイエンティストに任せているのでへーきへーき」という考え方もあるとは思いますが,

  • データサイエンス・アナリティクスな業務を外注したり人材採用したりする時の感覚がつかめない
  • データサイエンティストや外注したコンサルタントが提案してきた内容の理解・判断
  • AI, 機械学習云々という話の意思決定🤔

これらは流石に自身で判断・決定を下すシチュエーションだったりすると思いますし, ちょっとでもデータ分析の心得があれば心配はなくなります.

なお私の場合(今はマネジメントな業務をしていませんが)シニアとしての意思決定ルールをこんな感じでやっています&参考になれば幸いです.

note.com

結び - 少しだけ自分のはなし

というわけで「データ分析人材になる。目指すはビジネストランスレーター」の紹介と, データ分析人材 #とは というテーマで好き勝手話をさせてもらいました.

このエントリーで気になった方はぜひ読んでもらえると嬉しいです.

私がこの本でビビッと来たのはこの一文でした.

大事なことは、理論を理解するのと同時に、PCを操作するなどして、手を動かすことです。そうした方が効率的に学べ、挫折しにくくなります。

  • 自分でシュッとデータ分析をやる, 手を動かす.
  • 目の前のデータと向き合って理解する.
  • これらを繰り返し, 良いビジネスを創っていく.

この流れだよな〜, と改めて思いました.

「データ分析人材」に必要なのはデータサイエンティストや数学・統計・情報工学...だけではないですし, 別に文系の方だろうが社会人になってから初めてExcel触る人だろうが誰でも「データ分析人材」になれます(やることやったら).

ちなみに私は学生時代(専門学校時代)にプログラミングと簿記をやった以外専門的な教育は受けていません*11が, 今思えば仕事や個人的なプロジェクト(例えば野球データサイエンス)の積み重ねで結果的に必要な経験が積めて今があるような気がします.

幸いにも2021年はじまったばかり, 「データサイエンスで仕事をしたい」「AIでいい感じに稼ぐぞ!」という方の参考になると幸いです.

最後になりましたが, 今年もよろしくお願いいたします🪁

*1:色々とやってました, 表に出るものもあればしばらくしてからいい感じに出るものもあると思います.

*2:Demand -> Design -> Data -> Develop -> Deployの5ステップで分析プロジェクト・タスクをすすめるフレームワーク. なおこのエントリーでは紹介は最小限のみです&気になる方はぜひ書籍の方へ.

*3:流れがしっかりしてるのでとても読みやすいですし, 元々の事例から5Dフレームワーク->育成と語ってるので最初のウチは全部読んだほうが良さそうです.

*4:本の中で特段明記はしていないですが雰囲気的にはそんなノリです(個人の感想です)

*5:といいつつ, 外部のツールを使ったり外注したり的な時の勘所もちゃんと書かれているので網羅性はかなり高いです.

*6:双方の想い・意見もそうなるでしょうしそこは否定はしない...ですが, この考えでミスコミュニケーションが生じると鶏卵論な話になったり最悪こじれたりするのでおすすめはしません.

*7:初心者向けプログラミングの教科書やプログラミング言語の解説ページでほぼ必ずある例題のこと.

*8:ツワモノじゃなくても, プロダクトオーナーやプロダクトマネージャーの人は最近自分でやる方多いのでこれらの職種の必須スキルと言ってもいいかもです.

*9:もちろん, 四則演算じゃ済まないケースもありそこは本職のデータサイエンティストにまかせるべきところなのですが, 「どのラインからデータサイエンティストやエンジニアに任せるか」の意思決定を自身でできるかできないか, がビジネスマンとしての素養を試されるなあと私は思っています.

*10:売上とかもそうですが, 純粋にUUやPVなどの変化のパターンを掴むだけでも違うかなと

*11:余談ですが私の最終学歴は専門学校卒で大学には行っていません.