結構冷える今日このごろですが、何故か七分丈パンツで外に出てる私ですこんにちは。
それはさておき、先日初めておじゃました勉強会があったので簡単にレポート(と少しだけ宣伝)を書きますねー
PyData Tokyo Meetup #3
URL
日時&場所
- 2015/1/16(金) 19:30~23:00 ※懇親会(22:00~23:00)含む
- Denso IT Laboratoryさんのオフィス(渋谷クロスタワー 28F)
個人的には久し振りにデンソーITラボさんのオフィスに来れて嬉しかったです。*1
どんな勉強会?(目標・理念)
公式サイトより抜粋
PyCon JP 2014ではデータ分析関連・機械学習関連の発表に非常に大きな関心が寄せられました。一方で、もっと「機械学習」「ディープラーニング」「自然言語処理」「画像処理」などのトピックについて深く議論できるコミュニティー・カンファレンスがあればいいのに、という声も聞かれました。折しもビッグデータが大きな話題を呼んでいる昨今、海外のPyDataコミュニティーはかなり盛り上がっている様子。日本だって負けてられません! パイソンという言語の特徴とデータという流行りのトピック活かして、大企業・ベンチャー・学会で活躍してるPythonistaの皆さんがバランスよく交流することのできるコミュニティーづくりを目指しています。
要約すると、
- PyCon JP 2014ではデータ分析・機械学習の発表があった&興味関心も高かった。
- 一方、Pythonistaが「機械学習」「Deep Learning」「自然言語処理」などのトピックを深く議論するコミュニティー・カンファレンスが日本には無い。海外ではそんなコミュニティーが存在し、かなり盛り上がっている。
- 日本でもPythonistaが集まってこれらのトピックをネタに交流できるコミュニティーがあればいいじゃん!!!
という空気ができ、PyData Tokyoというコミュニティーが誕生しました。
今回が3回目でしたが早くも満員御礼、約30人の応募枠に90人近くが応募と凄いことになっていました。*2
当日のプログラム
これも公式サイトより。
今回のテーマはApache Sparkでした
19:30 - 19:45 「PyData Tokyoについて」 PyData Tokyo 池内 孝啓
19:45 - 20:00 自己紹介(全員)
20:00 - 20:50 「Sparkによる分散処理入門」 株式会社グノシー マネージャー 粟飯原 俊介さん
20:50 - 21:00 休憩
21:00 - 21:50 「Apache Spark / MLlib で始める分散型機械学習」 株式会社ALBERT @soonraah さん
21:50 - 22:00 次回勉強会について
22:00 - 23:00 懇親会 & ライトニングトーク
当日の様子
PyData Tokyo Meetup #3 - Togetterまとめ
発表資料
グノシー粟飯原さん
Sparkによる分散処理 / 2015-01-16 PyData.Tokyo#3 // Speaker Deck
Hadoop以前、Hadoop、そしてSparkと歴史をたどる感じで解説しつつ、グノシーさんでやってることをわかりやすく解説という流れが凄くわかりやすく解説されたいいスライド&発表でした!
@soonraah さんの発表は、、、あれ、スライドが無いのか...
後の感想で書きますが、名言が出てきて結構良い発表でした!!!
感想
自分の呟きより引用&コメント
顔が見えるサイズ = 30人くらいで集めている、ディスカッション重視、懇親会もやる #PyDataTokyo
— Shinichi Nakagawa (@shinyorke) 2015, 1月 16
このコミュニティーが拘っているポイントだなと思いました。
これは私の推測ですが、PythonのコミュニティーってPython mini Hack-a-thonをはじめ、「初心者も上級者も、エンジニアも非エンジニアも、老若男女関係なくお互いコミュニケーションとりながら交流しましょう!」というシンプルだけど難しい、でも凄く大切なテーマを元に運営しているところが多い気がします。
主催者も #pyconjp や #pyhack でつながっているメンバーですので、この辺の継承はしっかりしてるし、事実すごく居心地がいいコミュニティーでした。*3
ほとんどの人がLTの準備してる(意識高い) #PyDataTokyo
— Shinichi Nakagawa (@shinyorke) 2015, 1月 16
最後のLTは希望者が多すぎて一人3分でした。
AWSの使い方議論
— Shinichi Nakagawa (@shinyorke) 2015, 1月 16
粟飯原さん発表のクライマックスはAWSの使い方に関する議論でした。
速度、コスト、汎用性といったあたりの要素をパズルのように組み合わせてソリューションを築く。
このへんはやっぱりみんな頭を悩ませている所で、ここの議論が一番熱かった気がします。
このブログ記事のタイトルとおり、
熱く、アカデミック
でした!
コーディングが超楽しい
早いと楽しい
MLlibの進化が楽しみ
名言
#PyDataTokyo
— Shinichi Nakagawa (@shinyorke) 2015, 1月 16
コーディングが楽しい上、(速度が)速いっていう幸せの二乗 #PyDataTokyo
— Shinichi Nakagawa (@shinyorke) 2015, 1月 16
@soonraah さんの発表のクライマックス。
発表の最後にこのような名言が出てきました。
この言葉はホント心に来たなあ。
ソリューション立ちあげ&発表の準備で大変な苦労をされていたとのことですが、苦労の末得た学びの言葉としてこれ以上にない名言だと思います。
Pythonで出来たラッパー実装にありがちなこと←Pysparkで用意してない奴はpy4jラッパー #PyDataTokyo
— Shinichi Nakagawa (@shinyorke) 2015, 1月 16
まあPythonはグルー言語だからね #PyDataTokyo
— Shinichi Nakagawa (@shinyorke) 2015, 1月 16
全体を通しての私の感想その1.
これはデータサイエンスにかぎらず、アプリの世界でもそうだと思うのですが、Pythonはグルー言語として本当に最強な言語だと思います!
一方、パフォーマンスにこだわる、とにかく(工数的な意味での)軽さにこだわる、という場合は他の選択肢もあっていいし、それらをPythonで緩く疎結合に繋ぐ、というスタンスが正解なのかなと改めて思いました。
アーキテクト、技術的なアプローチの選択ってビジネスやプロダクトの性質を基準に決めると思うけど、「使いたいからやってみた」というアプローチも十分アリだと思う。
ミニR&Dだと思えば知見もたまるし、失敗しても「学び」は残るからね。(Leanな意見) #PyDataTokyo
— Shinichi Nakagawa (@shinyorke) 2015, 1月 16
全体を通しての感想その2.
「何故このアーキテクトにしたのか?」という議論で、「使いたいからやってみた」というキーワードが出てきた事に関して。
プロジェクト、ビジネスの状況や目的、そしてコストに合わせてアーキテクトを決めるのが模範解答だと思いますが、選択肢が複数あるときはチャレンジすべきなんですよね。チャレンジの理由だって「使いたいからやった」でいいと思うんです。
これはどちらかといえばLeanの思想ですが、小さく使って学び(失敗ともいう)を重ねて成長するのは悪いことじゃない、むしろR&D的にはいいことですよね。
かなり熱量あるmeetupで楽しかった!飛び入りでLTもできて良かった!ありがとうございました!!
今度はウチの若手を巻き込もう #PyDataTokyo
— Shinichi Nakagawa (@shinyorke) 2015, 1月 16
今度は仲間を連れて参加します!!!
宣伝
CROSS 2015 | エンジニアサポート CROSS 2015
主催の@iktakahiroさんも宣伝されていましたが、1/29(木)に開催されるエンジニアサポート CROSS 2015というイベントでPythonコミュニティーのパネルディスカッションを行います。
私は野球クラスタ代表として参加することになりました!
Webアプリケーションから機械学習まで ~ PythonとPythonコミュニティの2015年大展望
PyCon JPの寺田さん、python jpの石本さん、そしてPyData Tokyoのシバタさん、池内さん他豪華メンバーの中一人だけ野球で突撃する感じですが笑、面白くかつためになるトークが出来るよう頑張ります!
お時間ある方は是非ともお越しいただければと思います!
PyData Tokyo楽しかった!次回のハッカソンはちょっと考えますが(汗)、また是非ともお邪魔したいと思います!!!