見出し画像

メルカリのデータアナリスト体験記

これはなにか

メルカリのデータアナリストとして仕事をした体験記です。本記事は@maosakanaさんが書かれた記事を大いに参考にしています。メルカリに興味がある方に参考になる記事を書きます。
インターンが新卒選考のフローにあり、2019年度のアナリストインターン枠の入社人数は2人しかいないはずなのでレアかと。。。


なぜ書いたか/誰向けか

・就活でメルカリを志望してる学生に有益な情報を提示したい。
・そもそもメルカリのインターンに関する記事がレア!
・分析むずい泣
・メルカリが今までのインターンの中でトップクラスでよかった!

簡単な自己紹介

2019年現在, 都内工業大学のB4のユウキと申します。専門は機械学習です。2年までは遊びまくってましたが、大学3年から目覚めてエンジニアを目指して勉強しました。現在はエンジニアでは無くビジネスサイドを視野に入れています。今までのインターン歴を大雑把に書くと...

・Webアプリ開発ベンチャー(フロントエンド開発)
・富士通クラウドテクノロジーズ株式会社(機械学習モデル開発)
・株式会社DeNA(機械学習モデル開発)
・株式会社ファーストリテイリング ユニクロUS(ニューヨーク新規事業提案/一応, 最優秀賞もらった)
・株式会社サイバーエージェント(データアナリスト的なの)
・株式会社メルカリ(データアナリスト)
(ところどころ端折ってます)

ほとんどアナリストを意識して仕事した経験がなかったので、入社前はかなり不安で入社前日は眠れなかったです。

メルカリに興味が沸いた理由

アリババのビジネスモデルにかなり関心がありました。メルペイあるから今から積極的にプロダクト開発しだすフェーズに行くんじゃね?(ワクワク)的な理由です。
詳しくはこちらの本から(どれも良書です)


労働環境

・コアタイム 12:00~16:00。時間に融通がきく。
・服装自由(ベンチャーだと当たり前かも)
・社内で使ってるサービスがGoogleでほぼ統一。Windowsなどでありがちなややこしい設定をする必要がないので不自由なく働ける。
・インターン学生でも給与がかなり高い。職によると思うが新卒外コン水準
・ジュース飲み放題
・かなり多様性のある組織。外国人の方が異様に多い。かなり刺激になる。
・ドキュメント見放題。百戦錬磨のアナリストの記事が読めてかなり幸せ。
・手取り足取り教えてくれる環境ではない。欲しい情報は自分で取りに行く姿勢が重要。

組織の中でデータアナリストとは

データ(ファクト)を元にプロダクトの改善をする仕事です。施策がいいのか悪いのかを評価するのとは当たり前。そこから何を提案するかを考えることが重要です。経営にかなり影響する仕事だからものすごく責任重大な役割。それゆえにデータアナリストに対する期待はかなり大きく痺れるものです。そしてファクトを元に語るからこそ、もし若手でも力があれば上の人と話ができる機会が他の職に比べて多いと思います。働いている社員さんはかなりロジカルでキレる方々。

仕事内容

1. On Boarding(OJT的なやつ)
・SQLたたいてKPIを出力
・出力したデータをLookerで可視化
 (先日Googleが買収したのでBigQueryを利用している企業で今後ますます利用数が増加するかもしれない)

2. 分析
とある施策を打つ前の、現状分析を行なっていました。
特に何をして欲しいと言うものはなく、自分で考えて論点を見つけて分析していました。
具体的には「Like機能」の分析と「カテゴリ機能」の分析、というより研究。
絶対Valueだして見せる!と思っていたが実際はかなり苦戦を強いられました。詳細は省きますが、苦戦したことは後に記述します。

分析で楽だったこと

そもそも求める技術水準はエンジニアに比べてそこまで高くない説。個人的にはSQLやLookerでのコーディングに関してもなんら苦労することはありませんでした。前職でデータの前処理して機械学習モデル作ってた経験が役立っていたのだと思います。pandasがいじれる人はSQLの勉強に時間は取られないと思います。

分析で苦労したこと

 とはいえ、会社に入ってすぐSQLは書けなかったです。理由は大きく2つ。
 一つ目が、メルカリ独自のログがよくわかっていないから。当たり前ですが、ログは会社ごとに設計が異なります。例えば海外に事業を展開している場合、時差を考慮したコーディングが必要です。また、そもそもどのように値が定義されているのかわからないので、欲しいデータがどれなのか把握する必要がありました。ここはとても厄介。。。死ぬほどストレスでした。
 二つ目が、BigQuery専用のコードがわかってなかった。これまでSQL書いたことがなかったので、BigQuery自体何者かわかっていませんでした。BigQuery専用のコードがあるとは知らなかったので、先人のクエリを眺めても?(๑╹ω╹๑ )??の状態でした。まあググったらわかるんですけど。

 そして個人的に分析者としてもっとも致命的だと感じたのが、論点を探す「思考力」。つまり、分析するにあたって何がわかる必要があるのか考察する能力。ここがかなり自分にかけていた。まあ簡単そうに感じるんですけど、僕にはきつかったです。
 今まで分析系の仕事はとりあえずやってもてからPDCAを繰り返して完成度をあげるスタイルだったんですが、それでやってみると、出した結果が本当にこれっているんだっけ??とか、本当に言いたいことが言えるデータなの?と言う風に結果は出てるが、で??という状態に陥った。とりあえずやってみるは悪手。コーディングする前に考える必要性があります。

悪手分析ストーリー

1. 仮説を元になんとなくこの数値出したらいいんじゃね?で分析開始
2. SQL書いてみる(だいたい3時間ほどかかる)
3. クエリを実行( ✌︎'ω')✌︎(長いと30分ほどかかる)
3. 結果をダッシュボードにまとめる
4. 可視化する
5. あれ?これが欲しいデータだっけ?_:(´ཀ`」 ∠):
6. メンターに詰められる

僕が分析し始めたときにハマった分析ストーリーです。初心者の失敗あるあるなのではないかと思います。

失敗パターン

わりと当たり前の事かもしれませんが、、、

1. 結局何がしたかったんだっけ?病
 分析前に仮説を明確にしていないと、結果が出てから仮説が不明確すぎたために可視化してからどんな数値が必要だったかわからなくなる。しかし、これができてもダメ。本当にいま知るべき数値なのか考えていない為に、知りたい結果がどうでもいいファクトになる可能性がある。これができてないと分析にかかる数時間が一気に無駄になる。

2. SQLをゼロから書こうとする
 ゼロから書くと、考慮してないロジックが出てきて正しい結果がでない場合がある。結果がでたタイミングで考慮してないロジックがあると時間が無駄になるので過去のクエリを参考にして書いた方が圧倒的に楽で間違えにくい。

3. 結果を疑わない
 でた結果が本当に欲しい情報だけのデータかを疑う必要があった。なにが言いたいかと言うと、見かけの相関関係になっていないかという問題。これを交絡因子と呼ぶ。これに悩まされた。交絡因子が存在するかどうかを判断するにはプロダクトに対する十分な理解がないといけないのだろうと思う。

画像1

4. 分析したいパラメータを増やしすぎる
 
検証したいものに関わるパラメータが多いと、それをとりあえず全部出力して何も考えずに可視化してしまう。そうすると可視化した結果がかなり見にくくなるとともに、他者に説明することが難しくなる。分析するときはパラメータを固定して可視化した方が分析しやすいし、何が言いたいかを説明しやすい。これは機械学習のモデルを作ってた時にはなかった発想。


分析に困った時の処方箋

感想

 優秀な人が集うと有名なメルカリでの仕事はかなり難しかった。今までのインターンはWhatを考えるのではなく、Howを考える方が多かった。現状どんな課題があってどうやって解決するかといった内容だ。今まで割と技術的なことそしてビジネス的な側面から自分をアップデートしてきたが、Whatを考える思考方法を知らなかったため、かなり分析に苦戦した。そしてそこから多くの自分に足りない思考法を学ぶことができた。
 分析自体はかなり楽しいものだった。ダウンロード数が1億を超え、DAUが〇〇万人を超えるサービス売上は驚嘆するものだった。初めてLookerで可視化されたKPIを見て圧倒的に高い数値が正直本当かいな?とよく疑問に思った。月になんども利用してはいないユーザである僕にとって、自分以外の購買行動をとるユーザは想像できなかった。だからこそ、立てた仮説があってたことなんてほとんどない。個人の想像してることなんて誤ったことばかりなんだとその時痛感した。そういった想像と実際のギャップとをファクトを元にわかるところが分析で面白かったことだ。(割とガチ)




インプットのための書籍購入に使わせていただきたいです