見出し画像

BIチームが語るUbieのデータ利活用最前線(前編)

UbieのBIチームについて

事業が急速にスケールし、必要なレポーティングやデータ分析の量や質が増大しているUbie。そんな状況に対応しているのがアナリティクスエンジニアとデータアナリスト、通称BIチーム。BIチームは事業のスケールに対応できるよう、「だれでも滑らかにデータ利活用できるようにする」を最重要課題として日々奮闘しています。
今日はそんなBIチームの中でも、最近入社した戸川和樹と松島龍司、河合康平の3人による座談会の様子をお伝えします。Ubieや日々の業務についてざっくばらんに語ってもらいました


自己紹介

奥田(モデレーター)
それでは簡単に自己紹介をお願いします

戸川
データアナリストの戸川と言います。自分は2022年の11月にデータアナリストとして入社しました。これまで何社か経験していて、どの会社でもだいたい数値をいじるとかデータをいじるデータサイエンティストとして働いていました。Ubieに入社してからは、製薬企業向けのデータ分析レポーティングなどを担当しています

松島
アナリティクスエンジニアの松島です。自分も2022年11月に入社し、戸川とは同期です。以前はDeNAでバックエンドのソフトウェアエンジニアとして働き、エンジニアマネージャーなども経験しました。その後、個人の好奇心でデータサイエンスを学び、ヘルスケア事業部に異動しました。ヘルスケアアプリの健診・レセプトデータを分析して、アプリの効果を評価する業務を中心に担当していました。Ubieにはプロダクトの強さと魅力を感じ、実際に使ってみて便利さを実感し、色々な可能性を感じて入社しました。入社後は主にエンジニアリング寄りの業務が多いです。さまざまなプロダクトのログの整備や、データパイプラインの整備など、データ分析が可能な状態にするための作業務に取り組んでいます

河合
河合と言います。入社時期は2023年の9月でまだ半年も経っていないんですが、アナリティクスエンジニアとしてUbieに入社しました。前職はNTTコミュニケーションズという会社で9年ほど働いていたんですけど、主にデータ系の仕事をずっとしてきました。直近だと社内向けのデータ分析コンサルティングとして、サービス開発とかセールス組織と一緒にデータ分析プロジェクトを回したり、社内のデータ活用推進のためのデータ整備をやっていました。Ubieに入社してからは、主に製薬事業向けのデータマートやデータパイプラインの整備を中心に取り組んでいます

座談会の様子(オンライン)

Ubieの第一印象

奥田
Ubieの第一印象ということで、入社した時のギャップや新しい発見などあればぜひ教えてください

戸川
Ubieに入ってみての一番ギャップだと、すごく熱い会社だなというのがありました。入社前にUbie社員のnoteの記事をたくさん読んで入ったんですけど、noteからだとやっぱり熱みたいなものはそこまで感じられず、ともすればドライなのかなくらいの感じで入社しました。入社後はもう社員の熱量がめちゃくちゃすごいなと感じています。例えば月次で行っている懇親会だと、夜中の2時とか3時くらいまでみんな飲みながらずっと仕事の話、未来の医療の話、ヘルスケアの話をしていて、この人たちがこうやって未来を変えていくんだなと思いました。あと優秀な方がすごく多くて、本当にいろんな会社のエースプレイヤーが揃ってひとつのプロダクトを作り上げてるんだと感じます

松島
そうですね、アナリティクスエンジニアやデータエンジニアの定義が会社によって違うのかなと思っていて、前職だと結構エンジニアリングの部分をデータエンジニアに丸投げしてた部分があったんですけど、Ubieは両者がオーバーラップする部分が結構多いなと感じました。あらゆるインフラ構築がすべてコードベースで管理されています。いわゆるインフラをコードで管理するInfrastructure as Codeの部分は、データエンジニアにお願いしてたところなので、その部分の知識がキャッチアップできて、よかったなと思ってます。
あとその他のところで言うと、とにかくドキュメントがたくさん書かれていて履歴が追えるのでキャッチアップはやりやすいかったです。一方で事業の速度も速くてどんどん流れていくので、最新がどれか?を追うのが大変で、課題だと感じました。また事業に合わせて組織のアップデートも早いという印象を持っていて、普通の会社だと1年くらいの組織更新が、Ubieの場合だとクオーター(3ヶ月)単位ぐらいで起きてるみたいな、そういったスピード感を感じています

戸川
確かに。自分も組織が変わる速度ってのが尋常じゃないなと感じます

松島
そういえば育休とって復帰した時とかってどうなってました?浦島太郎みたいな感じ?

戸川
自分は2023年の6〜8月に育休取ってたのですが、直前の5月末に組織名称が変わって、9月に復帰したあと11月くらいでまた変わりますよとなり、半年で2回くらい変わって。変化のスピードすごいなと

松島
そうだよね、資料なんかは全部残ってるからそれを読み込んでキャッチアップしてたような感覚はあるんだけど、どうだった?

戸川
確かに、自分はどこに何かあるかとかの勘所も一定分かってたんでキャッチアップしやすかったかなと思うな

河合
自分の場合、2023年9月に入社してからも組織がどんどん変わっていって、いまだに混乱してるところもあるかな。ただドキュメントはちゃんとフェーズごとにきちんとあったので、それを辿っていくことでキャッチアップはしやすかったなと。ただスピードがとんでもなくて、ドキュメント量が爆発してるので、いまだに全容がわかってるのか…?みたいな、探り探りやってる感じはあるかなあ

データガバナンス

河合
アナリティクスエンジニアとして僕が入った観点で言うと、データ基盤のガバナンスとか設計はもう本当にめちゃめちゃ高度に作られているなっていうのを感じています。コードベースで全部自動化できるところはきれいに作られていて、データを触っていくっていうところに想像以上にフォーカスできる状況になってました。あとは各ステークホルダー、プロダクト側とかBiz側も含めてみんなデータの感度とか解像度がめちゃくちゃ高いなと思っていて、プロダクトでログ変更あるけど大丈夫そうかな、みたいなことをプロダクト視点で持っていたりとか、Biz側もこういう指標見てるけど大丈夫かな、といった会話がすごいスピーディーに行われて、データが一番大事だという意識がみんな高いなというのを改めて感じました

戸川
確かに確かに。データガバナンスって自分はそこまで詳しいわけじゃないんだけど、すごく高度なことをやってるんだろうなってのはひしひしと感じていて

松島
最初にデータ基盤の基礎部分にインベストするんだなっていうのは感じていて、普通は最初に安く始めちゃって、「後でなんとかしよう」みたいな考えでやって、でも結局何ともできなくなって、みたいなことが多いんだけど、その基礎部分にすごく力をいれて作ってるなっていう感覚はあったかな。
セキュリティ観点で、絶対に見えちゃいけないものが見えないような仕組みを初期段階から仕組み化していて、普通だと手動運用でやってミスって事故って、その後「どうしよう?」かという話になりがちなんだけど、そもそも仕組みとして物理的に出来ないようにするっていうところが徹底されてると感じたな

河合
スタートアップということでスピード重視で負債を積みながらガンガン進めていかなきゃいけないことと、長期的に絶対に必要なところは先行投資でガッと進めてたりとか、そのあたりの濃淡が綺麗に取れていると思う。データ観点だと先にガバナンスへしっかりインベストかけてやってるっていうのは、最初からよくできるな〜と本当に思ったね

戸川
確かに事業とかプロダクトは結構小回りというか小さく試すのをたくさんやってるイメージだけど、データはかなり先のスケールした未来を見据えて綺麗に整えていってるんだなと感じます

松島
そうだね、負債になってもいいところと、絶対間違えちゃいけないところがちゃんと綺麗に仕切られてますね

レポーティングの難しさ

奥田
今皆さんはどういった業務をされていますか?

戸川
いま自分は製薬サクセスサークル(Ubieではチームのことをサークルと呼ぶ) のBIエンジニアとして働いています。製薬企業さまごとにこの疾患の患者さんを見つけたいです、Ubieさんで見つけられませんか、というようなプロジェクトをやっていて、関連しそうな患者さんを見つけたりとかその疾患の確定診断がついた患者さんを見つけたりということをやっています。その取り組みが短いと3ヶ月、長いと1年2年となるんですけど、そこで毎月レポーティングをしていく中で、意図しない数値の変化などが起きたりするので、そこをなるべく早く検知するような仕組みづくりをしています。いまは多くのプロジェクトが走っているので、プロジェクト横断で眺められるダッシュボードを作って、このプロジェクトだと今は順調とか、このプロジェクトはちょっと今月数値下がってるから原因を解明したり追加の施策を打つ必要がありそうとか、そういった意思決定を促すようなダッシュボード作成が今の業務ですね

奥田
なるほど。難しさはどの辺りにあるでしょうか?

戸川
難しさでいうと、プロジェクトごとの個別対応をどこまでするかというのがあります。各プロジェクトで見たい数値が微妙に異なっていたりして、この疾患の患者さんを見つけたいとか、その前駆指標である検査してる人数を把握したいとか、より確度が高い患者さんだけに絞って報告したいとか、個別に要望がいろいろあります。それを横断的にモニタリングするときに、そのひとつひとつのリクエストに応えていくと工数もかかるし、モニタリングした時にプロジェクト間の比較がしづらくなるので、そのバランスをとるのが難しいです。汎用的にしすぎるとプロジェクトによっては役に立たない指標になってしまいますし

松島
レポーティングはデータマートを作るっていうところに依存してるんだなと感じていて、Ubieの製薬企業向けのプロダクトっていうのはいくつかのVP (Value Proposition:プロダクトの各機能のこと)があって、あるVPだとわりとレポーティングが型化されていてほとんど標準化できていて、かつ顧客の個別要望も組み込みやすいみたいなデータマートの仕組みが組み上がっていて、モニタリングは結構しやすいはずなんですよね。一方で、別のVPは割とプロジェクト個別にコピペで拡大させたみたいなレポートがあるんですけど、そこについて、型化できる部分とそうでない部分を分けるマチュアなデータパイプラインを構築しようとしているところですね。
僕もエンジニア出身なんで、やってることはエンジニアリングの差分プログラミングみたいなところに等しいのかなという風に思っていて、共通のフレームワーク的に作っておいて後から違いを注入できるみたいなことができると、プロジェクトごとの違いをを組み込みやすくなると思っています。そこが丁寧に分かれていると、共通の集計も案件ごとの集計もモニタリングとしてはしやすくなるので、そういったパイプラインを整備するところがすごくキーポイントになっていく感じですね

分析のやりやすさ

松島
自分は、データパイプラインの整備がメインです。営業部門からは個別の集計依頼が頻繁にあり、BIチームではそれに対応することが求められいるのですが、現在の仕組みでは要件に完全に対応できず、「SQLを書いてください」と伝えるしかなくて。今後、データパイプラインが整備されてきたら、営業部門にも一部の集計機能を開放していきたいなと思っています。具体的には、営業部門からの要望に応じて、異なる軸でメトリクスを集計できるBIツールの開放をしたいと思っています。これがあれば、自分の工数を削減できるし、営業部門も自分たちが見たい軸でメトリクスを集計できるようになります。安全な集計済みのデータマートを営業部門に提供することで、双方にとってメリットのある関係を築けるのではないかと考えています。そういったBIの民主化を今後進めていきたいなというところですね

奥田
非エンジニアもSQLを書いて分析集計できるようになるべきみたいな話はありますけど、Ubieとしては、最終的にBIツールをみんなが使えるようになっていくというところが民主化のゴールなんでしょうか?

松島
集計したい人が集計できたほうがいいかなと思っていて、そのためには安全にできる仕組みが必要だと思うんですね。例えば営業サイドにSQLを覚えてもらって個別に集計してもらう話って聞きますけど、もしそれをやってしまうとある人の集計と別の人の集計が全然違って、報告している数値に差分が出てしまうのはあるあるだと思います。BIツールの中でそういった指標を違う軸で組み合わせるだけで集計できるよ、みたいなこと対応できると、自信を持って非エンジニアや分析者に使ってもらえるので、そういう状態になればどんどん使ってもらのは良いことだなと思ってます

戸川
自分も同じような感じで、Ubieの場合の難しさはN=1の持つ価値ってのがすごく大きいってところがあるかなと思ってて、希少疾患とかだと1人の患者さんに対して使われる医薬品の金額が数百万円とか数千万円みたいな規模になってくるので、その1の違いが非常に大きいわけです。そういった時に、集計の仕方によってNが1とか2とかずれると、そのズレって数値上だとわずかだけど、その裏にある金額とかに換算すると実はものすごい大きなズレが発生してしまうので、そこはなるべく許容できないようにしていく必要があるのかなと思ってます。一方で数字を見たい人が集計できるっていうのがやっぱり一番いいと思うので、その数値ズレが起きないような仕組みづくりを支援していけるといいのかなと思ってます

河合
自分も同じような意見で、UbieにはSQLが書ける人は非常に多いと思っていて、それゆえに数値がずれちゃうとかここの集計方法は結構ドメインが必要でこういう条件入れないとうまく数値合わないとか、結構複雑になってしまっている印象。まずは共通的に見るべき指標はBI側でちゃんとメトリクスを定義してやった方が、もっと安心してスケールして分析ができるということにつながるのかなと思う。SQLで探索的に探るところと広くデータを見るところでうまく両輪で分けて進めていけるといいんじゃないかなと思ってますね

(後編へ続く)

We are hiring!!

座談会はいかがだったでしょうか?少しでもBIチームのことが伝われば幸いです。
BIチームは仲間を募集しています。少しでも気になった方がいましたら、ぜひお話しさせてもらえたらと思います!

◯カジュアル面談
https://pitta.me/matches?p=15&q=Ubie

◯アナリティクスエンジニア募集要項 https://herp.careers/v1/ubiehr/Bilnrfg8U7vj

◯Ubieデータ関連職種の紹介
https://recruit-data.ubie.life/

この記事が参加している募集

仕事について話そう

この記事が気に入ったらサポートをしてみませんか?