見出し画像

レコメンドシステムの活用を考える①(導入編)

はじめまして、三菱UFJフィナンシャル・グループ(以下MUFG)の戦略子会社であるJapan Digital Design(以下JDD)でMUFG AI Studio(以下M-AIS)に所属する、田邊・石井です。普段はMUFGに向けたAI施策のPoCやR&Dに従事しています。

M-AISでは、定期的に新しい技術の調査・検証を行い、成果を発表しております。今回は、そんな技術調査・検証の結果を記事として皆さまにご紹介したいと思います✨

今回取り上げるのは“レコメンドシステム”についてです。身近な例とともにご紹介しますので是非お楽しみ下さい🎶


1.レコメンドシステムとは?

近年、Webサイトでは「知り合いかも」「この商品を買った人はこんな商品を買っています」「おすすめの商品」などを頻繁に目にするようになったのではないでしょうか。

機械学習には、クラス分類や回帰(教師あり学習)、クラスタリングや主成分分析(教師なし学習)などさまざまなタスクがありますが、上述のwebサイト上でよく目にする仕組みもまた、「レコメンドシステム」という機械学習の一つのトピックに分類されるものとなっています。

レコメンドシステムは、各々の興味が高いものを現実的な件数でレコメンドしてくれる、言い換えれば、「人の選択(意思決定)を手助けする役割」を担っており、これにより、私たちは膨大なデータに対してゼロから興味のあるものを探す必要がなくなっています。

身近な場所でのレコメンド利用例としては以下の通りです。

  • Netflix:視聴の75%がレコメンド起因の視聴(2012年4月6日時点[1]

  • YouTube:総再生時間の60%がレコメンド起因の再生(2022年9月27日時点[2]

  • Amazon、Google Play:アプリのインストール数の40%がレコメンド起因のインストール(2022年9月27日時点[3]

実際の割合からも、レコメンドの効果が絶大なことが分かりますね。

2.レコメンドシステムの例

各社独自のレコメンドシステムを構築

レコメンドシステムと一言で言っても、世の中には様々なシステムがあり、各社独自のデータやモデルを使用してシステムを構築しています。私たちの身近にあるレコメンドシステムにはどのようなものがあるのでしょうか?

ここでは、独自のレコメンドシステムが活用されている身近な例として、NetflixとYouTubeを取り上げたいと思います。

Netflix 〜アートワーク・パーソナライゼーション〜

膨大なコンテンツ、多様なユーザーを持つNetflixにとって、最適なレコメンドシステムとは一体どのようなものなのでしょうか?各ユーザーに対して、適切なタイトルの映像コンテンツを適切なタイミングで提供するだけの単純なレコメンドでは物足りなさそうですね。

「新しくて見慣れないタイトルについて、どのように誘導すればユーザーの興味をそそるのか?」「どのようにレコメンドすれば、タイトルを見ただけで推薦した映像コンテンツに対して見る価値を見出してもらえるのか?」

Netflixは、ユーザー自身が現時点で馴染みのないタイトルの映像コンテンツに対しても辿り着けるように、提供するタイトルの表現方法に着目しました。

結果として、「アートワーク」をユーザー一人一人の趣味や嗜好でパーソナライズする(同じ映画であっても、壁紙のような複数の画像を用意しており、それらの出し分けをユーザー毎に行う)ことで、ユーザー体験を向上させることに成功しました。ユーザーごとにカスタムされたアートワークを、コンテンツへの入り口として、また視覚的な証拠として機能させたのです。

ここで、映画『パルプ・フィクション』のレコメンドを考えてみましょう。

映画『パルプ・フィクション』のアートワークのパーソナライゼーション
https://netflixtechblog.com/artwork-personalization-c589f074ad76

ユマ・サーマンが出演する映画をよく見るNetflixユーザーであれば、ユマが描かれている『パルプ・フィクション』のアートワークならば『パルプ・フィクション』をみようという気持ちになるのではないでしょうか(上段)? 
一方、ジョン・トラボルタのファンならば、ジョンが描かれているアートワークの『パルプ・フィクション』に興味を持ちそうですね(下段)。

先ほどは、お気に入りの俳優の観点でのパーソナライゼーションに着目してみました。今度は俳優のジャンルの観点から、映画『グッド・ウィル・ハンティング』のレコメンドを考えてみましょう。

映画『グッド・ウィル・ハンティング』のアートワークのパーソナライゼーション
https://netflixtechblog.com/artwork-personalization-c589f074ad76

例えば、普段ロマンチックな映画をたくさん見ている人に対しては、マット・デイモンとミニー・ドライバーが描かれているアートワークを通してレコメンドすれば、『グッド・ウィル・ハンティング』に興味を持ちそうですね(上段)。
他方、コメディ映画をたくさん見ている人へは、有名なコメディアンであるロビン・ウィリアムズを用いているアートワークにすることで、レコメンド効果を狙えるかもしれません(下段)。

このように、アートワークのパーソナライゼーションでは、様々な観点を切り口にして、各ユーザーに則したレコメンドをしていくことが求められます。

Netflixでは、毎日多くの新規作品や新規ユーザーが追加され、同時に上記で述べたようなユーザーの嗜好の変化も生じます。双方に継続的に適応できるアルゴリズムを用いることで、会員へより良いユーザー体験を届ける工夫をしているのです。

YouTube

続いては、YouTubeのレコメンドシステムの特徴/工夫について見ていきます。YouTubeのレコメンドが利用されている箇所としては、TOPぺージと、動画を見ている際に次に見る動画のレコメンドとして表示されるUp nextの2か所になります。

Recommendations on homepage
On YouTube’s recommendation system


Recommendations on "Up next."
On YouTube’s recommendation system

YouTubeの初期のレコメンドシステムでは、ユーザーのクリック情報を用いて似ているユーザーが見た動画をレコメンドしていました。

例えば、Aさんがテニス動画を見ていた場合に、同じようにテニス動画を見るユーザーがおり、その人がジャズ動画も見ていた場合、Aさんにジャズ動画もレコメンドする、というような仕組みでレコメンドしていました。
ただ、クリック履歴だけでは本当に興味があってクリックしたものか、そうではない理由でクリックしたかの判断が正確にはできないという課題があります。

そして別のケースでは、野球の試合動画を見ることが好きな場合、Up Nextでレコメンドされた動画に「野球の解説動画」や、「野球ファンが語る動画」などが出てきた場合、タイトルから求めている動画(シンプルに試合が見られる動画)か判別できず、本来見たい動画が見つかるまで求めていない動画(解説動画やコメント動画)をクリックしていく、ということが起こります。
そのため、YouTubeでは解決策として視聴時間も考慮することで、好きな動画かをより正確に測る方法に変更しています。

この他にも、視聴動画に対するユーザーの満足度を正確に測るためにユーザー調査を行ったり、動画をシェアしたかどうかの情報等も利用しています。

また、YouTubeの動画が増えるにつれて音楽やエンタメ以外にニュースや学術的な動画など、情報や内容の質が重要となる動画も増えており、質が担保された動画をレコメンドするという課題にも取り組んでいます。

動画が信頼できるものであるかどうかは、YouTubeの評価ガイドラインに沿って訓練を受けた人たちや専門家による協力のもと評価を行い、その評価は教師データとして利用され全動画の評価をモデルで行うことで、信頼できる動画をレコメンドできるように工夫されています。

データの種類が少なくても、レコメンドシステムは実装可能

しかし、このような色々な種類のデータを集めるのはなかなか難しいです。ここでは最低限のデータ種類で実装できる手法「協調フィルタリング(collaborative filtering)」を紹介します。

協調フィルタリングでは、ユーザーの購入履歴やクリック履歴があればレコメンドすることができるため、商品購入システム内に自然とデータが蓄積されます。そのため、レコメンドするために追加でデータを集める必要が無い点が特徴です。

協調フィルタリングの方法は、レコメンドしたいユーザーAと、嗜好(購入履歴)の類似した他のユーザーを見つけ、その似ているユーザーの購入履歴やクリック履歴の情報から商品をレコメンドするというものです。
(ユーザーAと似ているユーザーBが購入した商品であれば、ユーザーAも気に入るのではないかという考えです。)

NetflixとYouTubeでは、独自の課題に合わせて色々な種類のデータを利用し、モデルをより高度化して改善していますが、まず始めてみるという点では協調フィルタリングはおすすめの手法です。

協調フィルタリング(collaborative filtering)のイメージ図(引用:第1回 レコメンドシステムと集合知 | gihyo.jp

3.まとめ

本記事では、NetflixやYouTubeの独自のレコメンドシステムを紹介させていただきました。
Netflixでは、映画を見てもらうためにユーザーの好みに合わせてアートワークで内容を伝えることでレコメンドの工夫を行い、YouTubeでは、視聴履歴や動画の質を考慮することでレコメンドを工夫していました。一方、2社の様に色々な種類のデータが無い場合でも、協調フィルタリングという手法を利用し少ないデータ種類でモデリングできることも知っていただけたと思います。

次回は、レコメンドシステムの活用を考える②(実験編)にて、“ニュースレコメンドシステム”の既存手法が日本語実用に耐えるパフォーマンスを出せるのかを検証し、ご紹介予定です。

今回の記事でレコメンドシステムについての理解を深めていただけたら幸いです。最後までご覧いただきありがとうございました。

参考文献

関連記事

最後に

Japan Digital Design株式会社では、一緒に働いてくださる仲間を募集中です。カジュアル面談も実施しておりますので、下記リンク先からお気軽にお問合せください。


この記事に関するお問い合わせはこちら

Japan Digital Design 株式会社
M-AIS
Naomi Tanabe
Chise Ishii