「ユーザレビューの分散表現を用いた 主観的特徴の意味演算による観光スポット検索システム」を読んだ感想

この記事は、岩手県立大学 Advent Calendar 2017の15日目の記事です。

引き続き、アドベントカレンダーで穴が空いているところに最近読んだ論文の感想をなるべく平易な言葉で1000字以内で書いていこうと思います。

感想を定期的に書いてみて思ったのですが、平易な言葉で提案を紹介するよりも、この論文の成果を応用することによって具体的にどんなことができそうかという視点で書いたほうが価値がある気がしてきたのでそちらにシフトしていこうと思います。

さて、今回は、「ユーザレビューの分散表現を用いた 主観的特徴の意味演算による観光スポット検索システム」(吉田ら, DEIM Forum 2017)です。

[あらまし] (論文より引用)
観光スポットが持つ様々な特徴の中で,タグなどのメタデータでは推測困難な「夜景が美しい」「待ち合わせ場所に向いている」などの主観的特徴を考慮した観光スポット検索システムを提案する.提案システムでは,文書の分散表現獲得手法である Paragraph Vector を用いて観光スポットに対して投稿されたユーザレビューから生成した各スポットの特徴ベクトルと,ユーザが入力したキーワードをレビュー中に含むスポットの特徴ベクトルを用いて生成した入力キーワードの特徴ベクトルによる意味演算を行うことで,ユーザの入力キーワードが表す主観的特徴を考慮した観光スポット検索を行う.

感想

※解釈が間違っている可能性もあるので、正しくは原著を読んでね!

観光スポットの検索は、「盛岡 カレー」のように、地名とスポットを指すカテゴリを指定することが多い。しかし、カテゴリを推測することが困難な場合がある。例えば、レトロなお店でカレーを食べたいとしよう。滝沢市には Do というレトロなカレーが有名な喫茶店がある。しかしながら、盛岡市内でこれに似たお店を探そうとして「盛岡 カレー レトロ」と検索してもなかなかヒットしにくい。

これを「Do - 滝沢市 + 盛岡市」のようにして検索できるようにしたのがこの研究だ。言い換えれば、「滝沢市ではなく盛岡市のDoのようなお店」というクエリを投げるていることになる。

細かな方法は原書を読んでいただくとして、簡単にいうと観光スポットへのレビューを活用している。レビューをひとつの段落、すべてのレビューをまとめてひとつの文書として、Paragraph Vector モデルで検索を行えるようにしているようだ。

個人的に思うのは、こういったクエリはおもしろいと思うものの、実用化を目指す場合、現在のキーワード検索になれた利用者が使いこなせるかどうかという点が気になる。一方で、利用者にクエリを入力してもらうのではなく、次の観光の計画時に、過去に行った観光スポットのうち満足度の高い観光スポットをもとに、そのエリア内の類似スポットを表示する形であれば有効活用できそうだ。あるいは、似た旅行をしたくない旅行者にとっては、"差の演算" を使って類似しない観光スポットを探すのにも使えるかもしれない。ヨーロッパ旅行をしたあとにアメリカ旅行をする場合、「レストラン - ヨーロッパ + アメリカ」という具合だ。

(約690文字)

おわりに (ただの宣伝です。)

普段は旅行系サービスを開発しています。ゆくゆくは学術的な成果を実装してサービスに組み込みたいという思いがあって論文読んでます。観光系サービス開発をしてみたい!観光系の業務や研究してるんです!という学生さんや社会人の方いらしたらぜひお気軽にお声掛けください。

そういえば岩手県立大学卒業生・学生であれば誰でも参加できる同窓生Slack 「IPU Slack」というのもあるのでこちらもぜひどうぞ。




この記事が気に入ったらサポートをしてみませんか?