生成AIとユーザー体験について思案
生成AIの勃興により、AIがこれまでより直接的にヒトの生活に溶け込み、価値提供することを、少なくとも私は確実視している。最近の時勢を見ても、賛否両論あるだろうが多くの人がそうなるかもしれないと感じているのだろう
生成AIの利用率は低い
現状、多くの人は生成AIを利用していない。NRIによるChatGPT の利用動向の調査を見ると、日本において、全体的では15.4%程度のものであり、最も高い利用層でも40%と過半数を超えていない。
日本よりも利用率の高いアメリカでさえようやく半数に届くレベルだ
しかし、「生成AI」だけで考えると、世で広く語られるようになってまだ1年も経過していない。その点を踏まえると、日本の利用率はもしかしたら健闘しているのかもしれない。また、アメリカの利用率は異常なのかもしれない。
もう1年後はどうなるだろうか。官公庁での利用が始まり、ChatGPTの日本国内サーバーが設置されようとしている。NRIの調査によると、3ヶ月しか経過していないにもかかわらず、10代では2倍以上の伸びを見せている。これまで以上に、想像を超えるような広がりを見せるかもしれない。期待感はある。
とはいえ、この記事では「生成AIの利用率が低い」という立場をとって検討する
生成AIによる恩恵
ここではAI全般ではなく、生成AIに絞って考える。
このように低い利用率の状況で、生成AIを組み込む、もしくは基盤とするサービスや機能を提供する必要があるのだろうか。
「必要」と私は考える。
理由は、先ほど述べた利用率の向上が期待できる背景もあるが、生成AIの価値とレバレッジを考えると、サービスに導入した方がサービスにとってもユーザーにとっても価値があるからだ
そもそも、生成AIによる恩恵は、大きく3つに分類できるのではないだろうか。強化と代替、それらによる再構築だ。
(今後の利用率拡大もあるし、3分類の恩恵について、その恩恵を周りは享受し続けるので相対的な差ができる。サービス提供者としてこの恩恵はユーザーへ還元すべき。みたいな話をもうちょっと書き足す。いずれ)
この背景を踏まえてのユーザー体験
「現在の多くの層 (少なくとも過半数) は、ChatGPT (転じて生成AI) を利用したことがない」というのは、サービスや機能を考える上で重要な要素だ。
しかし、ChatGPT すら利用したことがないユーザーへ提供するサービスや機能が、ChatGPT を原体験としたようなチャットベースなのは (自然言語によるインタラクションを前提にしているのは)、もう少し体験を良くする余地が残っていると思う。
(現在の形が、より良い形を模索している最中という前提は当然あるので、サービス提供者も承知していると思うが)
私が特に注目しているのは、多くのサービスや機能が「AIを利用する」というアクションをユーザー側に求めているところだ。
例えばこの記事を公開している note では、生成AIの機能を利用するために以下の手順を取る
+ ボタンを押下する
「AIアシスタント(β)」を押下する
(オプション) 目的を選択する
プロンプトを入力・送信する
出力結果を確認し、評価する
反映可否を判断し、ボタン押下する
類似する機能として、Notion AI では以下のような手順になる
スペースを押す
プリセットの目的を選択するか、プロンプトを入力する
出力結果を確認し、評価する
反映可否を判断し、ボタン押下する
この二つの機能は、テキストを書く延長の機能であるので、ChatGPT のテキスト生成の文脈と似ている。そのため、体験をそちらに寄せるのは致し方ないというか、そちらの方が良いとも思う。少なくとも、ChatGPTを利用したことがある層にとっては、プロプト入力を求めるテキストフィールドの表示がシグニファイア (自然言語で目的を伝えることで望む出力が得られると、ユーザーに想起させる) として機能していると感じる。
異常から、どちらの機能も、後半3つのユーザーアクションは必要だろう。どのような形であれ、ユーザーの生成目的や方針はサービス側に必要な情報だ。自然言語によるプロンプトでも良いし、Notion AI のような選択式でも良い
ただ、太字にした生成AIを呼び出すアクションはどうだろう? 本当に必要なのか?
最近、私はここに注目している
なぜなら、過半数以上のユーザーが「ChatGPT すら利用したことがないユーザー」なのである。(この言葉には「生成AIを利用したことがあるユーザーは少なくともChatGPTを利用しているだろう」という前提がある。ここではこの真偽は確認しない)
ChatGPT を利用したこともなく、生成AIの便利さも知らないユーザーが、果たして「生成AI機能を呼び出すアクション」を実行してくれるのだろうか? 私は懐疑的、もっと言うと否定的に考えている。日常的に ChatGPT や StableDiffusion を初めとする生成AIに触れている私ですら、note や Notion の生成AI機能はあまり利用しないからだ。ではなぜ利用しないのか。
生成AI機能の利用を、能動的に想起しない。またはその場面が少ない
利用するまでのアクションが多く、面倒に感じる
一つの生成に対して一つのプロンプト (指示) が必要であり、面倒に感じる
利用想起から利用完了まで、時間がかかる
プロンプト送信から出力結果を待つまでの待機時間がある
自分を鑑みると、恐らく一番の要因は「能動的に」利用しようとしないところだろう。次に、利用完了までの待機時間の問題だろうか。面倒なところはユーザー側の慣れやサービス側の工夫で改善しそうな部分がある。
ここから、能動的に利用想起しないのであれば、受動的に利用できる環境を用意してみたらどのように変わるだろうか?という仮説を立てた。
これをやる動機は、「生成AIの利用体験」を獲得していないユーザー層への価値提供 (リーチ) だ。もう一度、NRIの調査結果を振り返る
私が述べているのは、この図のグラフ上部に無地として現れている (そして切り取られている)「ChatGPTを利用したことがない層」へ、如何に生成AIの価値を提供できるか。そこが今後サービスの命運を別つ要因の一つになるのではないか、ということだ
生成AIのサービスや機能が「生成AIを利用したいユーザー」のものだけであって良いのだろうか? AIによる人材の代替や産業構造変化のリスクが謳われているが、AI からもたらされる価値の大部分を積極的利用層が獲得し、リスクの多くを消極的な層が受けるという構造になるのだろうか。
そうなることが必ずしも悪いことだとは考えない (例えば先行者利益はそのリスクに対する報酬であるので) が、それだけだとAIは世に広まらない。ここはこの記事で検討したい本筋とは異なるので、気持ちを述べるのはここまでにするが、「大部分の人にとって価値があるから淘汰されずに生き残る」というのはあるのではないだろうか。
生成AIの受動的利用
さて、仮説「能動的に利用想起しないのであれば、受動的に利用できる環境を用意してみたらどのように変わるか」に戻る。
生成AIを能動的に利用するのではなく、受動的に利用するというのがどのようなものなのかというと、イメージ例としてスマホなどの文字入力の予測変換が挙げられる。
つまり、テキスト生成においては、プロンプトではない入力に対して、常に生成AIによる出力結果が表示され続け、必要を見出したらユーザーが選択、反映させることができる、といった具合だ
note を例とすると、以下のようなスクショの状況になったら「note で言うなら、」以後の文字列がカーソルの後ろか右側などに勝手に出力されるし、左側の目次には後続の見出しが勝手に表示されているような状況だ。もしかしたら、右側には複数設定できるプロンプトのウィンドウが存在し、「文書をフォーマルに書き直した結果」や「続きを書いた結果」がそれぞれ表示されているかも知れない
ユーザーは、それらの出力や表示に対して、反映するかどうかを選ぶことができる。
生成AIによる機能を利用しているが、「生成AI機能を利用する」というユーザーアクションは不要になる。しかも、「出力結果の待機時間」も体感的には軽減されるかもしれない。
読者がソフトウェアエンジニアであって GitHub Copilot を利用しているなら、そのイメージが近い。また、その価値も想像できるのではないだろうか
だが、「それが本当に便利なのか」という意見はもちろんあると思う。不要なユーザーもいるだろう。上記で挙げた機能は、あくまで例だ。
これらの例で肝要なのは、生成AIの利用経験の有無にかかわらず、ユーザーが生成AIを利用していることを意識せずに価値を享受できることだ。
コストや技術的な課題はいくつもあると思うが、Llama 2 などを活用したオンプレLLMなどを例として、解決方法はこれからも登場してくると期待できる。それまでに、サービス提供者が生成AIの価値を全てのユーザーへ適切な形で提供できるような知見や経験を積み、準備をしておかなければならない
くどいように引用しているが、私は、この図で切り取られている層も含めて生成AIの価値を提供できるように、日々考えていこうと思う。
サービスに生成AIを活用する云々に関わらず、サービスは本来そのようにあるべきなのだろうが
この記事が気に入ったらサポートをしてみませんか?