見出し画像

【保存版】 事例とセットで理解する「生成AIの7つの本質的価値」

最近は毎日のように新しい生成AIサービスや事例が飛び込んできます。

そのため、生成AIが万能な道具のように見えてしまったり、逆に生成AIの本来の強みが見えづらかったりします。

しかし、実際に成功している生成AIサービスの数々を抽象化し、その本質的な価値を整理すると以下の7つに集約できると私は考えています。

本noteではそんな「生成AIの7つの価値」について、以下でグローバルで成長しているサービス事例を交えながら解説していきます。


【本質的価値1】 コンテンツの創造コストを限りなく0にする


生成AIの第一の本質的価値は、「創造の限界費用」を限りなくゼロに近づけることです。

「創造の限界費用」という言葉は、世界的ベンチャーキャピタルのAndreessen Horowitzのマーティン・カサド氏とサラ・ウォン氏の記事から引用しています。

彼らの「マイクロチップが計算の限界費用をゼロにし、インターネットが情報流通の限界費用をゼロにしたように、生成AIは創造の限界費用をゼロにする」という主張は、生成AIのインパクトを見事に言い当てています。

生成AIはその名の通り、何かを生成する能力を有したAIを指します。この生成AIによって従来は多大なコストをかけないとつくることが難しかったコンテンツを、限りなく少ない労力で生み出せるようになっています。

それによって以下の3つの具体的なユーザーベネフィットを生んでいます。

「コンテンツの創造コストを限りなく0にする」
          ↓
1-1. コンテンツ制作のコストを大幅低減

1-2. 無数のバリエーション生成を可能にする
1-3. 顧客ごとにコンテンツのパーソナライズを可能にする

それぞれ1つずつ具体的なサービス例を紹介します。

1-1. コンテンツ制作のコストを大幅低減する「Jasper」

AIライティングツールの「Jasper」は、ブログ記事やマーケティングコピーなど、作成したいコンテンツの種類やテーマを入力するだけで人間の代わりにライティングを行ってくれます。

ユーザーはJasperが作成したコンテンツをエディターで調整するだけで様々なコンテンツを制作でき、制作費用を大幅に削減できます。Jasperは2024年2月時点で評価額1000億円を超えるユニコーン企業として急成長している企業の一つです。


1-2. 無数のバリエーション生成を可能にする

また、写真加工サービス「Picsart」は、特定の商品画像に対して無数のバリエーションを生成することが可能です。

Picsartに商品の写真をアップロードすると、自動で背景が切り抜かれ、入力されたテキストプロンプトに基づいてその商品画像に対して様々な背景画像が生成され、複数パターンの商品画像を作成することができます。

https://picsart.com/ja/


1-3. 顧客ごとにコンテンツのパーソナライズを可能にする

動画生成サービスの「tavus」では、1つの動画を撮るだけで相手ごとにパーソナライズされた動画を生成することができます。

ユーザーは商品紹介などのビデオを1つ録画すると、相手の名前や会社名などに該当する部分を生成されたユーザーの声で自動で置き換え、あたかも相手だけに作成されたかのような動画を作成可能です。

こうしたパーソナライズされた動画により、マーケティングやカスタマーサクセス、リクルーティングなどの用途で通常の動画よりも高い効果を生んでいます。実際に彼らのサイトを見ると、MetaやSalesforceなどの大手テック企業が導入していると謳われており、累計調達額は2024年2月時点で2,400万ドル程度ですが、今後注目のスタートアップの1社です。


【本質的価値2】 システムによる限りなく自然な対話の実現


生成AIの2つ目の本質的価値は、システムによる限りなく自然な対話の実現にあります。

ChatGPTで既に実感されている方も多いと思いますが、大規模言語モデルの登場とその進化により、システムが人間に対して今までに比べると圧倒的に自然な対話を行えるようになりました。

この強みを生かして具体的に以下の3つのユーザーベネフィットが生まれており、それぞれの価値に対応して展開されている生成AIサービスの事例をここでも紹介します。

「システムによる限りなく自然な対話の実現」
          ↓
2-1. 対人対応コストの大幅な削減
2-2. インターフェイスの自然言語化による操作コストの低減
2-3. 体験内コンテンツのインタラクティブ化・セミ自律化


2-1. 対人対応コストの大幅な削減

「Ada」は、企業が顧客に提供するチャット形式のカスタマーサポートを大規模言語モデルを活用して自動化することで、顧客対応のコストの大幅削減を可能にするサービスです。

顧客企業のWebサイトやアップロードされたドキュメントから企業や商品の情報を事前に学習し、ユーザーから企業や商品に関する質問をされた際に、自社の情報に基づいた回答を自動で返してくれます。

Adaは2024年2月時点で評価額12億ドル、累計調達額は1.9億ドルと、非常に成長しているユニコーンスタートアップです。国内でも、私の顧問先の一社であるwevnalさんが「BOTCHAN AI」という同様のモデルのサービスを展開しており、急速に導入企業数と導入効果を積み上げています。


2-2. インターフェイスの自然言語化による操作コストの低減

「Adept」は、ユーザーが自然な言葉で指示するだけで、例えばセールスフォースや不動産の契約サイトなどの複雑なサイトの操作を、ユーザーに代わって自動で行うサービスです。

こうしたサービスの操作には従来は多くのステップが必要で、セールスフォースなどはその運用に特化したコンサルティングサービスが存在するほどです。

ですが、Adeptであれば、ユーザーは「●●さんを■■社に新規リードとして登録して」と自然言語でテキストを打ち込むだけで操作を完了できます。

こうした複雑な操作のインターフェースを自然言語で提供することにより価値を発揮するサービスは、Adept以外にも多く登場すると思われます。Adeptは2024年2月時点でまだサービスの一部を切り出したデモしか公開していませんが、評価額は10億ドル以上、累計調達額は4.1億ドルと、今後の展開が大いに期待されているユニコーン企業の一つです。


2-3. 体験内コンテンツのインタラクティブ化・セミ自律化

Inworldは、体験内コンテンツのインタラクティブ化や半自律化といった領域で急成長しています。

ゲーム体験において、従来はNPC(ドラクエの村人などの非プレイヤーキャラクター)は事前に決められた単調な返答しかできないのが基本でした。

しかし、Inworldは大規模言語モデルを用いることで、開発者が事前に設定した性格や背景ストーリーなどに基づき、多様で柔軟な対話が可能なゲーム内NPCの作成をノーコードで可能にしています。

Inworldは2024年2月時点で評価額5億ドル、累計調達額1.2億ドルと、同じく米国Convaiといった競合スタートアップと共に非常に注目されている企業です。


【本質的価値3】 非構造化データのベクトル化による柔軟な処理


非構造化データをベクトル化して様々な処理を可能にするという生成AIの強みは、非常に重要な特徴でありながら見落とされがちな生成AIのコア価値の1つです。

従来の機械学習では、データはフォーマットなどが構造的にきちんと整理されていないと、原則的にはうまく処理することができませんでした。

しかし、生成AIサービスで主に用いられている大規模言語モデルは、入力されたテキストなどの非構造化データをベクトルという数値データに変換して処理できるため、例えば社内の共有クラウドに上がっているファイル群やオンラインの記事群などを読み込ませて、分析やライティングなどの処理を行わせることが可能になっています。

それにより、以下の具体的なユーザーベネフィットが生まれています。

「非構造化データのベクトル化による柔軟な処理」
          ↓
3-1. 非構造化データの文脈を加味した検索を可能にする
3-2. 非構造化データからインサイト抽出が可能にする

ここでは、上記に対応した具体的なサービスを2つ紹介します。


3-1. 非構造化データの文脈を加味した検索を可能にする

非構造化データのベクトル化という特性を生かした生成AIサービスの代表例として、「Glean」が挙げられます。

このサービスは、「Googleドライブ」や「Notion」「Confluence」などの社内データがたまっている社内のアプリケーションと連携し、それらの社内のナレッジ情報を対話型のインターフェースで効率的に検索できるようにするサービスです。分かりやすくいうと、社内のことを何でも答えてくれるAIエージェントを作れるサービスですね。

調査機関のIDCリサーチによる「Information Worker Survey」によると、典型的なナレッジ・ワーカーの労働時間の4分の1以上が情報の検索に費やされており、社内のコンテンツが他の社員がアクセスできる場所に掲載されている比率は全体の僅か16%に過ぎないという調査結果が出ています。

Gleanは、こうしたホワイトカラーの社内情報検索という領域で実際に多くの企業で業務効率改善の実績を上げており、現在ではCanva、Okta、Duolingoなどの多くの大手IT企業も導入しているユニコーン企業です。



3-2. 非構造化データからインサイト抽出が可能にする

AlphaSenseは、オンライン上の記事や開示情報、調査機関のレポートなどの非構造化データから、インサイトを自動抽出することで価値提供するサービスです。

米Teslaや米Nvidiaなどの特定企業に関して、開示されている業績情報やニュース記事、ゴールドマン・サックスやJ.P.モルガンなどが提供しているリサーチペーパーなどを基に、AlphaSenseのシステムが自動的に分析レポートを作成し、コンサルティング企業や投資会社の担当者向けに提供しています。

AlphaSenseは、2024年2月時点で累計7.4億ドル調達しており、S&P100のうち85%の企業、トップアセットマネジメントファームの75%、トップコンサルティング企業の80%が既に導入しているという、驚異的な市場シェアを誇っています。


【本質的価値4】 コンテンツのマルチモーダル化


生成AIの第4の価値は、テキストなどの単一のデータの種類(モーダル)から複数のデータ種類からなるコンテンツ(マルチモーダルなコンテンツ)を生成することで、よりコンテンツの価値を高めることを可能にするという価値です。

AIの世界では「モーダル」という言葉がよく出てきますが、簡単に言うと、テキスト、音声、画像など、データの種類のことを指します。GPT-4Vを筆頭にAIの文脈で「マルチモーダル」という言葉がよく出てきますが、それはテキストや画像などマルチ(複数)なデータを扱えるということを意味します。

この価値を活かしたサービスの代表例としては、テキストの原稿を入力するだけで、人と見分けがつかないAIアバターが自然な発話と動きで話している動画を生成できる英Synthesiaが挙げられます。

Synthesiaは社内研修やセールスイネーブルメント、マーケティング用のプロダクト紹介ビデオなどに用途を絞っており、現時点でも実用的なクオリティーを実現しています。

そのため、Johnson & JohnsonやAmazonなどFortune500(米国の大企業リスト)の半数以上を含む、5万社以上が既に導入しているという驚異的なPMF具合を見せています。

Synthesiaは、2024年2月時点で累計約1.6億ドル調達、評価額は約10億ドルと、市場からも非常に評価されています。


また、テキストを入力するだけで文字や生成された画像が挿入されたプレゼンテーションスライド資料を生成してくれる「Tome」も成長しています。

現時点では、Tomeを使って実用に足るクオリティーの資料をつくることは難しいと個人的には感じていますが、2024年2月時点で累計1億ドル調達、評価額は約12億ドルと市場から非常に評価されている生成AIスタートアップの一社です。


こういった、単一または少数のモーダルの入力から、マルチモーダルでよりリッチなアウトプットを生成することで、コンテンツの使用価値を高めるようなサービスは今後も増えていくと思われます。


【本質的価値5】 高単価専門知識の民主化

5つ目の価値として、高度な専門知識の民主化が挙げられます。

これは、2つ目のAIによる自然な対話が行えるという価値と、3つ目の非構造化データのベクトル化による柔軟な処理という価値を組み合わせることによって生じている価値だと言えます。

大規模言語モデルに法律文書や医療データを学習させることで、法律分野や医療分野といった本来は高度な専門知識が必要な領域の民主化も進んでいます。

例えば、「Ironclad」というサービスは、契約書の作成やレビューを自動化するプラットフォームを契約業務の多い企業向けに提供しています。

利用企業はIroncladに契約書のドキュメントをアップロードすると、IroncladのAIが自動的に契約書をレビューしてくれ、注意すべき条項の提示や修正文言の提案などを行ってくれます。

実際に利用企業の1社である大手化粧品会社の仏ロレアルは大量のベンダー契約書のレビュープロセスをIroncladで大幅に効率化しているとされています。


また、医療分野においても、臨床実験レベルですがGoogleが開発する医療特化版大規模言語モデルの「Med-PaLM2」は、実際の病院でのテスト運用を開始しており、既に特定領域で人間の医師よりも診断の正確性が高いという結果も出ています。


【本質的価値6】 言語障壁の軽減

6つ目の価値として挙げられるのは、言語障壁の軽減です。

GPTなどの大規模言語モデルは様々な言語の学習データを、ベクトル変換して処理をしています。

それはいわば様々な言語のデータを学習する際にAIが自分にだけに分かる独自の言語に全てを翻訳して脳内に蓄積しているような状態に近いです。

つまり大規模言語モデルは言語の壁が極限までなくなった状態で知識を保存するのです。

ChatGPTがいきなり日本語での精度が高かったのも、上記のような仕組みによるところが大きいです。このように大規模言語モデルの登場によって言語の壁は薄れつつあり、今後大規模言語モデルが発展していく中で言語の壁はますます融解していくでしょう。


例えば、Synthesiaと類似したサービスである「HeyGen」というサービスを使えば、事前に2分間のデモ収録をするだけで、以降はテキスト原稿を入れ込むだけで流暢に多言語で話す自分の動画を生成することが可能です。


また、Synthesiaでも、英語など1つの言語のテキスト原稿を入力するだけでスペイン語やフランス語、ドイツ語などの多言語のバージョンの動画も一度に生成することが可能です。

Synthesia




この「言語障壁の軽減」という特徴を生かした生成AIサービスは今後も増えるでしょう。

そして、別の角度でこの特徴を見ると、今までは言語の壁で海外サービスが日本市場に進出しづらく国内プレイヤーが比較的戦いやすかった状況でしたが、これからは海外サービスの日本語対応のスピードは格段に上がり、早期から海外サービスとの競争になるケースは増えるはずです。

逆にいえば、今まで言語の壁によって国内サービスが海外に進出しづらかった状況もこれによって変わる可能性が高く、こうした変化も経営レイヤーとしては認識しておくべきかと思います。


【本質的価値7】新たなインプット手法の実現

7つ目は、一般的なテキスト入力ではなく画像だけで指示を送るなど新たなインプット手法を実現するという価値です。

これは比較的新しく実現しつつある価値であり、事業として大きく成長しているサービスはまだ出てきていませんが、OpenAIのGPT-4Vで画像入力に対応したAPIが公開されたことにより今後注目が集まるであろう価値の1つです。

その兆しとなるサービスを1つ紹介すると、英TLDrawが提供するオンライン図解ツール「tldraw」がGPT-4VのAPIを利用して提供している機能「tldraw makereal」が挙げられます。

「tldraw makereal」では、ラフに図を作成したり手書きのイラストを貼ったりするだけで、GPT-4VのAPI経由でその画像を読み取り、仕様をうまく解釈した上でソースコードと実際に動くモックアップが作成されます。

ソースコードやモックアップをつくるために画像を入力するという、全く新しい体験がそこでは実現されています。


この他にもデモのレベルでは、自分の全身画像を送ってファッションのアドバイスをもらったり、食事の画像を送ってヘルスケアや栄養観点でアドバイスをもらったり、冷蔵庫の中の写真を送ってレシピを提案してもらったりするなどの体験がGPT-4VのAPIなどで実現しており、こうした新しいインプット手法によるサービスは今後も増えていくと思われます。


まとめ

以上のように捉えどころのない生成AIについても、7つの価値に抽象化することでかなり理解しやすくなると思います。

そして、生成AIを正しく深く理解することは、自社の組織で生成AIを適切に活用して生産性を上げる際にも、生成AIサービスをつくる際にも役立ちます。

ぜひ本noteが生成AIを深く理解する助けとなれば幸いです。

さいごに

『生成AI時代を勝ち抜く事業・組織のつくり方』という書籍を日経BPから2/19に発売いたしました!

生成AI時代を勝ち抜く事業・組織のつくり方

10社以上での生成AI領域の企業顧問や、これまでの新規事業づくりサービスづくりの経験を全てつぎ込み、生成AIを活用して強い事業と組織をつくるための方法を実際の事例、オリジナルのフレームワーク、未来予想などてんこ盛りで書き上げた渾身の一冊になっております。

本noteで紹介した「生成AIの7つの本質価値」を活かした事業づくり、組織生産性向上についても解説しています。

ありがたいことにAmazonのランキングで全ビジネス書中1位も一時取れたり発売前増刷も決まりましたが、日本の生成AI活用レベルを押し上げるために、もっと多くの方に届けたいと思っています。
このnoteを読んで、生成AIを通した事業づくり、事業成長、組織改革に興味を持った方はぜひ以下からご購入頂けますと幸いです!


AIやXRなどの先端テック、プロダクト戦略などについてのトレンド解説や考察をTwitterで日々発信しています。 👉 https://twitter.com/kajikent