見出し画像

Inworldとみる人間らしいNPCの実現

人間らしさとはなんでしょうか。
「アンドロイドは電気羊の夢を見るか?」では、Empathy(共感)が人間らしさの肝として描かれていました。そんな中、バーチャル上にて「人間らしい」AIキャラクターの開発に取り組んでいるスタートアップがInworldです。

2023年8月の調達ラウンドにて、5億ドル(約750億円)の評価額が付きエマージングユニコーンとなったInworld AIですが、これまでの調達先のVCも、Kleiner Perkins、Sequoia Capital、Founders Fund、Lightspeed Venture  Partnersとビッグネームばかりです。アメリカの生成AIスタートアップの中でも特に期待されていると言えるでしょう。

InworldはゲームのNPCに生成AIを組み込み、よりインタラクティブな体験を可能にするゲームエンジンを開発しており、既にいくつかのゲームがInworldを用いて制作されています。Inworldではただ単純にキャラクターとの会話に生成AIを取り込むのではなく、感情、記憶、表情といった要素の調整を通して、より「人間らしい」NPCの実現を目指しています。

今回はそんなInworldの創業ストーリーや機能の紹介を通して、バーチャル上で人間らしいAIを作るための要点を見ていきたいと思います。


Inworld創設:Googleで会った3人

HP:https://inworld.ai
設立年: 2021年
拠点:アメリカ(サンフランシスコ)
シリーズ:Series A+
累計資金調達額:1億2500万ドル(約190億円)

Inworldのファウンダーは強力なファウンダー・マーケットフィットを持っています。3人いる共同創設者のひとりであるIlya Gelfenbeynは、Googleに買収されたDiagflow(元API.AI)の創設者です。Dialogflow は、自然言語処理を用いてチャットボットや音声アシスタントAIを開発するためのプラットフォームです。CTOのMichael Ermolenkoも同じくDiagflowにて研究開発担当でした。最後の共同創設者であるKylan Gibbsは、コンサルティング会社であるBain&Companyで経験を積んだ後に、Google傘下で囲碁の世界チャンピオンを破ったAlphaGoなどを開発したDeepMindで対話型AI開発におけるプロダクトマネージャーをしていました。

共同創業者の3人。左からMichael、Ilya、Kylan。

このように3人ともInworld創設直前はGoogleに在籍しており、Kylanは一時期一緒に働いていたMichaelがGoogleを離れると耳にし、話を聞きにいきます。そこで集うことになった3人は、対話型AIやGenerative AIとバーチャルワールドの未来について議論し、この領域はベットする価値があるのではないかと話します。そしてこれからより多くの人がメタバースやゲームに時間を割いていく上で、そこに存在するNPCに足りないものは「人間性」だと考えました。

こうして3人はInworld設立へと向かうことになります。

Inworldの提供する機能

生成AIをゲームNPCに組み込む際に最も難しい課題は、NPCキャラクターがゲームの論理やストーリーラインを維持しながらも、プレイヤーの行動に応じて適切に反応・会話することです。例えばNPCはプレイヤーがまだ知るべきでない情報を勝手に教えてはいけませんし、会話をストーリーに沿って変化させていく必要もあります。

このためにはキャラクターの知識や性格の制御と、ストーリー進行とキャラクターの各要素への厳密な紐付けが必要となりますが、これがまさにInworldの取り組んでいる課題です。

Inworld Studioの概観

ユーザーはまずInworld StudioにてキャラクターAIを構築し、その後にUnityUnreal Engineといった既存のゲームエンジンに統合させます。キャラクターAIの構築手順は以下の5ステップです。

  1. キャラクター作成

    • キャラクターの核となる説明を書く

    • 性別や年齢、趣味など、キャラクターのアイデンティティを定義する

    • キャラクターの性格と感情を調整する

    • キャラクターに関するバックストーリーを入力したり、知識フィルターをかける

    • キャラクターの声を設定する

    • キャラクターのコミュニケーションスタイルを設定する

    • キャラクターのゴールとアクションを設定する

  2. ワールド設定:キャラクターの周辺環境を認識させる

  3. 共通知識の確立:複数キャラクターが知り得る共通知識を入力する

  4. キャラクターとの対話:試しに作ったキャラクターと対話し、微調整する

  5. アバター作成:会話するキャラクターのアバターを作る

この中でもゲームへの対話型AIの導入に関して、特に重要な要素を取り上げていきます。

知識フィルター

Strictモードでは開発者の入力した知識に限定し、Mildモードではより柔軟な知識設定ができる

まずは知識フィルターです。現実世界の知識はもちろん、ゲーム内での特定の出来事や人物など、NPCに勝手に話されてしまうと不都合な知識があります。Inworld StudioではそうしたNPCの知識にフィルターをかけ、状況に合わせて知識量を変化させることができます。
知識には以下4つのカテゴリーが与えられており、それぞれを柔軟に組み合わせることでキャラクターを世界観と統一させ、「人間らしい」知識の変化を可能にします。

  • 開発者定義の知識:開発者が直接入力した知識

  • 開発者定義の知識の派生:開発者が入力した知識と関連していると推測できる知識

  • 到達可能な知識:設定やアクションに基づいて、キャラクターが将来的に知り得る知識

  • 到達不可能な知識:キャラクターが知ることを禁じられた知識

到達可能な知識に関しては、次に説明するゴールとアクションに応じてNPCに与えたりすることができます。

ゴールとアクション

このコードでは、武器を紹介するというゴールがNPCに対して設定されており、武器が欲しいことをプレイヤーが示すことがトリガーとなって、発言や感情の変化といったアクションを起こす

ゴールとアクションは、Inworldで作成したNPCがダイナミックな対話をするための鍵となる要素です。例えばプレイヤーが魔王を倒した後の村の住民の態度や会話内容が変化したりなど、ストーリーや環境に沿ったNPCの変化を実現することができます。
特定のトリガーが発動し、ゴールが起動した際に、NPCは以下のようなアクションを与えられます。

  • 発話アクション:発言内容のガイダンスを与えたり、入力した発言をそのまま言わせたりする

  • 状態変化アクション:感情やプレイヤーとの関係性を変化させる

  • ランダムアクション:アクションが実行されるかを確率で決める

ランダムアクションはミステリーゲームでNPCを尋問し続けると口を割ったりなど、色々と応用ができそうです。
Inworldではこのゴールとアクションの設定にYAMLという人間にも読みやすく理解しやすいプログラミング言語を用いており、直感的なトリガーの設定を可能にしています。
既存のゲームエンジンにも似たような機能はありますが、生成AIを活用することでプレイヤーの発言の「意図」を理解させ、また定型文ではない自然な返答をさせることができるのです。

長期記憶

 瞬間記憶の内容が何度か重なると、長期記憶へと昇華する

さっき話しかけたのに全く同じことを言い続けるNPCにうんざりした経験はありますでしょうか。InworldはNPCキャラクターの記憶を段階的に変化させることで、自然な記憶システムを再現します。
NPCとプレイヤーの対話中、その内容は文字ベースで記録され、会話中は瞬間記憶として残ります。瞬間記憶はプレイヤーが離れると消えてしまいますが、Inworld Studioでは瞬間記憶が何度も呼び起こされた際に、それを長期記憶へと昇華させる機能が提供されています。
例えば寿司や焼き鳥が好きだという話をし続ければ、このプレイヤーは日本食が好きだと解釈され、長期記憶に保存されることとなります。これにより、次に話したときはそうした情報を元に発言をしてくれるようになります。

コンテクストメッシュ

複雑な世界やプレイヤー交流において、NPCを適切な立ち位置に配置する機能

最後は少し複雑な概念になりますが、コンテクストメッシュという要素です。コンテクストは文脈・状況の意味で、メッシュは複雑なネットワーク・関係性を意味します。
この要素では、NPCを取り巻く世界観や特定のプレイヤー層との関係性を制御することを目的に、以下4つの機能が提供されています。

安全性コントロール
まずは退屈ですが重要な機能で、プレイヤーの年齢層に沿ってNPCの発言内容に制限をかけることができます。暴力、成人向けトピック、薬物などに関する発言を未成年には禁じながら、成人したプレイヤーには解放することができます。

関係性
ゲームにおいてキャラクターとの親密度を上げることは醍醐味のひとつですが、Inworldは「関係性の流動性」をセッティングすることで、より滑らかな関係構築を可能にします。プレイヤーは発言や行動を通して、NPCの態度や発言内容の自然な変化を楽しむことができます。

プレイヤー情報
これは初期状態でもプレイヤー情報に基づいて、NPCを最適化できる機能です。開発者はいくつかのプレイヤー要素(性別、年齢層、ゲーム内での立ち位置など)を追加し、それに対するプレイヤーの入力を通してNPCに事前に学習させることができます。特にマルチプレイヤーゲームでのNPC交流に役立ちそうです。

第4の壁
こちらは先ほど紹介した知識フィルターと似た機能ですが、知識フィルターではゲーム内の情報取得を特定NPCに禁じるのに対し、第4の壁では現実の情報へのアクセスを遮断することが可能です。基本的にLLMは現実世界での情報によってトレーニングされているため、それによって作られた生成AIをゲームに使う際には、ゲーム世界とは関係のない情報をプレイヤーに提示することを禁じる必要があります。

こうした機能により、プレイヤーはより安心してゲーム世界に没入することができます。特にプレイヤーによって発言を変えたり、親密度によって態度を変えたりといったパーソナライゼーション機能は、更なる没入感を生み出すために必須であるといえます。

Inworld活用のケーススタディ

このように、ゲームに対話型AIを導入するといっても、ゲーム体験を最適化するためには考えるべき要素が数多くあります。Inworldも既存ユーザーからのフィードバックも活用して様々な機能を追加しており、これからAI NPC構築エンジンとしてどんどん充実していくでしょう。

またInworldはゲーム以外の分野への活用も考えられます。以下にいくつか実際の事例を紹介していきたいと思います。

Disney Droid Maker:IPの拡張

Introducing Droid Maker and other collaborations from Disney Demo Day

Inworldの最初の事例とも言えるのが、スターウォーズのC-3POとの会話を可能にしたものです。C-3POに話しかけると、彼独自の視点でスターウォーズの世界について説明してくれます。InworldはDisney Acceleratorという、ディズニーの開催しているエンタメスタートアップ特化のアクセラレーターに参加していたため、このようにIPを活用してデモを作ることができました。エンタメ業界でのIPの拡張は市場拡大のための重要な要素なので、ゲーム以外で最も浸透が進みそうな領域です。

Wol:インタラクティブな教育の実現

こちらの事例では、Pokemon Goを開発したNianticと協力し、ARでのインタラクティブな学習体験を提供しています。プレイヤーがVRヘッドセットやスマートフォンで特定方向を見ると、森を模したバーチャル環境が出現し、そこに一匹のフクロウが寄ってきます。ここでInworldのAIエンジンを活用し、フクロウの性格、世界観との統合、そして知識の限定を行うことで、森や自然のことについて教えてくれるキャラクターを作っています。AI NPCの教育への応用事例としてはもちろん、AR/VRと掛け合わせた際の圧倒的な没入感を感じることができます。

Origins:Inworld自身によるデモゲーム

OriginはInworldが手がけるミステリーゲームで、プレイヤーはアンドロイドと人間が共生する世界で、探偵として爆発事故の謎を解き明かします。それぞれのNPCと自由に会話し、そこで得られる手掛かりをもとに真実を暴くのです。この事例では全体のストーリーラインや、ゲームの目的(この場合は謎を解く)をしっかりと確立させながら、AI NPCを自由に喋らせることが可能になっています。ゲームの規模が大きくなると、NPCへの制限やゴール設定が複雑になってきますが、現状はこうしたインディーゲームにて十分に活用できるでしょう。OriginはSteamにて実際に遊ぶことができるため、興味のある方はぜひ触ってみてください。

ゲーム×生成AIの未来は?

ゲーム×生成AIに取り組むスタートアップのカオスマップ
Future of AI in gaming: Generative AI companies

InworldはChatGPTが普及する前から対話型NPCの開発に取り組んでいましたが、共同創業者のひとりであるKylanはChatGPTの出現はピンチではなくチャンスだったと言っています。以前はAIキャラクターとの会話というものにあまりイメージが湧かなかった顧客も、ChatGPTの普及とともに実感が湧いてきたそうです。

Inworldはゲームにおける「キャラクターとの対話」の側面に特化していますが、UGC、ワールド生成、ゲーム開発など生成AIを活用できる要素は多分にあり、これからどんどん大きくなる領域であると考えています。またゲームAIに使われる技術も実社会への応用が可能であり、デジタル世界上で生成AIの組み込みをテストから現実へと波及させていくことも出てくるでしょう。スマートフォンのように、生成AIが社会の隅々まで浸透する時代を作っていくのは私たちです。

最後に

最後まで読んでいただき、ありがとうございました。
OpenAIが強すぎて少しスタートアップの熱狂が落ち着き始めているGenerative AIですが、起業家の専門性を利用した領域特化のスタートアップはまだ多分に必要とされています。

HAKOBUNEも、社会性を持つ汎用型AIを開発しているEuphopiaや、AI司会者によるオンラインミーティングの自動化サービスを提供しているtenderなど、Generative AIを活用したスタートアップに投資してきました。
これからの社会を担う起業家や、アイデア段階にいる方々ともぜひお話をしたいと考えていますので、お気軽にご連絡ください。

HAKOBUNEのウェブサイト:https://www.hkbn.vc
記者のTwitter:https://twitter.com/shinichi815


<参考資料>