見出し画像

Sam Altman talks GPT-4o and Predicts the Future of AI和訳

以下のYoutubeの対談の和訳です。Sam AltmanをS:、Logan BartlettをL:とします。重要そうな箇所は太字にしました。

S: 長い間、音声制御のコンピューターのアイデアはありましたが、これまで自然に使えるとは感じませんでした。でもこれは、柔軟性や適応性がとても高く、使うのがこんなに好きになるとは信じられません。

L: Logan Bartlettショーへようこそ。このエピソードでは、OpenAIの共同創設者兼CEOのSam Altmanと対談します。Logan Bartlettショーを初めて聴く方のために説明すると、このポッドキャストでは主にテクノロジー分野のビジネスを運営・投資している指導者や投資家と、彼らが学んだ教訓について議論します。Samとの対談は少し趣が異なり、人工知能について、またOpenAIがどこに向かっているのかについて、最近のニュースで話題になっていることを中心に話を掘り下げました。人工知能という最先端分野におけるSamの視点が聞けるでしょう。それではSamとの対談をどうぞ。

L: 来てくれてありがとう。

S: もちろん、喜んで。

L: まずは簡単な質問から。この4、5年間でOpenAIを経営する中で、あなたの人生で最も奇妙な変化は何ですか?

S: 様々なことがありましたが、公の場で匿名でいられなくなったことが非常に奇妙です。事前に考えていたら、これは想像以上に変な感じだろうなと思っていたでしょう。でも深く考えていませんでした。ストレンジな孤独感を味わう生活方法です。

L: あなたはAIとビジネスの力を信じていたのに、OpenAIを経営することの副次的な意味を考え抜かなかったのですか?

S: AIが本当に重要になるとか、とても重要な会社になるとは思っていましたが、自分の街で外食もできなくなるとは思っていませんでした。

L: それは変ですね。

S: 変ですよね。

L: 今日、発表がありましたね。

S: そうですね。

L: GPT-4oですね。オーのサインは、オムニのオーですよね。

S: オムニのオーです。

L: テキスト、音声、ビジョンに対応していますが、これが重要な理由を教えてください。

S: 信じられないほど素晴らしいコンピューター利用方法だと思うからです。長い間、音声制御のコンピューターのアイデアはありましたが、Siriやそれよりもっとずっと前のものもありましたが、これまで自然に使えるとは感じませんでした。でもこれは、できることの多さ、スピード、他のモダリティの追加、抑揚、自然さ、「もっと速く話して」や「この声で話して」といったことができる点で、柔軟性や適応性がとても高く、使うのがこんなに好きになるとは信じられません。

L: Spike Johnsもきっと誇らしく思うでしょう。

S: 確かに、ハハ。

L: あなたが特に使い道を感じているのはどんなことですか?

S: まだ1週間ほどしか使っていないのですが、驚いたのは、集中して作業している時にスマホをテーブルに置いて、ウィンドウを切り替えたり、やっていることを変えたりせずに、別のチャンネルとして使うことです。普段なら作業を止めて、別のタブに切り替えてGoogleで検索したりクリックしたりしますが、コンピューターで見ているものから目を離さずに、ただ尋ねるだけで即座に回答が得られるのは、驚くほどクールなことでした。

L: これを可能にしたのは、アーキテクチャの変更ですか、それともコンピューティングパワーの向上ですか?

S: 過去数年で学んだすべてのことの集大成ですね。オーディオモデル、ビジュアルモデル、それらを結びつけること、モデルをより効率的にトレーニングする方法など、様々なことに取り組んできました。一気に新しいことができるようになったわけではありませんが、多くのピースを組み合わせた結果です。

L: 使い勝手のために、レイテンシーを下げるためのオンデバイスモデルの開発が必要だと思いますか?

S: 動画の場合は、ネットワークのレイテンシーに悩まされるかもしれません。いつかARゴーグルをかけて、リアルタイムで世界に語りかけ、物事が変化するのを見るのは、本当に素晴らしいことだと思っています。でもそれはネットワークのレイテンシーでは難しいかもしれません。でもこれに関しては、200〜300ミリ秒のレイテンシーでも、多くの場合、人間が反応するよりも速く感じます。

L: この場合の動画は画像のことですか?

S: あ、すみません。生成された動画のことを言っているのであって、入力された動画のことではありません。

L: なるほど。では現在は、実際の動画をフレームごとに処理しているのですね。

S: そうですね、フレームごとに。

L: 最近、ChatGPTは次の大きなリリースではなく、GPT-5ではないかもしれないとほのめかしていましたね。モデル開発には反復的なアプローチを取っているように感じますが、今後もそのように考えるのが妥当だと言えますか? つまり、GPT-5といった大きなリリースはなく、その代わりに...

S: 正直まだわかりません。一つ確実に学んだことは、AIとサプライズは相性が良くないということです。従来のテック企業の製品リリース方法とは、おそらく違うやり方をすべきでしょう。それでもGPT-5と呼んで、違う方法でリリースすることもできるし、別の名前を付けることもできます。でもまだ、これらのものに名前やブランドを付ける方法は分かっていません。GPT-1からGPT-4までは理にかなっていると思いましたが、今はGPT-4がリリース後もずっと良くなり続けています。一つの基盤となる仮想的な脳があって、場合によってはより難しいことを考えられるようになるのかもしれません。あるいは、別のモデルかもしれませんが、ユーザーにとっては違いがあるかどうかは気にならないのかもしれません。だから、これらをどのように製品化し、マーケティングしていくかについての答えはまだ分からないのです。

L: それは、モデルを増分的に改善するために必要な計算リソースが、これまでよりも少なくなる可能性があるということですか?

S: ある意味、我々は常に手に入る計算リソースを最大限に活用するでしょう。効率の向上は驚くべきものがあり、それは本当に重要です。今日発表した素晴らしいことは、もちろん音声モードですが、おそらく最も重要なのは、これを非常に効率的にすることができたので、無料ユーザーにも提供できるようになったことです。世界最高のモデルを、かなりの差をつけて、ChatGPTを無料でダウンロードしたい人なら誰でも使えるようにしたのです。GPT-4やGPT-4ターボに比べて、驚くべき効率の向上でした。そしてまだまだ向上の余地があります。

L: ChatGPTは世界を変えたのではなく、世界に対する人々の期待を変えただけだと言っていましたね。

S: そうですね。ChatGPTが生産性を本当に高めたなどの証拠は、どの経済指標を見ても見つからないと思います。

L: カスタマーサポートではどうでしょうか?

S: いくつかの分野ではそうかもしれません。でも世界のGDPを見ても、ChatGPTのリリースがいつだったかは、おそらく検出できないでしょう。

L: GDPの変動を検出できる時点はあると思いますか?

S: どのモデルが変化をもたらしたかは特定できないかもしれませんが、数十年後にグラフを見れば、何かが変わったことが分かるでしょう。

L: 今後12ヶ月で最も有望だと思うアプリケーションや分野はありますか?

S: 自分たちのやっていることに偏っているかもしれませんが、コーディングは本当に大きいと思います。

L: The Bitter Lessonに関連して、最近、特定の目的のために特定のデータで訓練された深く特化したモデルと、真の推論が可能な汎用モデルの違いについて話していましたね。

S: 重要になるのは汎用モデルだと思います。

L: そこで最も重要なことは何だと思いますか? 非常に狭い範囲のデータセットとそれに関連するすべての統合に特化している人のことを考えると。

S: モデルが汎用的な推論ができるなら、新しいことを理解できるなら、新しい種類のデータを扱う必要があれば、それを与えれば処理できます。でも逆はできません。特化したモデルをいくつか組み合わせても、汎用的な推論はできないと思います。

L: そうなると、コード固有のモデルの影響は...

S: 言い方を変えると、最も重要なのは真の推論能力を見極めることだと思います。そうすれば、様々なことに使えるようになります。

L: 2年後、人間とAIの主なコミュニケーション手段は何だと思いますか?

S: 自然言語はかなり良さそうですね。人間とAIが一緒に使えるような未来を設計すべきだというアイデアに興味があります。人型ロボットの方が他の形のロボットよりも興味があるのは、今の世界は人間に合わせて設計されていて、それがより効率的な何かに再構成されるのは望ましくないと思うからです。AIと人間に最適化された言語で話すというアイデアが好きです。AIどうしでもそのように話すのかもしれません。でもこれは興味深い方向性だと思います。

L: 最近、モデルは最終的に時間とともにコモディティ化されるかもしれないが、最も重要なのは各個人へのモデルのパーソナライズかもしれないと言っていましたね。

S: そうですね。

L: それで合っていますか?

S: これについては確信はありませんが、もっともらしく思えます。

L: パーソナライズを超えて、エンドユーザーのために最終的に勝つのは、通常のビジネスUIと使いやすさだと思いますか?

S: それらは間違いなく重要になりますし、いつもそうです。何らかの市場やネットワーク効果が重要になるようなことも想像できます。エージェント同士のコミュニケーションを望むとか、アプリストアには異なる企業があるとか。でも基本的にはビジネスのルールが一般的に適用されると思います。新しい技術が出てくると、それが当てはまらないと思いがちですが、それはいつも偽ニュースで、普通は偽ニュースです。従来の価値創造の方法はすべて、ここでも重要になるでしょう。

S: オープンソースのモデルがベンチマークに追いついたりするのを見ると、どう思いますか?

L: それは素晴らしいことだと思います。他の多くの技術と同様に、オープンソースにも、ホスティングされたモデルにも、それぞれの立ち位置があるでしょう。それで問題ありません。

L: よかったです。具体的なことは聞きませんが、ファブへの投資を促進するために大規模な資金調達を検討しているという報道がありました。ウォールストリートジャーナルが信頼できる情報源だったと思います。半導体業界のTSMCとNVIDIAは、AI インフラへの期待に応えるために、かなり積極的に増強しています。最近、世界にはもっとAIインフラが必要だと言っていましたが、TSMCとNVIDIAが現在提供しているよりもはるかに多くのAIインフラが必要だと思わせるような需要の面で見えているものはありますか?

S: まず第一に、現在のシステムを提供するためのコストを大幅に下げる方法を見つけられると確信しています。また、そうすれば需要が大幅に増えると確信しています。第三に、より大規模で優れたシステムを構築することで、さらに需要が増えると確信しています。私たちは皆、知性があまりにも安価で豊富で、人々がそれをあらゆることに使い、それを使いたいかどうかさえ考えなくなるような世界を望むべきです。メールをすべて読んで返信してくれるのか、がんを治してくれるのかなんて考えなくていい。もちろん、がんを治すことを選ぶでしょう。でも両方してほしいと思うはずです。すべての人がそれを持てるだけの十分な量があることを確認したいのです。

L: ここであなた自身の個人的な取り組みについてコメントする必要はありませんが、もしよければ教えてください。HumaneやLimitlessなどの物理的デバイスアシスタントは、どこを間違えていると思いますか? あるいは、ユーザーの要望にはまだ応えられていないと思う部分はどこでしょうか?

S: まだ初期段階だと思います。私は多くのタイプのコンピューティングの早期採用者でした。大学1年生の時に、Compaq TC1000を持っていて、とても気に入っていました。それはiPadとはかけ離れていましたが、方向性は正しかったのです。その後、Treoを手に入れました。私はかっこよくない大学生で、Palm Treoを持っていたのは流行ではありませんでした。それはiPhoneとはかけ離れていましたが、最終的にはそこにたどり着きました。これらのものは、非常に有望な方向性を感じさせますが、いくつかの反復が必要でしょう。

L: 最近、GPT-4の上に構築されている多くのビジネスが、将来のGPTによって一掃されるだろうと言っていましたね。まず、その点について詳しく説明してもらえますか? 二つ目に、GPTの進歩に耐えられるAIファーストのビジネスの特徴は何だと思いますか?

S: 私が見つけた唯一のフレームワークは、次のモデルが本当に優れているかどうかに賭けるビジネスを構築するか、それが起こることを前提とし、それが起こることで恩恵を受けるモデルを構築するかのどちらかだということです。GPT-4の能力をちょっと超えていて、何とか機能させるために一つのユースケースに多くの労力を注いでいるとします。そしてそれがようやく機能するようになったとしても、GPT-5が登場して、それとその他のすべてのことを本当にうまくこなしてしまったら、その一つのことを何とか可能にするために注いだ努力が無駄になってしまいます。でも、全体的にまあまあ機能していて、人々がそれを使う用途を見つけていたけれど、この一つのことを可能にするためにたくさんの労力をかけなかったとしたら、GPT-5かなんと呼ぶにしろ、それが登場してすべてが格段に良くなったら、全体的に恩恵を受けることができるのです。

提案としては、ほとんどの場合、AIビジネスを構築しているのではなく、ビジネスを構築しているのであり、AIはその中で使う技術の一つだということです。App Storeの初期には、何か非常に明らかな隙間を埋めるようなものがたくさんありましたが、最終的にはAppleがそれを修正し、App Storeから懐中電灯アプリを必要としなくなりました。それはOSの一部になったのです。それは起こるべくして起こったことでした。一方で、Uberのようなものは、スマートフォンによって可能になりましたが、実際には非常に守りやすい長期的なビジネスを構築したのだと思います。後者のカテゴリーを目指すべきだと思います。

L: これに当てはまる、AIを活用している既存のビジネスはたくさん思いつきます。Uberの例のように、目新しい概念の種類で、具体的な企業であれば教えてください。あるいは、おもちゃでも、面白いと思うものでも構いません。そのようにして可能になったと思うものはありますか?

S: 実は、多くの場合、新しい企業に賭けるでしょう。よく使われる例は、AIドクターやAI診断士を作ろうとすることです。メイヨークリニックなどがやるだろうから、ここでスタートアップをやりたくないと言う人がいます。でも、そういったことをするのは新しい企業だと思います。

L: このような混乱に備えるために、CEO以外に何かアドバイスはありますか?

S: インテリジェンス・アズ・ア・サービスは毎年良くなり、安くなると考えるべきだと思います。そして、それは必要ですが、あなたが勝つためには十分ではありません。この実装に何年もかける大企業には勝てるかもしれませんが、注意を払っている他のスタートアップも同じことをするでしょう。だからこそ、ビジネスの長期的な守りやすさを見極める必要があるのです。競争の場はかなり開かれていて、信じられないような新しいことができますが、AIを使えるからといって、価値を創造するための努力を怠ってはいけません。より多くの方法でそれができるようになったのです。

L: 今日、ニッチだったり存在しなかったりするような職種や職務が、AIのおかげで5年後にはメインストリームになっていると想像できるものはありますか?

S: いい質問ですね。今までに聞いたことがないです。いつも聞かれるのは、どんな仕事がなくなるかということです。新しい仕事の方が面白い質問ですね。ちょっと考えさせてください。まあ、あまり面白くなさそうだったり、そんなに大きくなさそうなことはたくさん思いつきますが、1億人とか5000万人がやるようなことは何だろうと考えているんです。新しい種類のアート、エンターテインメント、人と人とのつながりといった広いカテゴリーですね。その職種の名前は分かりませんが、5年以内にそこまでいくかどうかは分かりませんが、対面での素晴らしい体験には価値があると思います。何と呼ぶかは分かりませんが、新しい巨大カテゴリーになり得ると思います。

L: OpenAIの直近の公開された評価額は900億ドルくらいでしたね。AGI以外で、OpenAIが1兆ドル企業になるための節目になると思うことを1、2個挙げるとしたら何ですか?

S: 今のペースで技術を改善し続け、それを使って良い製品を作り続け、収益が今のように伸び続ければ、具体的な数字は分かりませんが、大丈夫だと思います。

L: 今日のビジネスの収益化モデルは、1兆ドルの株式価値を生み出すモデルだと思いますか? ChatGPTのサブスクリプションモデルは本当にうまくいっていますよね。

S: そうですね、驚くほどうまくいっています。そこまでうまくいくとは思っていませんでしたが、良いですね。

L: AGI以降、その言葉が実際に何を意味するにしろ、収益化モデルについてAGIに尋ねることができるようになると思いますか? それは違うかもしれませんが。

S: そうですね、できるようになるでしょう。

L: 11月に、既存のOpenAIの構造には望ましくないところがあったことが明らかになったと思います。もう一度詳しく説明する必要はないと思いますが、あなたはそれについて十分に語っています。変更を加えていくと言っていましたが、今後の適切な構造はどのようなものだと思いますか?

S: そろそろそれについて話す準備ができていると思います。あらゆる会話やブレインストーミングに一生懸命取り組んできました。たぶん今年中には話せると思います。今年の暦年の間に。

L: 最初に教えてくださいね。

S: そうですね、考えておきます。

L: LarryとBrett TaylorがBattlefieldで取締役に昇進した時、私の電話は鳴りませんでしたが。AIに関する先入観で面白いと思うのは、収益化モデルなどについてのあなたの指摘です。私たちは皆、あなたがそれについて話すのを聞いたことがあると思います。手作業が明らかに最初で、その後にホワイトカラー、そしてクリエイティブと続くと。明らかに、ある意味では逆になることが証明されています。他に直感に反することで、こうだと思っていたけど実際には真逆だったということはありますか?

S: それは間違いなく私にとって最大のサプライズでした。あなたが言及したことです。他にも、法律の仕事がこんなに早く上手くいくとは思っていませんでした。それは非常に正確で複雑なことだと思っていたからです。でも、大きなのは間違いなく、肉体労働、認知的労働、創造的労働の観察ですね。

L: AGIという言葉を嫌う理由について聞いたことがない人のために、その点について詳しく説明してもらえますか?

S: もはやそれが一時点だとは思わないからです。明らかに、会社を始めるときには多くの素朴な考えを持っていました。特にこのように動きの激しい分野ではそうです。でも、私が始めたときの素朴な考えは、AGIがない状態からある状態に移行する瞬間があるということでした。それは本当の不連続点になるはずでした。まだ本当の不連続点になる可能性はあると思いますが、全体としては、今後何十年にもわたって年々進歩のペースが持続するような、連続的な指数関数的な曲線のように見えると思います。あなたと私は、おそらく「さあ、これがAGIだ」というような月や年について意見が一致しないでしょう。他のテストを考案することもできますが、それでさえ思ったよりも難しいのです。GPT-4は間違いなく、ほとんどの人がAGIと呼ぶような閾値を超えていませんし、次の大きなモデルでもそうだとは思いません。でも、もしかしたらあと1つか2つ、あるいは少数のアイデアと、もう少しの規模があれば、これは今や何か違うものになるかもしれないと想像できます。それに注意を払い続けることが重要だと思います。

L: 現代版のチューリングテストのようなもの、バートレットテストと呼んでもいいですが、それを超えたら...

S: モデルがOpenAIの全員を合わせたよりも良い研究ができるようになったら、それは何か非常に重要なことのように感じられます。それは不連続点になるべきかもしれません。それは近いように感じますか? そうは思いませんが、可能性を排除するつもりはありません。

L: AGIに到達するための最大の障害は何だと思いますか? スケーリングの法則は、現在、そして今後数年間は有効だと思われるとのことですが。

S: そうですね、最大の障害は新しい研究だと思います。インターネットソフトウェアからAIへの移行で学ばなければならなかったことの一つは、研究はエンジニアリングと同じスケジュールでは機能しないということです。通常、それは時間がかかることを意味しますが、時には誰もが予想できないほど非常に速く機能することを意味します。

L: それは進歩が直線的ではないということですか?

S: それを詳しく説明する最良の方法は、歴史的な例だと思います。数字は間違っているかもしれませんが...

L: 誰もあなたを訂正しようとはしないでしょう。

S: 誰かはするでしょうね。中性子は1900年代初頭に理論化され、1910年代か1920年代に初めて検出され、1930年代に原子爆弾になるものの研究が始まり、1940年代に実現しました。中性子のようなものがあるというアイデアさえなかったところから、原子爆弾を作って物理学に関する私たちの直感をすべて打ち破るまで、それは信じられないほど短い時間です。純粋科学ほどではない、ライト兄弟のような他の例もあります。これも数字は間違っているかもしれませんが、1906年に50年先だと思っていた飛行機を、1908年に実現させたというものです。そういったことが科学と工学の歴史の中で何度も起きています。一方で、理論化されたけれど実現しなかったり、何十年も何世紀も思ったよりも長くかかったりすることもたくさんあります。でも時には本当に速く進むこともあるのです。

L: 解釈可能性については、この道のりのどこにいるのでしょうか? そして、AIにとって長期的にはどれほど重要なのでしょうか?

S: 解釈可能性にはいくつかの種類があります。ネットワークのすべての機械的な層で何が起こっているのかを理解しているのか、という意味での解釈可能性と、出力を見て論理的な欠陥があると言えるのか、というものがあります。OpenAIやその他の場所で行われているこの方向での研究には興奮しています。より広い分野としての解釈可能性は有望でエキサイティングだと思います。

L: あなたを問い詰めるつもりはありませんが、何か発表する準備ができたら素晴らしい発表をしてくれるでしょう。でも、企業内、特に何かの主流となる採用のためには、それが必要条件になると思いますか?

S: GPT-4は、この時点ではかなりそうなっていますね。そうですね、その通りです。

L: 人々があなたについて疑わしく思っていることや、非難しているかもしれないことが、いくつかあると思います。個人的に好きではない質問は、イーロン、株式、11月の取締役会構造の3つだと思います。その中で一番嫌いなのはどれですか?

S: どれも嫌いではありませんが、どれについても新しく言うことはありません。

L: 株式については、十分すぎるほど答えているので、具体的に聞くつもりはありません。でも、人々はまだ十分なお金があるという答えが好きではないようですね。

S: そうですね。もし1兆ドル稼いでそれを寄付したら、期待に沿うというか、普通のやり方になるんでしょうね。

L: 比較的に。

S: いや、つまり、大金を稼ぐ人のほとんどが...

L: そうですね。AGIを追求する上でのあなたの動機は何ですか? 株式以外で、多くの人は、高い志を持っていても、それに対する報酬があるという事実に安心していると思います。ある意味、今日、毎日出勤するときの動機は何ですか? 何から最も充実感を得ていますか?

S: 私はいつも人々に言っています。今は他の人生の引き換えや犠牲を多く払う覚悟がありますが、それは、これが私がこれまでに触れた中で最もエキサイティングで、最も重要で、最高のことだと思うからです。信じられない時代です。これが永遠に続かないことを嬉しく思います。いつかは農場で隠居して、これを懐かしく思い出すでしょうが、ああ、あれはストレスの多い長い日々だったなと。でも、信じられないほどクールでもあります。こんなことが自分に起きているなんて信じられません。これは本当に素晴らしいことです。

L: 過去数年の間で、特にシュールだと感じた瞬間はありましたか? 自分の街で外出できないという例に戻るようですが。ビル・ゲイツとポッドキャストをやったことがありますね。あなたの電話帳を見れば、きっと興味深い人がたくさん載っているでしょう。

S: ほぼ毎日、何かがあります。もし少しでも精神的な余裕があれば、これは狂ってるなと思うでしょう。

L: 水の中の魚のようですね。

S: そうですね。11月のことがあった後、次の日か2日後に、世界の主要な大統領や首相から10〜20通くらいのメッセージが来ました。それが変だったのではありません。変だったのは、それが起きて、私が「ありがとう」と返信していたことです。それが普通に感じられたのです。そして、感謝祭の前の水曜日に、すべてが火曜日の夜に解決しました。

L: 私とのポッドキャストをキャンセルしましたよね。

S: ポッドキャストをキャンセルしてすみません。普段は物事をキャンセルしないんですが。とにかく、感謝祭の前の水曜日に、アリーと私はナパに車で向かいました。途中でダイナーに寄って、とてもおいしかったです。運転中、数日間何も食べていなかったことに気づきました。そして突然、普通に戻ったのです。週末にナパに向かって、何かをしに行くのが普通だったのです。ダイナーに行って、4つのメインディッシュを注文しました。揚げ物ばかりの重いものを。ミルクシェイクも2つ、私だけで。そこに座って食べていると、とても満足でした。

その時、ある国の大統領からまたメッセージが来て、「ああ、ごめんなさい、これは素晴らしいですね」と言っていました。そしてそれで、ああ、そうだ、こんなにたくさんの人からメッセージが来ていたんだと気づいたのです。それが変じゃなかったんです。変だったのは、その最中にそれが起きて、それがとても変な経験のはずだったのに、そうではなかったということです。だから、それが印象に残っています。

L: そうですね、面白いですね。

S: 私の教訓は、人間は何にでも適応できるということです。良いことにも悪いことにも、とても速く新しい普通になれるのです。この数年で、それを何度も学びました。でも、人類について非常に驚くべきことを物語っていると思います。私たちにとって良いことであり、この大きな変革を前にして良いことなのです。

L: 9.11の後のことを覚えています。あなたがどこにいたかは正確には覚えていないと思いますが、私はニュージャージー州のサミットにいました。私たちの町では、何十人もの人が亡くなりました。テロ事件の後、町の人々がどれだけ団結したかは、とてもノーマルに感じられました。今、イスラエルに友人がいますが、彼らと話をすると、「いや、普通だよ。戦争が起きているんだから、シュールに感じるはずだよ」と言われます。でも彼らは「まあ、何をするんだい? 食事を取りに行って、友達と話をするんだよ」と言います。心理的な影響を与えるようなことが起きても、結局のところ、私たちは食事を取りに行き、友達と話をしなければならないのです。そういうことがどれだけ起こり得るのか、本当に驚くべきことです。

S: 本当に、心からそう思います。それが私の大きな驚きの教訓でした。本当に感じるほどに。

L: モデルがどんどん賢くなっていくことを考えると、私たちが以前は考えていた能力のより多くをモデルが行うようになるにつれて、人間らしさが残るのは何だと思いますか?

S: 何年も先のことですが、人間は他の人間を気にかけ続けると思います。インターネットを少し読んでいて、みんな「ChatGPTに恋をするようになるよ」とか、「ChatGPTガールフレンドになるよ」とか言っていました。でもそうはならないと思います。長期的には、人間は他の人間を気にかけるようにできていると思います。大小様々な意味で。つまり、お互いに夢中になるということです。あなたは私についての陰謀論をたくさん聞くでしょうが、AIについての陰謀論はあまり気にしないかもしれません。ロボット同士がサッカーをするのを見ても、それが私たちの主な趣味にはならないと思います。

L: OpenAIという会社自体を経営するにあたって、YCでビジネスを運営するためのルールやフレームワークをたくさん作りましたが、そのうちのいくつかを破っていますね。

S: いくつかは。

L: 幹部の中で、消費者向けインターネット企業やB2Bソフトウェア企業などを始めていたら雇っていたであろう人とは違うタイプの人を雇っているのでしょうか?

S: 研究者は、大抵の場合、製品エンジニアとは非常に異なります。

L: BradやMirrorなどの幹部は、研究者とは違いますが、OpenAIは異なるタイプの幹部を雇っているのでしょうか? それとも違う特性を求めて雇っているのでしょうか?

S: 私は主に、幹部を外部から雇うことはあまりありません。時々そうすることもありますが、一般的には内部昇進を信じています。内部昇進だけだと単一文化を強化してしまう可能性があるので、それはおそらく間違いでしょう。新しい非常に優秀な人を連れてくることも必要だと思います。でも、ここでは主に自家製の人材を育てています。私たちがやっていることが他の場所でやっていることとはかなり違うことを考えると、それはプラスだと思います。

L: OpenAIを運営する上で、決定した時に最も重要だと感じた決定はありますか? そしてどのようにしてその決定をしたのでしょうか?

S: 一つに絞るのは難しいですが、AGIを秘密裏に構築して一度に世界に公開するのではなく、反復的な展開をすることを決めたのは、とても重要な決定でした。それまでは支配的な考え方であり、他の人々の計画でもありました。当時はとても重要な決定だと感じました。

L: もし別の会社が...

S: 言語モデルに賭けることは重要な決定であり、当時は重要だと感じました。

L: 実は、言語モデルに賭けることになった経緯を知りません。それはどのようにして始まったのでしょうか?

S: 他のプロジェクトをやっていました。ロボットのことやビデオゲームのこと。そして、ある一人の人間が言語モデリングを見始めた、非常に小さな取り組みがありました。イリヤは言語モデルの一般的な方向性を本当に信じていました。GPT-1をやり、GPT-2をやり、スケーリング則の研究を始め、GPT-3をスケールアップし、そしてこれをやることに大きく賭けたのです。これらのことは全て、今振り返ればとても明白に見えますが、当時はそうは感じられませんでした。

L: 最近言及していたもう一つのことは、自分自身のレプリケーションと最もスマートな従業員の2つのアプローチがあるということでした。

S: ああ、AI自体ではなく、AIをどのように使いたいかということですね。

L: あなたが言った時には微妙な違いがありましたが、それを説明できますか? かなり深遠な区別のように思えたからです。少なくともサムはAIのユースケースの未来についてどのように考えているのか。明らかに私は誤解していたので、その点をもう一度説明してもらえますか?

S: 将来、5年後にGがあなたにテキストメッセージを送った時、それがあなたなのか、あなたのAIアシスタントなのかを明確にしたいと思うでしょう。そして、それがあなたのAIアシスタントなら、メッセージをまとめて、後で返事をもらえるでしょう。あるいは、人間のアシスタントにお願いするようなことが簡単にできるなら、構いません。そういうものを分けておくことに価値があると思います。つまり、AIがサムの奇妙な延長線上にあるわけではなく、サムなのかサムのAIゴーストなのか分からないけど、それでいいんだ、それは同じものなんだ、合体した存在なんだ、というわけではないのです。私はそれを自分自身にも望んでいます。このものが自分の奇妙な延長線上にあるとは感じたくないのです。それは、私がバリアを越えてコミュニケーションできる別の存在なのです。

L: 音楽やクリエイティブな分野で、DrakeやTaylor Swiftのオーディオを簡単に再現できるようになっています。おそらく、XYZの人物のクリエイティブな作品は実際にはこれですよ、というようなバリデーションや、ある種の中央集権化が必要になるでしょう。個人レベルでも同じようなものが必要になるでしょうね。

S: そうですね。でもそれは、OpenAIのことを考えるのと同じように、私は違う人たちがいて、彼らに何かをするように頼んだり、彼らが私に何かをするように頼んだりするのです。でも、それは単一の境界線ではありません。私たちが皆慣れ親しんでいる方法だと思います。


L:それはどういう意味ですか?個人が自分の仕事をすることの分散化に関連していますか?

S:いや、それだけではなく、私が言いたかったのは、私のパーソナルAIがどのような抽象概念になるのかということです。つまり、それを単に私自身と考えるのか、私のコンピュータを引き継いで最善を尽くし、私の代わりにメッセージに応答して、少しずつ私の操作を引き継いで私自身になるのか、あるいは優れた同僚のように考え、私が「これをやってもらえますか」と頼んで、完了したら報告してもらうという関係を持つのかということです。私はそれを自分自身とは別の存在として考えています。

L: 教育システムについて考えると、2030年や2035年の大学卒業生について考えると、大学の教育システムで具体的にどのような変更がなされるべきだと思いますか? 私たちが持っている未来に備えるために。

S: 最も大きなことは、人々がツールを使うことを許可されるだけでなく、要求されるべきだと思います。昔ながらのやり方で何かをさせたい場合もあるでしょう。理解を助けるためにね。数学の授業で、電卓を使ってはいけないことがあったのを覚えています。でも全体的には、現実の生活では電卓を使っていいのです。だから電卓について理解する必要がありますが、電卓を使いこなせるようにもならなければいけません。もし数学の授業で一度も電卓を使えなかったら、後で仕事をするのに不利になるでしょう。OpenAIの研究者が電卓を使えなかったら、OpenAIは少なくともコンピューター上では実現しなかったでしょう。私たちは人々に電卓やコンピューターを使わないように教えようとはしていません。だからAIも使わないように教えるべきではないと思います。それは将来、価値ある仕事をする上で重要な部分になるでしょうから。

L: 最後の質問です。AGIとその先を計画する上で、あなたは最初のAGIは知性の連続体上の一点に過ぎないだろうと書きました。これについては先ほど話しましたね。過去10年間で見てきた進歩のペースが、長期間にわたって持続する可能性があると考えています。個人的に立ち止まって、未来がどのように見えるかを処理したり、想像したりすることはありますか? それとも、考えるには抽象的すぎますか?

S: 常に考えています。空飛ぶ車やスター・ウォーズの未来都市のように想像しているわけではありませんが、一人の人間が数百人、数千人の上手くまとまった人々の仕事ができるようになったら何を意味するのか、すべての科学を発見できるようになったらどんな感じがするのか、まさにそんな感じがすると思います。

L: かなりクールですね。

S: そうですね。

L: これを行ってくれてありがとうございました。

S: ありがとうございました。

L: OpenAIのCEO兼共同創設者であるSam Altmanとの対談をお楽しみいただきありがとうございました。この対談を楽しんでいただけたなら、ぜひいいねとサブスクライブをお願いします。面白いと思った人にシェアしてください。来週は、重要なテクノロジー企業の別の創業者兼CEOと、もう一つのエキサイティングなエピソードをお届けします。皆さん、聴いていただきありがとうございました。良い一週間をお過ごしください。

この記事が気に入ったらサポートをしてみませんか?