OpenAIが、科学、チャットアプリ、医療など様々な業界向けにAI技術を提供し、ビジネスの革新を目指しています。中心には、GPTやDALL·Eなどの基盤AIモデルがあり、これを用いて企業や開発者は特定のニーズに合わせたアプリやサービスを開発できます。最近では、外部の企業がOpenAIの技術を活用しやすくなり、カスタムモデルプログラムの拡張やファインチューニングツールが提供されています。例えば、IndeedはOpenAIの技術を利用して仕事推薦の精度を向上させ、コストを削減しました。このような動きは、将来的に企業が自社に特化したAIを活用することが一般的になることを示しています。OpenAIの取り組みにより、AI技術のカスタマイズが新たな標準となりつつあり、ビジネスのあり方に革命をもたらしています。
公開日:2024年4月5日
※動画を再生してから読むのがオススメです。
サム・アルトマンとOpenAIのチームはしばらく静かでした。
もし許していただけるなら、嵐の前の静けさとでも言いましょう。
しかし、ここ数日で、次に何が来るかについて少し垣間見ることができるようになりました。
彼らが何を考えているのか見てみましょう。
興味深いことに、これは彼らの元々の目標、AIの基礎レイヤーであるという元の声明された使命に戻るようです。
ここで、彼らがそれを意味したと思われる素晴らしい例があります。
ここに大きなブロックがあると想像してください。
それがレイヤー1です。
それが基礎レイヤーAIです。
それがGPTです。
それがSoraです。
それがDALL·Eです。
そしてその上に、このAIの基盤を活用して特定の機能を構築するためのさまざまな企業、さまざまなアプリ、さまざまなソフトウェアを構築しています。
例えば、科学、チャットアプリケーション、医療AIなどです。
ChatGPTが登場すると、OpenAIはこれが将来の計画の一環だと述べました。
彼らは基盤となり、人々がそれに上乗せして構築できると言いました。
たくさんの人々やアプリがそれに上乗せして構築しました。
しかし、その後OpenAIは、「私は死神だ」と言って、それらすべてを自分たちのバージョンやアプリケーションを構築することで排除しました。
これはおそらく100%公平ではないでしょう、なぜならこれらの多くのスタートアップは、OpenAIが欠けている部分を埋める技術を構築しようとしていました。
例えば、ささやきのようなもの、コードインタプリターに似たもの、それを呼ばれる高度なデータ分析などがあります。
言い換えると、これらの多くのスタートアップは、OpenAI自体がおそらく進行中だった明らかなアプリを構築していたが、OpenAIによって転覆された、基盤となるレイヤーによって。
しかし、今では状況が変わったようです。
OpenAIは、今や全ての要素が整っているようで、Sora、ささやき、音声エンジン、高度なデータ分析、DALL·E(修復と編集を含む)などを持っています。
まるで、基盤となるレイヤーの異なる部分をすべて構築して、その全機能を持っているかのようです。
ChatGPTとやり取りすることができます。
あなたの話し言葉を理解することができます。
あなたに話し返すことができます。
基盤となるレイヤーの多くは完成しています。
基盤となるレイヤーの欠けている部分を補う企業は全滅しています。
OpenAIは、基盤を持っているし、ベースレイヤーも持っているから、それに上に何かを構築してほしいと言っているようです。
私の意見ですが、ここ数日で出てきたいくつかの重要なニュースを見せて、この視点を支持すると思うものです。
これを見て、自分自身にこの質問をしてみてください。OpenAIは、レイヤー2のスタートアップがOpenAIのベースレイヤーの上に何かを構築するために赤いカーペットを敷いているのでしょうか。
さあ始めましょう。
今日のこの新機能の導入は、ファインチューニングAPIの改善とカスタムモデルプログラムの拡大を紹介しています。
開発者は、ファインチューニングに対するより多くの制御権を得て、OpenAIと新しい方法でカスタムモデルを構築する方法を得ます。
始まります。開発者がモデルのパフォーマンスを向上させるために使用できるさまざまな技術があり、レイテンシを減らし、精度を向上させ、コストを削減することを目指しています。
RAG、リトリーバル、拡張生成など、モデルの知識を拡張するかどうか。
基本的に、そのモデルを例として、Perplexityのような情報をインターネットで検索して、見つけたさまざまなリンクを返します。
そして、それらを要約します。
もしあなたがPDFを使ったチャットをしたことがある場合、PDFはあなたのデータベース、追加データ、追加情報です。
そのモデルは、答えをでっち上げる代わりに、そのPDFから情報を取得し、その情報を考慮してさまざまなカスタムモデル、微調整、新しいドメイン固有の知識を持つカスタムトレーニングされたモデルで回答します。そして、開発者が微調整により多くの制御を持つための新機能を提供しています。
そして、AIの専門家や研究者のチームと協力してカスタムモデルを構築するためのさらなる方法を導入しています。
そして、彼らは冗談を言っているわけではありません。
すぐに見るように、OpenAIの外のさまざまなスタートアップ企業と提携して、いくつかの非常に興味深い機能を提供しています。
これについては、この後で詳しく説明します。
彼らはAPI機能の微調整、あるいはAPIを使用してこれらのモデルを微調整することについて話し始めます。
馴染みのない人のために、微調整とは、GPT-4モデルをこのような何でもできる大きな塊と考えると、すべてをうまく行うわけではないかもしれません。
私たちができることは、たとえば、それをコーディングやカスタマーサービスに専念させたいと思った場合です。
私たちはこのモデルをカスタマーサービスを行うように微調整することができます。
お手紙を書くのが簡単だから、サポートと言います。
この大きなモデルを取り上げ、私たちの会社やビジネスに特有の質問に答えるために、サポートカスタマーサービスを素晴らしいものに微調整することができます。私たちが望むスタイルで質問に正しく答える方法をトレーニングします。
もちろん、このサポートモデルはほとんど全く新しいモデルになるので、他の多くの分野で悪化することが予想されますね。
それは微調整されたGPT-4です。
それはサポート用のカスタムモデルです。
そして、他のさまざまなことでかなり悪化する可能性があります。たとえば、もはやコーディングが得意ではなくなるかもしれません。
詩が下手になるかもしれませんが、サポートは得意になります。
再び、私たちの小さなデモンストレーション、この小さな表現ですね。
基本層、そうですね。
それは、GPT-4と言いましょう、そうですね。
それを取り出して、科学的なGPT-4や医学的なGPT-4に微調整します。
GPT-4がすでに持っているすべてのものが付属していますね?
それは言語を理解します。
それは推論できますね?
それは特定の知識を持っています。
それは特定のスキルを持っています。
私たちはそれを取って、この特定のタスクに形作っています。
そして、微調整のもう1つの大きな利点は、コストとレイテンシーを削減しながらより高品質な結果を得ることができることです。
たとえば、カスタマーサポートエージェントに必要なものだけを取り出しているので、この大きなGPTモデルにはまだ必要のない多くのものがあり、それらを置いていくことがあります。
このモデルは、より安価に運用でき、はるかに高速になる可能性があります。
お手本として、彼らは実際にはグローバルな仕事のマッチングと採用プラットフォームを提供し、求職者に個別の推薦を送りたいと考えていました。スキルや経験に基づいて関連する仕事を強調しました。
そして、彼らはGPT-3.5 Turboを微調整して、より高品質で正確な推薦を生成することができました。
彼らはトークンコストを80%削減することができました。そのため、トークンの数を削減する速度、つまりモデルを通過する最悪のトークンを80%削減することができました。これにより、求職者への推薦件数が1か月あたり100万未満から約2000万件にスケールアップすることができました。
ちなみに、ちょっとした余談ですが、このチャンネルでは、Apple、Microsoft、Meta、OpenAI、Google、DeepMindなどの企業からの多くの研究を取り上げています。
そして、ここでパターンを見始めているのですが、通常、研究論文が発表されるのは、その論文で話題になっていることが市場に出始める3〜6か月前だということです。
Microsoft ResearchのOrca 2論文は、小さな言語モデルを教えることが非常に効果的である理由を示していました。
Orca 2モデルは、他のすべてのモデル、つまり5〜10倍大きなモデルを含むすべてのモデルと同等かそれを上回る性能を発揮します。
特定のタスク向けに構築された小さな微調整モデルは、非常に効果的で、非常に高速で、非常に安価です。
私たちは、Appleのビジョンモデルに関する研究を取り上げました、と言えます。
数日前にこれを取り上げました。
80億のパラメータを持つこのモデルは、場合によってはGPT-4を上回り、他の場合には接近していますが、80億のパラメータは非常に小さなモデルです。
GPT-4は巨大で、1.7兆と推定されているか、それとも、それが人々の推測であると思われます。
おそらく、数兆の範囲にあるでしょう。
もし私が計算を正しく行ったならば、これはGPT-4のサイズの千分の1程度であり、特定のタスクにおいてそれに近づいています。
明らかにすべてのことには当てはまりませんが、特定のタスクにおいて、この微小なモデルはGPT-4と同じくらい優れています。
もし推測しなければならないとしたら、私は、小さくて高速なモデル、GPT-3.5 turboなどが、特定のドメインで非常に信じられないことを行うために微調整され、非常に安価で、非常に速くそれを行うのを見ることになるだろうと思います。
そして、これをビジネスのために構築する人々、その人々はお金を稼ぐことになるでしょう。
それが私の推測です。
そして、OpenAIはそれをより簡単にするためのサービスを構築しています。
彼らはいくつかの企業と協力する予定です。
おそらく、これは会社のパートナーシップであるOpenAIプラスになるでしょうが、今聞いている中には、この分野でビルダーや開発者である方の割合がいくつかいると思います。
つまり、これらのB2Bソリューションは、お金を稼ぎたいと考えているのであれば、非常に非常に利益を上げるアプローチのように思えます。
OpenAIは、開発者がさらに細かい調整作業を行うための新機能を導入しています。
ところで、以前にも言いましたが、最近言っていないと思うので、次の、たとえば5年から10年の間、お金をたくさん稼ぐ場所と、進歩がたくさん見られる場所の1つは、大規模言語モデルをすべてに詰め込むという考え方です。
つまり、任意のデジタルタスクを実行するために、おそらく、カスタムで微調整された大規模言語モデル、またはおそらくOrca 2のようなカスタムの小さなモデルを取り入れる解決策があるでしょう。ちなみに、Microsoftが親切にもオープンソース化したものを見ることができるので、彼らがそれをどのように構築したかがわかります。
そして、このようなものに適用してみてください。
実際、グローバルなジョブマッチング企業がどれだけの金額を使っていたか考えてみてください。
それらのカスタマイズされた個人用の設定がどれだけ重要か。
それが彼らのビジネスモデルにとってどれだけ重要か。
おそらく非常に重要で、おそらく高額だったでしょうね?
もしこのカスタムモデルを作成できれば、それによってコストが80%削減され、作業時間も80%短縮されるとしたら、1年間で彼らは何百万ドル節約できるでしょうか?
もちろん、そういうことをすると高額な料金を請求できるかもしれませんね。
そして、このようなことを知っている人材プールは大規模ではないと思います。
まあ、あの、私たちにはこのようなことに高度に熟練した多くの人々がいるとは疑っていません。
そして、すぐに、これがどのように適用されるかの例をお見せします。
しかし、OpenAIが導入している新機能はこちらです。
ある種のモデルチェックポイントが追加されています。
各トレーニングエポック中に、さまざまな再トレーニングの必要性を減らすために。
モデルの品質とパフォーマンスを比較するためのバージョンコントロール、並行してのPlayground UIのようなものです。
どうやら、誰かがストリートファイター2で2匹のレムを戦わせたそうで、それらを訓練して何をすべきか出力するようにしました。ファイアボール、キック、近づくなど、どちらの大規模言語モデルが最高のストリートファイター2プレイヤーかを見るためです。
それが私がここで想像していることの種類です。
それほどクールではないと思います。
そして、それは重みとバイアスから始まり、サードパーティープラットフォームとの統合もサポートしています。
それは実験を追跡し、モデルのパフォーマンスを評価することができるプラットフォームであり、モデルレジストリや追加のOpenAIがある場所です。
OpenAIは、2,000以上のプロジェクト、何百万もの実験、数百のチームメンバーを超えるすべてのモデルバージョンを追跡するために、重みとバイアスモデルを使用しています。
わずか数行のコードでモデル開発プロセスに対する可視性を持つことができます。
このモデルがトレーニングされたデータセットの正確なバージョンは何ですか?といった質問に答えることができます。
これらの一部をスキップします。
リンクを残します。
本当に興味がある場合、この分野にいる場合は、この記事を読むことを強くお勧めします。
しかし、私たちの残りの人々にとっては、大まかなポイントを素早く repaso する方が興味深いと思います。
そして、それから、これが具体的にどのように見えるかを掘り下げてみましょう。
この OpenAI の基本レイヤーとしての最終的な出力は何ですか?
まず第一に、彼らはアシスタントの fine-tuning と呼ばれるものについて話しています。
これは、OpenAI が専用のグループの研究者と協力して、特定のドメインのモデルをトレーニングするのを手伝うところです。
その後、私たちは数十の顧客と会って、彼らのカスタムモデルのニーズを評価し、パフォーマンスをさらに最大化するためにプログラムを進化させてきました。
そして、彼らはこれを公開しています。
次にそれを見てみましょう。
しかし、それらの具体的な例を見る前に、ここにこのブログ投稿の終わりがあります。OpenAI は、モデルのカスタマイズについて次に何が来るかを述べています。
彼らは、将来、ほとんどの組織が、自分たちの業界、ビジネス、またはユースケースに合わせて個別にカスタマイズされたモデルを開発すると信じています。
私はこれが非常に重要だと思います、特にお金のために取り組んでいる場合は。
このチャンネルを聞いている全員がビジネス中心の視点からアプローチしているわけではありません。
私たちの中には、研究やAIの個人的な利用に興味を持っている人もいます。仕事やキャリアでどのように活用できるのか。
私は、これが全ての人に当てはまるわけではないと理解していますが、それでもこれを理解することが非常に重要だと思います。なぜなら、これによって次の10年間に何が起こるかを垣間見ることができるからです。
ここが0%で、ここが100%です。これが線で、これらはAIを適用することで自動化されるか、大幅に改善されるか、または安くなる可能性があるすべてのタスクです。
生物学的なニューラルネット、つまり人間や従業員、またはコードを取ることから始めて、多くのものがコードで動いています。賢いソフトウェア開発者がキーボードで入力したものです。そしてそのコードは、会計や株式などの特定のタスクを完了するために実行されます。今日ではほとんどすべてのことですよね?
それほど昔ではないですが、これらのビジネスオペレーションのほとんどがニューラルネット上で実行されていませんでした。
ニューラルネット、それが私たちが話しているAIです。
それがChatGPT、それがSora、それが見ているすべてのAI音楽、すべてのAI画像です。
Googleの多くのものは機械学習です。広告配信プラットフォーム、コンテンツの推薦など、そのようなものをどのように運営しているか。
1つ数年前に戻ると、それらのものの数はおそらく1%だったでしょうね。
それは自動化されたニューラルネットワークか、あるいは何らかの方法で改善されたニューラルネットワークかもしれません。
それは1%だったんです。ChatGPTが登場して、ここ数年でそれらのものが出始めてから、おそらく、私たちは、知りませんが、1.5%、2%、わかりません。
これは実際にはひどく過大評価かもしれません。考えてみると、おそらく1%の一部です。次の10年以上で、それらのプロセスはすべてAI、ニューラルネットによって置き換えられるでしょう。
それらの中には、すべてを支配する1つのモデルもあるでしょう。
たとえば、一部の人々は、必要なタスクに対して単にChatGPTを使用するだけですね。
彼らは基本層を使うだけで、GPT-4のカスタムされていない、微調整されていないバージョンのようなものを使って質問します。
例えば、Perplexityについて興味深いことは、信じられないほどの成功と進歩を遂げているが、実際には基本層の上であまり多くのことをしていないということです。
既に存在するすべての言語モデルを取り入れています。
GPT-4 Turbo、Claude 3 Sonnet、Claude 3 Opus、Mistral Largeがあります。
お客様がプレイグラウンドで遊べるいくつかのものがあります。
そして、彼ら自身が微調整した高速なものがあります。
しかし、プロのユーザーにとっては、Claude 3やGPT-4などの基本レイヤーを使用しており、その上にたくさんのソフトウェアを追加しています。
GPT-4を取り、その上に少しPerplexity、少し検索エンジンを構築し、インターネットを検索し、回答を取得するためにたくさんのソフトウェアを追加しています。
このイメージでは、これがGPT-4で、これがPerplexityであり、たくさんのソフトウェアはそのPerplexity検索エンジンの機能です。
そして、それらは数十億ドルで評価されています。
ベゾスが投資しており、他の多くの人々も投資しています。
そして噂によると、Appleは彼らを買収する可能性について話し合っているとのことです。
これは、文字通り数十億ドルがこのだけで生み出される1つの例です。
しかし、これらの大規模言語モデルやビジョンモデル、音声モデル、画像生成モデルなど、すべてに向けて進んでいます。
おそらくそれらはあなたのサーモスタットに入ることになります。
おそらくそれらは食品写真に使われることになりますね?
ある種の向上ですね。
これはマグニフィックAIまたはマニフィックAIですよね?
そのアップスケーラーですね。
私はそれをチャンネルで紹介しました。
一部の人々はそれを使って食品写真を拡大するのに使いますね?
あのものを見てください。
ペストのすべての小さな粒子、すべての松の実が見えます。
おそらくこれはひび割れた黒胡椒ですね。
それは本当に美味しそうですね。
このバーガーを見てくださいよ。
例えば、彼らはこれを製品写真で使用する予定です。
左側はアップスケールされていない感じです。
右側はアップスケールされています。
多くの商品画像は、何らかの形でこれを使用することになるでしょう。
Google Shopping AIを取り上げましたが、彼らが新しく導入しているもので、AIを使用して製品のビジュアルを作成し、異なる環境に配置し、仮想的なモデルを作成することができるようになりますね。
それはあなたの製品をショーケースにするようなものです。
すべてを異なる言語に翻訳することができます。
基本的には、世界中の人々に自国語で販売する国際ストアを持つことができます。
製品の写真を撮る必要はありませんよね?
携帯電話を取り出してもいいですよ。
プロトタイプがあれば、それを撮影してAIが3D画像やバリエーションを作成し、モデルの手に持たせてくれます。
すぐにご覧いただく通り、OpenAIは法律分野の人々と提携して、彼らのためにカスタムトレーニングされたモデルを作成しています。健康保険を提供する別の会社、教育を提供する別の会社、コーディングのためのJetBrains、メールアシスタント、Salesforce、健康と体重管理、生産性、臨床試験、農家の収入を増やすための創造性、パーソナライズされたフィットネスと健康コーチング、コンテンツ作成。
ここに座って一日中ユースケースを挙げることができますが、この種のチャートが少しでもそれをよりよく表現していると思います。
現在、この技術の市場への浸透はほぼゼロに近い状況ですが、これはすべてを変えるでしょう。
コストを削減し、自動化を改善し、私たちが考えもしなかった新しいユースケースを作り出すでしょう。
誰もがそれを欲しがるでしょう。
誰もがそれを必要とするでしょう。
そして、次の5年、10年、20年の間に、ほぼゼロから徐々に100に近づくまで展開されていくでしょう。
モデルが導入されるたびに、人々はお金を支払いますが、このお金は問題にはなりません。
これらのサービスを売るのは難しくないでしょう、なぜならお金が節約されるからです。
物事を速くすることになります。
それはホットです。
それはセクシーです。
誰もが地元の小売店からそれを欲しがります。
それは地元のものです。
それは実店舗です。
それは、知らない、キルトを売ることです。
私は過去10年間、eコマースを行ってきました。
私は言っているんだ、頭の中で即座に思いつく限り、在庫管理から顧客サービス、マーケティングの多くの側面まで、カスタムトレーニングされたモデルを使えば、私よりも速く、より良く、より安くその仕事をこなせる場所がいくつかあると。
私が言いたいのは、お金が好きな人にとってこれは良い機会かもしれないということです。
それを開くと、利用可能なさまざまな技術を使ってカスタムモデルを構築するための組織が、すべてのサイズで、これが重要です。
これは、すべての規模の組織にとって大きな課題でもあるのです。なぜなら、病院や政府機関に販売するようなエンタープライズレベルのソフトウェアでは、構築が難しかったからです。
そうしたプロジェクトに取り組むには、膨大なチームが必要でした。
農家の市場に行って、アーティザンのパンを買うように、アーティザンソフトウェアなんて実際には存在しないんです。
それは本当においしいですね。
ソフトウェアでは、ある程度のスケールが必要でした。なぜなら、そのソフトウェアを構築する必要があったからです。
それがサービスする顧客の規模が大きいほど、そのソフトウェアの経済性が向上します。
ここは少し違います。
私たちは以前、Semi Analysisのブログ記事を取り上げました。
Semi Analysisは、半導体およびAI産業のニュースやイベントについて話し、分析を行うウェブサイトです。
ハードウェア、AIの背後にあるチップ、NVIDIAやTSMCなどのすべてのものです。
そして、私が魅了されたと思った小さな嘘をついていると言っています。
私たちはCとNを訓練していると言っています。つまり、CNNは畳み込みニューラルネットワークであり、データセンターの頻繁な衛星画像の加速を行い、すべての国のすべてのデータセンターへの追跡を拡大しています。
これは出版社のようなものです。
彼らはウェブサイトを持ち、ニュースレターを出し、レポートを販売し、非常に具体的なユースケースを持っています。
おそらく、その情報の多くは公開されていると思います。
彼らは衛星画像にアクセスできます。
彼らは、不動産記録や電力使用量を含む公開情報を使用して、1,100のデータセンターとその展開を追跡しています。
これは情報公開法の要求と衛星画像です。
彼らには、この場合にニューラルネット、CNNが役立つ非常に具体的なユースケースがあります。
これは大規模言語モデルではありません。
これは、トランスフォーマーベースのアーキテクチャでもありません。この場合は畳み込みニューラルネットワークです。
それは画像にラベルを付け、画像で訓練されています。
しかし、彼らは自分たちのカスタムAIモデルを構築して、これらのデータセンターの画像を分析し、衛星画像を見てそこで何が起こっているかを把握するのに役立てています。
彼らは同じことを、不動産記録や電力使用量についても行うかもしれませんね。
このすべてのもの。
世界中でこのようなことに興味を持つ他の人はどれくらいいるでしょうか?この特定のAIアクセラレータデータセンターの衛星画像を分析するために。
おそらくそれほど多くはありません。
たぶん数人。
重要なのは、すべてのサイズの組織が、より意味のある、具体的な影響を実現するために、パーソナライズされたモデルを開発できるように、非常に特定のユースケースのためにこれらのカスタム小規模AIモデルに大きな需要があるということです。
鍵は、ユースケースを明確に範囲を定め、評価システムを設計および実装し、適切な技術を選択し、モデルが最適なパフォーマンスに達するまでの時間をかけて反復する準備をすることです。
再び、これを行う人々はたくさんのお金を稼ぐことになります。
OpenAIでは、ほとんどの組織が、自己サービスの微調整APIを使用して迅速に意味のある結果を見ることができます。自分のモデルをより深く微調整する必要がある組織や、モデルに新しいドメイン固有の知識を注入する必要がある組織にとって。
私たちのカスタムモデルプログラムが役立ちます。
第一に、これは彼らが自社内でAIの専門家を持っている場所です。
二つは、OpenAIがそれらを開発するのを手伝う場所であり、おそらくそれを支払う余裕のある特定の用途を持つ大企業向けです。
しかし、もう1つ明らかなカテゴリがあると思いますが、それは企業の外にいる人々ですね?
企業に行って、「ねえ、私がこれを作成できますよ」と言って、ある金額を請求する第三者のような存在です。
コンサルタントまたはAIコンサルタント、自動化コンサルタント、何でも呼んでください。
そして、再び、今はほぼ0%に近づいており、100に向かっています。
初期の動き手はおそらく大きな利点を持つでしょう。
しかし、あなたは言っているかもしれませんが、「では、どのようなユースケースが理にかなっているのでしょうか?」
これはすべてただの宣伝なのでしょうか?
これはただのマーケティングの宣伝なのでしょうか?
人々は何もないことに興奮しすぎているのです。
お話変わりますが、デミ・ササビが興味深いことを言いましたね。
こちらがAI Breakfastが言うところによると、AIの景色は過大評価されています。
はい、過大評価されていますが、過小評価されています。
両方が真実であるのは面白いですが、それは理にかなっています。
たくさんの興奮がありますが、人々はここで起こっているすべての巨大さを完全に理解していません。
なぜなら、私たちが話しているのは、特定のビジネスケース向けのこれらの微調整されたモデルのごく一部だからです。
それはただのごくわずかな部分です。
しかし、これらのユースケースが何であるかを見てみましょう。
これらはOpenAIからの顧客のストーリーです。
これは、彼らが企業と協力して、特定のソリューションのためにカスタムで微調整されたモデルを作成するという話です。
これは、私にとって目を引くものです。
これはスーパーヒューマンです。
それが会社名です。
そして彼らはOpenAIと共に新しいメールの時代を紹介しています。
彼らは、ユーザーの時間を節約し、価値を生み出し、エンゲージメントを高める次世代のAIメール製品スイートを構築しています。
私たちはみんな、溢れかえる受信トレイに苦労してきたでしょう?
やるべきことが多すぎて、約束が多すぎて、会議の議事録が多すぎて、追いつくのが大変です。
スーパーヒューマンは、AIを使ってメールの書き方を手伝ったり、あなたの声で特定のアイデアを書き直したりすることで、それがどのように再構築されるかを想像しています。
お手本を読み上げるか、音声で言ってみるだけでもいいです。AIが空白を埋めてくれます。自分の声で書いて、すべてが正しいことを確認してください。
そしてそれを送信します。
私は到着した各メールの簡単な要約をします。
インスタントリプライ機能を使用すると、特定の文脈オプションから返信できます。テキストメッセージのように、返信するための小さなオプションがあるような感じです。
これは重要ですが、GPT、ChatGPTはこれらの多くを行うことができますが、ここではカスタムソリューションについて話しています。
それは誰かが座って、特定のユースケースにできるだけ良くするように努めているということです。
でも、まあ、私が言ったように魅力的ではないかもしれませんが、私の注意を引いたのはこちらです。
ここで言っているのは、では次は何かということですか?
Super Humanist Companyは、GPTベースのエージェントがメールを自動的にフィルタリング、トリアージ、返信し、会議や予約をスケジュールし、オンラインや現実世界で基本的なアクションを取ることができるようになる世界を想像しています。
再び、つまり、彼らはメールエージェントやスケジューリングエージェントを構築することについて話しています。
あなたのメールやカレンダーにアクセスできる、あなたのためのエグゼクティブアシスタントのようなもので、あなたが指示したことに基づいて管理し、最新の状況を把握することができます。
メールの受信トレイを開いて、最初のメール、2番目のメール、3番目のメールを読む、またはトリアージを行うという考え方は、今日は何に返信しなくてもいいかを考えるようなものです。
最も重要なことを見てみましょう。
あなた自身がその作業を脳と目とマウスを使って行うという考え方は、どうでしょうか。
5年後には、それは笑い話になるでしょう。
それは、家の暖房を10分ごとに手動で調整することと同じくらい古臭くなるでしょう。
今、それを使っている人はどれくらいいますか?
ほとんどゼロですよね。
世界中の人々のうち、そのようなものを使っているのは1%未満ですよね。
1%ではありません。確実にそれよりも少ないです。
世界全体を見ると、アメリカでさえも、それは少ないです。
5年後には、100%に近いか、そうでしょう?
どこかで100%に近づいています。次に、ハービーがいます。
それは法律関係者向けのカスタムトレーニングされたモデルです。
もちろん、弁護士とテクノロジーの組み合わせは、おかしいですよね?
「私は猫ではありません、裁判官さま」というビデオは、おそらく私が人生で見た中で最も面白いビデオです。
私が自分の笑い声を初めて聞いたとき、本当に大げさではありません。
もちろん、Chagmitを使う弁護士もいますが、彼らが何をしようとしていたのかはわかりませんが、基本的には彼らの主張を引用するために裁判例を捏造し、それが多くのトラブルを引き起こしました。
当時、AIを取り上げる無知な記者たちが、彼らの結論はAIが悪いと書いた記事を書きました。
実際のところ、彼らはGPT-4という基本モデルを使うべきではなかったのですね。
お客様が必要としていたのは、カスタムトレーニングされたもので、ある程度のアーキテクチャを持ち、いくつかの参照を持ち、検索を補完する生成を持っているものでしたね?
こちらでご覧の通り、これがトレーニングされたモデルです。
それはカスタムトレーニングされています。
そしてこちらでご覧の通り、それは判例の少しの引用を提供しています。
書いたすべてのことについて、少しの引用をして、この特定の判例を参照していることをサポートしていますね。
ストーン対ライターとか、そういう感じですね?
その主張をサポートするために。
それは推測しているわけではなく、幻覚を見ているわけでもなく、最善の方法を取っているわけでもありません。
それは実際のデータベースを使用して、それらの主張をサポートしています。
それは、それを試みることなくカスタムトレーニングされています。
それはできるだけ正確に答えるようにカスタムトレーニングされています。
それを行っている会社はハービーと呼ばれ、このモデルをテストするために最大の10つの法律事務所と協力しています。
そして、それらの法律事務所からの反応の強さに驚かれました。
97%の時間、弁護士たちはこのカスタムトレーニングされたモデルからの出力を好みました。それはより長く、より完全な回答でした。
質問が何を尋ねているかのニュアンスに入り、より関連性のある判例をカバーしました。
幻覚の軽減は、ハービーがカスタムモデルを構築する動機の1つでした。
再び、問題は「AI」という言葉ではありませんでした。
問題は、正しい答えを提供するために必要な正しいアーキテクチャを持っていなかったこと、それを使用している人々がそれが得意で、どこで失敗する可能性があるかを理解するための正しいトレーニングを受けていなかったことでした。
この全体の一部として、スタッフやそれを使用する人々にトレーニングを行い、その限界などを理解するようにすることも重要です。
ChadGPTに法的な問題を代表させるのは、驚くほど良い考えではありません。
彼らはこの全体の次にどこに進むと考えているのでしょうか?
今日のこれらのモデルの現在の能力に合わせて構築しないでください、と彼らは言っています。
なぜなら、そうすると何が起こるか覚えているでしょうか?
OpenAIが登場し、私は聾者だと言います。
そして、それはまるで誰もが収穫されるようですね。
モデルがどこに向かっているかに合わせて構築してください。
より複雑な問題のバージョンに取り組んで、より良いモデルのバージョンが出ても、それが副作用として解決されないようにしてください。
そして、ハービーは次に何に取り組んでいますか?
さて、どうしましょうか。
彼らの主な焦点の1つはエージェントです。
また、驚きですが。
AI自律エージェントは再び、次のフロンティアです。
ここには、まさにその次のステップとなる会社がさらにあります。
この場合は、複数のモデル呼び出しを1つの作業出力に組み合わせる方法です。
これにより、ユーザーエクスペリエンスが簡素化され、ユーザーが行う必要があるプロンプトエンジニアリングやタイピングの量が減少します。
もう1つは、AIを健康保険にもたらすOscarです。
OpenAIモデルとOscarを組み合わせることで、HIPAAコンプライアンスを確保し、生産性を2倍にし、自動化された文書作成や請求処理を行います。
医療従事者は、さまざまな医療ケアの会話を文書化する時間を40%削減しました。つまり、あなたの医師や看護師は、あなたのニーズを考える代わりに、その書類作業に座って、精神的エネルギーや身体的エネルギーを消耗しているのです。
何百万ドルもかけて彼らにそれをさせる代わりに、数ペニーでそれを処理するような大規模言語モデルを使うことを考えてみてください。
これにより、職業倦怠感が軽減され、看護師や臨床医がより高度な業務に集中することができます。
現在、弁護士や医師、看護師がこのような様々なツールを使って仕事を手伝っているのは何人くらいですか?
おそらく、ほとんどゼロですよね?
私たちは間違いなく1%にも満たないですよね?
1%のごくわずかな割合です。5年から10年後にはそれを利用する人はどれくらいいるでしょうか?
おそらく、100%にかなり近いでしょうね?
次に、彼らはクレームについても話しており、年末までに4万枚のチケットを自動化して精度を向上させると言っています。
では、これがクレームの見た目ですね?
この小さな魔法のボタンをクリックして、この問い合わせを手伝ってもらい、それを記入してくれると思います。
次に、彼らはAIフライホイールを作成すると言っています。
ビジネスにおけるフライホイールとは、ほとんど自己を築いてビジネスや習慣を改善し続ける仮想サイクルのようなものを指します。
ソーシャルネットワークのユーザーが多ければ多いほど、既存のユーザーにとっての価値が高まり、さらに多くのユーザーを引き寄せることになります。
これは、直接的なネットワーク効果の一種です。
彼らは、管理上のユースケースの簡素化の周辺をちょっとずついじるだけではなく、と言っていますね?
なぜなら、これが私たちが話していることなのですよね?
ただ、管理上のユースケースを簡素化するだけですよね?
重要なこと、非常に価値のあること、多くのお金を節約し、患者に焦点を合わせる必要がある医師や看護師の精神エネルギーを節約することになります。
それは重要であり、重要ですが、彼らはそれが始まりに過ぎないと言っています。
彼らは、次の3〜5年で医師を診察し、入院するコストを10分の1に引き下げることを目指しています。
お客様は、教育データを利用するためにGPT-4を使用しているZelmaでした。
お客様の成功事例は、体重減少を支援するアプリであるHealthifyです。
これは特定の人口を対象としています。
彼らはインドに本当に焦点を当てているようですし、具体的には伝統的なインド料理を分類しているようです。
特定のカスタム人口に焦点を当てることは、本当に良いアイデアかもしれません。
ここでは、SNAPが単一のインド料理について約80%の精度を達成したと言っていますね。
ここが少し面白くなるところです、もしビジネスの観点から見ているならば。
ビジネスがこのようなものを持つことがどれほど重要か、ということですか?
まあ、エンゲージメントの増加です。
微調整されたモデルやAIのおかげで、エンゲージメントが増加します。
人々はより興味を持ち、それをより多く使用する傾向があります。
これらの新しいモデルでは、ユーザーは50%頻繁にトラッキングします。
ユーザーは栄養やフィットネスのコーチングにより多く参加します。
クライアントはAIサポートのコーチと18%多く関わります。
そして、これは興味深いことですが、ユーザーの許可を得て、エージェントは食事を注文したり、ジムのクラスを予約したりすることさえできるようになります。
まだ見たことのない新しい産業が登場するでしょうが、数人が将来、私たちの生活をコントロールするエージェントが現れると言及し始めています。
それは厳しいようですね。
私たちの生活を運営するのに役立ちます。
彼らは私たちのアシスタントのようなものですが、情報やサービス、すべてにつながります。
彼らは特定の製品を推奨する予定ですね?
お客様のために食事を注文したり、ジムのクラスを予約したりする予定です。
多額のマーケティング費が個人に向けて使われているんですよね?
広告看板など、それはあなたに焦点を当てているんですよね?
人間であるあなたに何かを購入させようとしているんです。
時間の経過とともに、ますます多くのお金がAI、これらのエージェントに向けてマーケティングに投入されることになるでしょう。
それはどういう意味を持つのでしょうか?
まあ、最も単純な方法は、広告費を使って、これらのエージェントの背後にいる企業に、競合他社の製品よりもあなたの製品を推奨させることです。
それが最も明らかなものですが、検索エンジン最適化のようなものがあるかもしれませんね?
あなたのウェブページを最適化する方法、ウェブページにリンクしているリンクが、Google検索でどれだけ高く表示されるかを決定します。
SEOがあるかもしれませんが、自律型AIエージェントやAO向けに、自律型AIエージェントの最適化があるかもしれません。それがどのように展開されるか興味深いですね。
しかし、企業はお互いの競合他社よりも自律エージェントに自分たちを推薦させる方法を見つけるためにお金を使うことになるでしょう。
そんなことが起こるわけないでしょう。
その確率は100%です。
そして、汎用AIは私たちのようなソフトな第一世界の人々だけのためではありません。
デジタル・グリーンは、インドやケニアを含む国々で農民の収入を増やすためにOpenAIを使用しています。
これらの農民が新しい作物の栽培のベストプラクティスを教え合い、さまざまな地元の気象条件を共有できることが重要です。
それにはたくさんの問題がありますね。
彼らをつなげるだけでなく、さまざまな言語が話されていることもありますね。
彼らは地元の仕入先とつながり、市場や価格情報を提供する必要があります。
それは農民向けのEve onlineのようなもので、農民同士のトレーニングビデオを通じて平均24%の収入増加をもたらします。これは興味深いものでした。
昨日のビデオでこれに触れました。
政府やさまざまな資金力のある政府機関ができることは、大企業がやろうとしないかもしれないことがあります。国全体に役立つものを構築するためにリソースを活用できるという点で、そうですね。
たとえば、すべての国のデータベースとその文化的なAIをトレーニングすることができるということですね。
Microsoftはおそらくそれを行わないでしょう。
Googleはそうはしないでしょうが、DARPAのような組織がそれを検討する可能性はあります。
それが彼らの得意分野に正確に含まれているかどうかはわかりませんが、確かにAI分野の人々がこうしたことをできるようになるのは誰もが助けられることです。
インドの農業省は、知識ベース内のすべての文書を検証して正確性と信頼性を確認しています。
そして、GPT-4では、RAG、Retrieval Augmented Generationを使用して、そこから必要な情報、さまざまな作物研究、事実シートなどを引き出しています。
そして、この農家向けチャット、これらのエクステンションサービスのコストは、農家1人あたり35ドルから35セントに下がりました。
再び、膨大な進歩です。
そして、今この技術は、そのようなニーズを持つ世界の農家のほぼ0%に利用可能ですね。
そして、次の10年で、それが100%に近づくことを願っています。そして、これらの小さな顧客プロファイルが20あります。
それぞれが驚くべきアプリケーションを持っています。
ここには革命的なものでないユースケースはなく、それぞれが独自の方法でより多くの機能、より多くのユースケースを提供し、何かを行うコストを下げます。
専門家たちが、細かい詳細に縛られることなく、本来やるべきことに集中できるようになります。
この医療グループは、良い結果を得るために専門的な医療モデルが必要だと信じていました。
そして、彼らはGPT-4が高度に訓練された人間の専門家チームを上回る結果を出したことに驚いた。
私が言ったのではなく、彼らが言ったのです。彼らは驚いていました。
この動画のタイトルに「驚くべき」という言葉が入ると感じています。
あなたはどう思いますか?
私の直感は正しいでしょうか?
私の直感は正確でしょうか?
このページは下にリンクを残しておきます。
これはOpenAI.comです。
これは彼らのブログではなく、多くの人が馴染みがあると思います。
これは、顧客の物語です。
そして、私はこれらすべてのもので満たされたと思います。
ここにはたくさんのものがあります。
そして、ほとんどのものはフワフワしていません。
それらはただの無駄なものではありません。
それらは影響力があります。
そして、これらのカスタムトレーニングされたモデルがどれほど強力かを示しています。
ここで終わりにします。
私は自分のポイントを述べたと思います。
ソフトウェアが展開されていた頃、それは世界中で多くの富を生み出し、多くの変化をもたらしました。
彼らは「ソフトウェアが世界を飲み込んでいる」と言いました。
これはAIがその役割を果たしている次の段階です。
AIが世界を飲み込んでいるとは言わない方が良いかもしれません。
AIが世界を助けていると言うべきです。
私はそれがA16Zのモットーだと思います。
AIが世界を救うでしょう。
そして、AIに恐れを抱く多くの人々に同意します。ターミネーターになって私たちをペーパークリップに変えるなどのシナリオがあるかどうかはわかりません。
私は、これを私たちの生活をより簡単にする能力として見てほしいと思います。忙しい仕事を排除し、さまざまな医療手続きをよりよく理解するのを助け、メールの取り扱い、法的事案をよりよく理解するのを助け、教育データをよりアクセスしやすくし、より多くの人々が学校システムで行われている決定を理解できるようにします。
お手伝いするのは、少しでも農村コミュニティで苦労している人々です。
今、AIはここにあります。
今、それができることはこれです。
そして、次の5年、10年で、私たちがそれを適用できるあらゆる用途に0%から100%まで展開されるでしょう。
世界は変わるでしょう。
一部の人々はたくさんのお金を稼ぐでしょう。
そして、それはかなりの荒々しい乗り物になるでしょう。
私はあなたについてはわかりませんが、私は今起こることにかなり興奮しています。
私はAIが教育、ビジネス、音楽の創造、SunoAIやSoraなどの映画の創造にもたらす力に興奮しています。
それは人々により多くのことをする力を与えるでしょう。
そして、私たちは道のりにいくつかの障害があるでしょう。
どんな状況にいるとしても、興奮してください。
もしあなたがこのAI自動化コンサルタントになる立場にいて、人々がビジネスのさまざまな部分にニューラルネットワークを取り入れて、彼らのためにこれらの微調整されたカスタムモデルを作成するのを手助けすることができるなら、それはおそらく何人かにとっては百万長者になる産業になると思います。
もしあなたがビジネスを運営しているか、ビジネスでどこでそのようなものが役立つか考えたいのであれば、それがあなたがより多くを成し遂げたり、より少ない労力でより多くを成し遂げるのを手助けするかもしれない場所を考えてみてください。
そして、なぜ私が「長靴をはいた猫」のオオカミを何度も見せているのか疑問に思っているなら、正直言ってわかりません。
それはただ素晴らしいキャラクターなんです。
彼は私を笑わせるんです。
ちなみに、これが彼を演じている人物です。もし気づいていなかったら。
とにかく、私の名前はウェス・ロスです。ご視聴ありがとうございました。