見出し画像

リークが正しいと定評のジミー・アップル氏が5月9日10時のOpenAIイベント情報をリーク!

彼のリークは外れたことがないと定評のジミー・アップル氏がこんなリークをしています。

5 月 9 日午前 10 時からの Openai イベントは、モデルのリリースではなく、検索エンジンの発表になる可能性があります。彼らは Google I/O を盛り上げるためにはどうしようもないのでしょう (これを保証することはできません。イベントの時間と日付は変更される可能性があります)

このリークには裏付けがあり、OpenAIが検索機能を開発中であることはたしかです。現在のGPT-4のブラウジング機能は、Bingを使用してインターネット上の情報にアクセスしています。しかし、OpenAIが全く新しい検索エンジンを開発しているという情報が出ています。この新しい検索エンジンは、Microsoft Bingの一部の機能を利用しつつ、独自のAI技術を活用して、Googleに対抗する新しい選択肢を提供することを目指しているようです。

コモン・クロールが組み込まれるのではないかとの噂

次のモデルには検索エンジン機能を兼ね備えたモデルが出るとの噂があります。

コモン・クロール(Common Crawl)は、ウェブをクロールしてそのアーカイブとデータセットを公開している非営利組織です。この組織は2008年以来、ペタバイト規模のデータを集めており、毎月クロールを実施しています。これらのデータはオープンソースコードを使って処理され、公共の研究や様々な用途に無料で提供されていますが、この機能がChatGPTに内包されるとの噂があります。

質問の返答に画像が含まれる可能性

ジミー氏はこの様なポストをリツイートし、検索機能が搭載されたChatGPTでは、質問の返答に図解画像が含まれる可能性を示唆しました。

「 製品の 1 つのバージョンでは、関連性がある場合には、質問に対する書面による回答とともに画像も使用されます。たとえば、ユーザーがChatGPTにドアノブの交換方法を尋ねた場合、結果にはそのタスクを説明する図が含まれる可能性があると、同関係者は述べた。

組み込みにはいくつかの大きな課題がある

技術的には、ChatGPTがコモン・クロールのデータにアクセスする仕組みを組み込むことは可能ですが、実際にはいくつかの大きな課題があります。具体的には以下のような問題が考えられます:

  1. パフォーマンスと応答速度: コモン・クロールのデータベースは膨大であり、リアルタイムで特定の情報を抽出し、それをユーザーの質問に即座に反映させるためには高度な検索アルゴリズムと強力なサーバーが必要です。ユーザーが待つことなく迅速な応答を得るためには、このプロセスを最適化することが重要です。

  2. データの正確性と信頼性: コモン・クロールはインターネット上のあらゆるウェブページをクロールしているため、情報の質は非常に不均一です。誤情報や古い情報が含まれている可能性もあり、これをユーザーに提供する前に適切な検証が必要です。

  3. プライバシーとセキュリティ: ユーザーが提供した質問に基づいてウェブを検索する場合、個人情報の取扱いやセキュリティに関する懸念が生じます。ユーザーのデータを保護するために適切なプライバシーポリシーとセキュリティ対策が必要です。

  4. コスト: コモン・クロールのような巨大なデータセットに常時アクセスするためのインフラストラクチャは、高額な投資を必要とする可能性があります。また、リアルタイムでのデータ処理と応答を実現するための技術的な開発にもコストがかかります。

これらの課題を解決するためには、技術的な進歩だけでなく、倫理的なガイドラインや規制の枠組みの整備も重要です。提案されたシステムが実現可能であるかどうかは、これらの要素がどの程度克服できるかに大きく依存します。


この記事が気に入ったらサポートをしてみませんか?