Gemini対ChatGPT：AIの覇権争い、Googleの次なる一手は？

2024年2月9日 23:38

技術の驚異に満ちた世界で、Googleのgemini advancedの発表は人工知能の進化の物語において新たな章を開いた。

机の上の柔らかなランプの光の下で、テクノロジー愛好家でブロガーのマーカスは、自分の興奮を抑えることができなかった。彼はAIの進化を密接に追い、散らかったノートブックにあらゆるマイルストーンを書き留めてきた。特に、Ultra 1.0バージョンのジェミニの発売は、科学小説から飛び出してきたような能力を約束する進歩の象徴であった。マーカスは、ジェミニを使ってブログ投稿を作成し、複雑なコーディングプロジェクトに取り組み、さらにはデジタルのソウシェフと一緒に食事の計画を立てることを想像していた。彼の小さな、本でいっぱいの書斎の空気は、これから来るものの可能性で充電されたように感じられた。
マーカスがまもなく発見する真実は、ジェミニがAIにおける一歩前進を代表するだけでなく、人間と機械の知能の境界がますますぼやけていく未来への飛躍を象徴していたということだった。ジェミニの能力を探求しようと準備を進めるにつれて、その全潜能を解き明かし、先行者や競合と比較することへの期待は、興奮と一抹の不安の入り混じったものであった。

Bardは現在geminiとして知られている。gemini advancedでは、Googleの最も強力なネイティブ多モード大型モデル、ジェミニウルトラを利用できる！

昨年12月に、Googleはgemini proとgemini nanoを発表した。人々は、チャットボットのBard、Pixel 8 Pro、Samsung S24シリーズを通じて無料でこれらを使用できた。今日、Bardは変貌を遂げ、ジェミニアドバンスドによって提供される巨大なUltra 1.0の新しい体験を紹介した。また、AndroidとiOS用のモバイルアプリも発売された。

新サービスの料金は月額19.99ドルである。これはChatGPT PlusやPerplexity Proの月額20ドルと似ている。しかし、親切の印として、Googleは最初の2ヶ月を無料で提供している。

新時代の幕開

Googleの最上位の多モード大型モデルであるgemini ultraは、新時代の幕開けである。

GoogleのCEO、サンダー・ピチャイによると、Ultra 1.0は、MMLU（大規模マルチタスク言語理解）において人間の専門家を超えた最初のモデルである。数学、物理学、歴史、法律、医学、倫理を含む57の科目の組み合わせを使用して、知識と問題解決能力をテストする。

したがって、gemini advancedは、コーディング、論理的推論、微妙な指示に従うこと、および創造的プロジェクトに協力することにおいて、より強力になる。より長く、より詳細な会話を可能にし、プロンプトの文脈をより良く理解する。

例えば、gemini advancedは、ステップバイステップの説明、パーソナライズされたクイズ、あるいはあなたの学習スタイルに合わせた回答を作成する個人チューターになることができる。より複雑なコーディングシナリオに対処し、異なるプログラミングアプローチを評価するのに役立つ。また、デジタルクリエイターのパートナーにもなり、新しいコンテンツを生成し、トレンドを分析し、ビジネスプランを作成する。ジェミニウルトラ内で生成されるすべての画像にはデジタル透かし（見えないが）があることに注意が必要である。

新機能が追加されるにつれて、ユーザーはより強力な多モード機能、よりインタラクティブなプログラミング機能、およびより深いデータ分析を体験することになる。現在、gemini advancedは英語のみをサポートしているが、150カ国以上の地域で利用可能であり、徐々により多くの言語に拡大される予定である。

Gmail、Docs、Sheetsが利用可能

AndroidおよびiOSモバイルアクセス、Gmail、Docs、Sheetsが現在利用可能である。

gemini advancedは、新しいGoogle One AIプレミアムプランの一部であり、ユーザーに2TBのストレージスペースを提供する。さらに、AIプレミアムサブスクライバーは、Gmail、Docs、Slides、Sheetsなど、以前Duet AIの下にグループ化されていたアプリケーションでジェミニウルトラを使用することができるようになる。

モバイルアクセスを容易にするために、Googleは新しいジェミニアプリケーションを発表した。タイヤの写真を撮って指示を求めたり、夕食の招待状のためのカスタムイメージを生成したり、複雑なメッセージを書いたりすることができる。Googleはこれを「真にAIアシスタントを構築するための重要な第一歩、会話的で多モードの新しいタイプの実用的なアシスタント」と呼んでいる。

Androidユーザーは、ジェミニアプリをダウンロードするか、いつものようにGoogleアシスタントをアクティブにすることができる。「Hey, Google」と言ってそれを起動させる。ジェミニは、撮ったばかりの写真の説明を生成し、読んでいる記事に関する質問に答えることができる。Googleアシスタントの多くの音声機能も、タイマーの設定、電話の発信、スマートホームデバイスの制御を含むジェミニアプリを通じて利用可能になる。

iOSアプリはまだ途中だが、Googleによると、数週間以内にApp Storeで利用可能になるとのことである。

より多くの製品に拡大する

Geminiは、個人やビジネスが日常的に使用する製品にも完全に適用される。

Workspace: ピチャイは、すでに100万人以上がDuet AIを通じて「助けて書く」機能を使用して生産性と創造性を向上させていると述べた。今日から、Duet AIはWorkspaceのジェミニになり、まもなく、Google One AIプレミアムプランのサブスクライバーは、Gmail、Docs、Sheets、Slides、Meetを含むGoogleのオフィススイート全体でジェミニウルトラを使用することができるようになる。

Google Cloud: クラウドの顧客にとって、Geminiは企業の生産性を向上させ、開発者がコードをより効率的に書くのを助け、組織をサイバー攻撃から保護するのに役立つ。

開発者は、すべての主要な技術革命の基盤であり、Geminiエコシステムにおいても同様に重要な役割を果たしている。現在、何百万もの技術者とビジネスがジェミニ大型モデルを開発に使用している。Googleは、開発者とクラウドの顧客の将来の権利について、来週詳細を共有する。

ピチャイはまた、GoogleがGeminiモデルの次世代を積極的に訓練していることを明らかにした。

待ちきれない

ネットユーザーは、新しいGemini Ultraを試すのを待ちきれない

Googleが昨年12月6日にGemini Proをリリースしたとき、それはGPT-3.5と比較された。元々のオフラインデビューをキャンセルした後、Geminiシリーズはメディアによってある程度否定的な光で描かれた。それから数日後、中型および大型のカップが突然登場し、「ダック」ビデオデモで話題を呼び、活発な議論とオンラインのファクトチェックを引き起こした。その時、Googleは、32の広く使用されているLLMベンチマークテストで、ジェミニウルトラがChatGPTが代表する業界をリードするレベルを30項目で上回ったと発表した。

今、あなたはついにウルトラバージョンの力を自分で確かめることができる。

LinkedInポストの執筆をテストするためにコンテンツ生成を使用したとき、ジェミニウルトラはより多くのタイトルオプション、より速い応答速度、そして「ばかげた絵文字表現なし」で絶対的な勝者となった。

ネットユーザーのAlphabettingは論理推論の質問を提起した：Tabithaはクッキーが好きだがケーキは好きではない、羊肉が好きだがラム肉は好きではない、オクラが好きだがカボチャは好きではない。同じルールに従って、Tabithaはチェリーか梨のどちらが好きかと尋ねた。

Gemini Ultraは、「Tabithaは2音節の食べ物が好きで、1音節のものは好きではない」と提案した。それはパズルの各食品の音節数をリストし、「cherries」は2音節であるため、答えはチェリーである。

GPT-4は、Tabithaの好みが単語の最後の文字に関連しているかもしれないと考えた。彼女は子音で終わる食べ物が好きで、母音で終わるものは好きではない。したがって、チェリーも梨も基準に合致するが、選ばなければならない場合はチェリーを選ぶ。

これは、ジェミニウルトラがGPT-4を困惑させた論理テストを成功裏に解決したことを示している。

ユーザーのBrett Wintonは、両方の描画能力を比較し、次のようなプロンプトでテストした：「ロケットの外側に静物を描こうとしている画家のイメージを生成してください。それをユーモラスにし、イラストで表現してください。」左側はGPT-4で、右側はGemini Ultraである。

AIモデルの想像力は主観的であるが、ジェミニの画像の画家は、ペインティングよりも食事をしているように見え、手の詳細にいくつかの問題がある。コメントは一般적にGPT-4を好む。

彼はその後、Gemini Ultra、Claude、GPT-3.5の数学計算能力を8年生の数学問題で比較した。問題は次のとおりである：ガルシアはピザパーティーを計画しており、30人の生徒が少なくとも3枚ずつスライスを得られるようにしなければならない。各ピザには8スライスがあり、バラエティを加えるために、ガルシアはチーズピザとソーセージピザを半分ずつ注文することに決めた。しかし、5人の生徒は菜食主義者であり、チーズピザのみを食べる。

答えてください：

各生徒が少なくとも3スライスを得るために、ガルシアは何ピザを注文する必要があるか？
それぞれのタイプのピザは何枚必要か？
各ピザが12ドルの場合、総注文費用はいくらか？

以前のテストでは、Gemini Proはこの質問をめちゃくちゃにした。今回、Ultraは合計12ピザと144ドルの費用を正しく得た。しかし、質問2の正解はそれぞれのタイプのピザが6枚であるべきであり、Ultraは合格しなかった。

Brett Wintonは、Claudeのように、Gemini Ultraの数学計算はGPT-3.5ほど正確ではないと述べた。

コーディング能力に関しては、ネットユーザーのMervin PraisonはジェミニウルトラでPythonでスネークゲームを成功裏に作成した。

より深い使用例については、誰もが2ヶ月の無料トライアルを利用して自分で試すことができる。

GoogleはOpenAIに追いつく？

OpenAIはAIエージェントのための新たな戦場を開き、Googleは遅れを取っていない

Googleの副社長兼ジェミニ体験およびGoogleアシスタント部門のゼネラルマネージャーであるSissie Hsiaoは、「Googleにとって、ジェミニは単なるモデルではない。実際には、私たちが最先端の技術とそれに基づいて構築されたエコシステム全体について考える方法の変化である。何十億ものユーザーに影響を与える製品から、開発者やビジネスが革新するために使用するAPIプラットフォームまで」と述べた。

ちょうど昨日、The Informationは「OpenAIはAI競争の焦点をデバイスを操作しタスクを自動化するソフトウェアにシフトしている」という記事を公開した。

この記事は、OpenAIが電話やコンピュータを効果的に乗っ取り、ユーザーに代わって複雑なタスク操作を実行するエージェントソフトウェアを開発していることを明らかにした。ChatGPTに命令して、文書からスプレッドシートへのデータ転送、経費報告書の自動作成と会計ソフトウェアへの入力、または特定の予算内でのウェブタスクに基づく旅程の作成やフライトの予約を行わせることができる。

ますます多くの新しい大型モデルが発売されるにつれて、OpenAIは今年市場に最も強力なLLMを持っていないかもしれないと知っている。そこで、新たな戦場に早くから備えている。

関係者によると、これらの要求はエージェントのクリック、カーソルの動き、テキスト入力、およびその他の人間の行動を引き起こす。これにより、ChatGPTはSam Altmanが非公式に「超知能の個人作業アシスタント」と呼んでいるものに変わり、Microsoft CopilotやGoogleのWorkspaceのためのジェミニとより直接的に競合することになる。

昨年、ChatGPTはOpenAIに16億ドルの収益をもたらし、Microsoftも最新の四半期の財務結果を生成AIで大幅に向上させた。

AIビジネスはまだGoogleに明確なキャッシュフローをもたらしていない。ジェミニアドバンスドとウルトラ1.0の有料バージョンが市場からどのようなフィードバックを受けるか？すでにGPTサブスクリプションに支払っているユーザーはジェミニに切り替えるだろうか？GoogleエコシステムへのAI統合の新しい究極の形はどのようなものになるか？これらはすべて非常に期待されている。今年はAIの綱引きが続く運命にある。

この記事が気に入ったらサポートをしてみませんか？