見出し画像

ChatGPTの性能超えた「Claude 3」。実際どう?有料版を120日使ってる愛用者の立場から解説(ChatGPT,Geminiと比較)

「Claude 3」というAIツールが、「ChatGPTやGeminiを上回る性能」を示し、業界に衝撃を与えました。

しかし、それだけでは「実際どうなの?」といった本当の使用感までは分かりません。

私自身は、「Claude」の有料プランを120日以上にわたって使用してきた愛用者です。その立場から、Claudeの特徴や性能、Claude 3はどう変わったのかを解説します。

・Claude 3の概要と料金プラン
・ChatGPTやGeminiとの比較結果
・メリット・デメリット
・結局、いま課金するならどのAIがおすすめ?

以下のVoicyの放送のAI文字起こしをベースに記事化しています。
詳しくはVoicyの放送をご確認ください。

Claude 3の概要と料金プラン

GPT-4よりもGeminiよりも性能が上回るとされる「Claude 3」がリリースされました。

「Claude 3」の発表資料によると、全てのスコアにおいてChatGPTとGeminiの最高モデルを上回っているようです。

Claude.aiより

Claude3には3種類のモデルがあります。
・最高性能の「Claude 3 Opus」
・そこそこの「Claude 3 Sonnet」
・高速な「Claude 3 Haiku」

Webサービスとしての「Claude. ai」では、有料プランに入ると最高性能の「Opus」と、無料アカウントだと二番目の「Sonnet」と会話できます。

■ Claude 3の3つのモデルと特徴

Claude 3には、高い順に Claude 3 Opus、Claude 3 Sonet、Claude 3 Haiku の3つのモデルが用意されています。最上位モデルの Opus は、GPT-4 や Gemini Ultra を上回る性能を示しているとのことです。Sonet は生成速度とコストのバランスが取れたモデル、Haiku は精度は劣るものの、高速かつ低コストなモデルとなっています。

これらのモデル名は、それぞれ「Opus」=ラテン語で「作品」、「Sonet」=イタリア語で、14行の詩のスタイル。「Haiku」=日本の俳句 から由来していると考えられます。

■ Claude の有料プラン「Claude Pro」の概要

Claude の有料プラン「Claude Pro」は、月額 20 ドルで利用できます。このプランでは、最上位モデルの Claude 3 Opus を使用することができます。一方、無料プランでは2番目の性能を持つ Claude 3 Sonet を利用できます。Sonet の性能は GPT-4 にはやや劣るものの、無料ながらそれに近い性能を発揮し、かつ回答速度が非常に速いという特徴があります。

■ 過去の 「Claude 2.x」 との比較

以前の Claude 2.0 や Claude 2.1 では、 ChatGPT の有料プラン(GPT-4)には及ばないものの、日本語の文章生成における自然さでは ChatGPT を上回っていました。Claude 3 では、全体的な性能が大きく向上し、より自然な日本語の文章生成が可能になったと言えるでしょう。

Claudeって何かすごいの?愛用者が語る

■ 私は「文章のリライト(書き直し)」に毎日重宝。数万円のコスト削減に

Claudeの特徴は
「日本語の自然な文章を書く能力が高い」
という点です。

(これは「Claude 3」になって、
さらに進化しました。
素晴らしいクオリティです。)

そのため、僕はClaudeを
・ブログ執筆
・音声文字起こしのリライト
などに使っています。

Claude 3の登場により、
僕の執筆は、さらに効率化されることになります。

私は普段、セミナー講師として話した内容を文章化するニーズがあります。以前は、このタスクを外注ライターに依頼していましたが、1時間のセミナー内容をリライトするのに2〜3万円のコストと1ヶ月の納期を要していました。Claude を使うことで、このタスクを自動化し、コストを削減しつつ、その日のうちに文章化することが可能になりました。

■ Claudeは「日本語の文章の自然さ」が特徴

Claudeが生成する日本語の文章は非常に自然で、ブログ記事にそのまま使えるレベルだと感じています。ChatGPTやGeminiにリライトを依頼すると、文章が硬くなったり、不自然な言い回しが見られたりしますが、Claudeはそういった問題が少ないです。ライティングや執筆のタスクにおいて、Claudeは非常に有用だと言えます。

文章を書かせて比較!
(Claude vs ChatGPT vs Gemini)

では実際に、僕のVoicy音声配信の「文字起こし」をもとにリライトして、ブログ記事を書かせてみました。
(これは僕が普段から日常的にClaudeを使って行ってきた作業です。)

■ 比較実験の概要と結果

私は、Claude 3、ChatGPT (GPT-4)、Gemini に同じ音声文字起こしデータを与え、リライトを依頼する比較実験を行いました。

  • Claude 3 が生成した文章が最も自然で、ブログ記事として使いやすいものでした。

  • ChatGPT の文章は悪くはないものの、やや硬い印象を受けました。

  • Gemini の文章は、箇条書きが多く、そのままブログ記事として使うには不適切だと感じました。

■ ChatGPT は「ロボットっぽい文章」になる

ChatGPT の文章は、全体的な構成は良いものの、一部に不自然な熟語の使用が見られました。例えば、「できます」を「可能です」に、「仕組みを作った」を「構築しました」に言い換えるなど、硬い表現が目立ちました。
Gemini の文章は、箇条書きが多用されており、議事録やレジュメとしては使えるかもしれませんが、ブログ記事としては不適切でした。読者が内容を理解するのに苦労すると思われます。これらの課題から、現時点では Claude 3 が最も優れていると評価できます。

文章以外のタスクにも期待されるClaude

これまでの僕の「Claude」に対する評価は
・自然な日本語を書ける。
・最大20万トークンという文章量を扱える。
・数百ページのPDFファイルを読ませられる
・それ以外はGPT-4の方が性能が上。
という評価でした。

つまり、今までは、
Claudeは長文の解釈と文章執筆だけ。
ほかのタスクはChatGPTにやらせた方がいい

という評価でした。

ですが、
今回Claude3に進化したことによって、

・文章以外のタスクも全て性能向上したらしい
・「画像解析」もできるようになった

・これまで通り20万トークン扱える
・誤回答の危険性やバイアスもさらに下がったらしい

ということで、
Claudeを使うシーンが増えるかもしれません。

今後色々試してみたいですね。

Claudeのデメリット

■ 安全性とモラルへの過剰な配慮によるタスク拒否

Claudeは、安全性とモラルを重視するあまり、一部のタスクを過剰に拒否する傾向があります。例えば、自分自身の音声文字起こしデータをリライトするよう依頼しても、著作権の観点から拒否されることがあります。これは、ChatGPTやGeminiでは問題なく対応してくれるタスクです。Claude 3になってからは、この傾向が改善されてきていますが、それでも他のAIよりも慎重な姿勢が見られます。

■ 知識の曖昧さを認める誠実さ

Claudeは、知らないことに対して適当な回答を生成するのではなく、「知りません」と正直に答える確率が高いAIです。これは、ChatGPTなどで問題視されている「ハルシネーション」(幻覚)を防ぐための設計上の特徴だと言えます。ユーザーにとっては、曖昧な回答よりも明確に知識の限界を示してくれる方が好ましいでしょう。ただし、回答できる範囲が限定的になるというデメリットもあります。

結局、いま課金するなら何がおすすめ?

■ ライトユーザーにはChatGPTの有料プランがおすすめ

AIチャットツールを使い倒すほどではない、ライトユーザー向けには、迷わずChatGPTの有料プランをおすすめします。ChatGPTは現時点で最もバランスの取れたAIアシスタントであり、文章生成以外にも検索、プログラミング、計算問題、画像生成など、幅広い機能を備えています。また、GPTsやモバイルアプリなど、利便性の高さも魅力です。初心者の方には、総合的に見てChatGPTが最も使いやすいでしょう。

■ 「自然な日本語の文章生成」にこだわる人にはClaudeがおすすめ

一方、私のように日本語の文章生成の自然さにこだわる人には、Claudeがおすすめです。特に、音声の文字起こしをブログ記事にリライトするようなタスクにおいては、Claudeの性能が非常に高いと感じています。

■ Geminiは現時点では選択肢から外れる

Geminiについては、現時点では有料プランに加入するメリットが少ないと考えています。Geminiのアドバンスドプランでは、最上位モデルのGemini Ultraと会話できるはずですが、日本語で話しかけると無料版と同じモデルが回答する状況です。英語でのみUltraが利用できるのでは、日本人ユーザーにとってはまだ選択肢になりにくいでしょう。Geminiは、今後の日本語対応の充実に期待したいところです。

まとめ:いよいよGPT-5が出るのか?

■ どれも性能では同じくらいになってきている

近年、AIチャットモデルの性能は目覚ましい向上を遂げています。Claude 3やGeminiのように、GPT-4を上回る数値を示すモデルも登場しつつあります。しかし、性能面での差が小さくなるにつれ、各社のAIアシスタントを差別化することが難しくなってきているのも事実です。今後は、性能だけでなく、使いやすさや利便性など、ユーザー体験の向上が重要になるでしょう。

■ 「ユーザー体験」で差がつく。ChatGPTがやはり優位

性能面での差が小さくなる中、ユーザー体験の良さが選択の決め手になりつつあります。この点で、ChatGPTは他のAIアシスタントよりも優位に立っていると言えます。モバイルアプリの使いやすさ、プラグイン機能による拡張性、そしてユーザーインターフェースの美しさなど、ChatGPTは総合的に見て最も優れたユーザー体験を提供しています。性能だけでなく、使い心地の良さがAIアシスタントの選択に大きな影響を与えるようになるでしょう。

■ GPT-5登場の可能性と今後の展望

AIアシスタントの世界では、常に新しいモデルの登場が期待されています。現在、ChatGPTの開発元であるOpenAI社が次期モデル「GPT-5」をリリースするのではないかと噂されています。過去にも、OpenAI社はライバル他社の発表に素早く対応し、より高性能なモデルを投入してきました。もしGPT-5が登場すれば、再びChatGPTが性能面で大きくリードを奪回する可能性があります。AIアシスタントの進化は日進月歩であり、今後も目が離せない状況が続くでしょう。

この記事が気に入ったらサポートをしてみませんか?