見出し画像

AIと生きる~OpenAIとGoogleAIのAPI比較~

「Cursor」と「LangChain」で作業を継続、学習していくにあたり、APIを使用することになりそうなので、ChatGPTのOpenAIとGeminiのGoogleAIを比較してみました。


料金の比較


OpenAIの料金

※詳しい料金は公式ページを参照してください

$$
\begin{array}{l:l:l}
モデル & 入力 & 出力 \\
\hline
\\GPT- 4\ Turbo & \$0.01 / 1k\ tokens & \$0.03 / 1k\ tokens \\
&&\\
\hline
\\GPT-4 & \$0.03 / 1k\ tokens & \$0.06 // 1k\ tokens \\
GPT-4-32k & \$0.06 / 1k\ tokens & \$0.12 / 1k\ tokens \\
&&\\
\hline
\\GPT-3.5-turbo-0125 & \$0.0005 / 1k\ tokens & \$0.0015 / 1k\ tokens \\
GPT-3.5-turbo-instruct & \$0.0015 / 1k\ tokens & \$0.0020 / 1k\ tokens
\end{array}
$$

GoogleAIの料金

※詳しい料金は公式ページを参照してください

$$
\begin{array}{l:l:l}
モデル & 入力 & 出力 \\
\hline
\\Gemini & \$0.000125 / 1,000 文字 & \$0.000375 / 1,000 文字\\
&\$0.0025 / 画像& \\
\end{array}
$$

料金での単純比較では、GeminiAPIの方がコストは低くなりそうです(OpenAIのAPIでは1kトークンにつきとなっていますが、日本語入力では1,000文字未満になるようです)。
記事執筆時点(2024/2/24)では、Geminiは有料プランが始まっておらず、無料で利用できる。


入出力が生成AIの学習に使用されるのか?


どの生成AIでも、入出力内容が学習に使われる可能性があるから、機密情報などの入力は避けたほうが良いとされています(特に無料枠利用)。
「LangChain」の関連動画を見ていると、「社内の機密にしておきたい資料も学習して使用することができるようになる」との説明があったので、API利用の際にどのような扱いになるのかを調べてみました。

Open AIのAPI


Open AIのAPIを使用した際に、入力内容がどのように扱われるのか検索すると、下記の記事を見つけました。

記事の内容は、OpenAIが公式に発表している利用ポリシーをかいつまんで説明してくれています。
記事によると、

・ OpenAIのAPIを利用する場合、オプトインしない限りユーザーが送信したデータが学習に利用されることはない、と改定されました。
・ いっぽう、Web上でのChatGPTについては、(2023年3月2日現在は)引き続きオプトアウトしない限り入力データは学習に利用される可能性がある仕様なので、この点は留意が必要です。
・ また、学習に利用されなくとも30日間は送ったデータは不正利用などの監視・調査を目的としてOpenAI内で保持されます(悪用の可能性が低いユースケースの場合はオプトアウト可能とのこと)。この点にも留意しましょう。
・ APIの利用についてはDPA(Data Processing Addendum / データ処理補遺)の締結が可能です。ただしOpenAI側の書式に従う必要があるようです。

ChatGPT APIリリースに伴ってOpenAIのAPIデータ利用ポリシーが改定されたので読んでみた | DevelopersIO (classmethod.jp)より抜粋

念の為、OpenAIの公式ページも調べてみました

日本語に翻訳して表示すると、

OpenAIでは、ユーザーデータの保護は私たちの使命の基本です。APIを介した入力と出力でモデルをトレーニングすることはありません。詳しくは、APIデータプライバシーのページをご覧ください。

はじめに - OpenAI API

とあり、学習に使われることは無さそうなので、確かに機密情報などのPDF等から、アプリ内で参照して回答を生成する機能を導入できそうです。
※データの保持については、第三者と共有されることは無いが、データ自体は削除されるまで保持するようです(下記画像を参照)

GoogleAIのGeminiAPI


https://ai.google.dev/pricing?hl=ja

上記の公式ページ情報だと、無料利用の場合、
「Google サービスの改善のためのプロンプト/回答 ○**」
となっており、学習に利用される可能性がありそう。
有料利用の場合、
「Google サービスの改善のためのプロンプト/回答 ☓**」
となっているので、学習に利用されないと読み取れる。
ただし、公式ページの「Gemini API 追加利用規約 |開発者向け Google AI」を見てみると、「機密情報、または個人情報を送信しないでください」との表記があります。このあたりは、まだ有料プランがスタートしていないので、スタート後に確認する必要がありそうです。

Gemini API 追加利用規約 |開発者向け Google AI

Cursor

プライバシーポリシーによると、プライバシーモードを有効にすると、Cursorと第三者には保持されないが、ビジネスプラン以外はOpenAIに30日間保持されるようです。

まとめ


$$
\begin{array}{l:l:l}
 & Cursor & LangChain \\
\hline
\\利用する生成AI &
OpenAI(ChatGPT) &
GoogleAI(Gemini)\\
& GitHub Copilpt & OpenAI(ChatGPT)\\ \\
\hline
\\利用オプション & GitHub Copilpt(拡張機能) & GoogleAIのAPI(Gemini)\\
& OpenAIのAPI(ChatGPT) & OpenAIのAPI(ChatGPT)\\
&CursorPRO(ChatGPT) & \\
&& \\
\hline
\\ コスト & GitHub Copilpt(\$10/月) & GoogleAIのAPI(従量課金,2024/02/24現在無料) \\
& OpenAIのAPI(従量課金) & OpenAIのAPI(従量課金) \\
& CursorPRO(\$20/月) & ※機密情報を取り扱わない場合、GoogleAIの方がコスパ良好\\
&& \\
\hline
\\ 機密情報について & プライバシーモードで保持しない設定が可能 & GoogleAIのAPI(モデル学習に利用される可能性あり)\\
& プライバシーポリシー(下記参照)によると、OpenAIには保持される& OpenAIのAPI(モデル学習に利用しないと公式発表あり)
\end{array}
$$




今日の体調


ここのところの天候不安定に引きずられて、体調は良くありません。
軽い動悸、ふらつき、頭痛、関節痛と症状もあります。
それでも、こうやって「作業ができる」ようにまでなったし、「先が気になるから調べる(やりたい)」衝動が出てくるようになりました。
過集中になって、疲労を貯めないように休憩をうまく取る必要が出てきました。
「社会から取り残されている」感からの焦りは、無いといえば嘘になりますが、「LangChainと生成AIで何か人の役に立つアプリが作成できるかもしれない」という未来への期待が持てるようになりました


この記事が気に入ったらサポートをしてみませんか?