見出し画像

GPTZeroをごまかす方法

ChatGPTなどのAIで書かれた文章を判定するGPTZeroというサービスがあると聞いて使ってみました。

最初は半信半疑だったけど、使ってみると確かに高確率でChatGPTの出力は見破られます。

しかし

例えば英語で言語モデルとは何かという文章をChatGPTに書いてもらいました。

A language model is a type of artificial intelligence model that is designed to predict or generate sequences of natural language. In other words, it is a computer program that is trained on a large corpus of text data and learns to make predictions about what words or phrases are likely to come next in a given sentence or document.

ChatGPT

これはAIが書いたと判定されます。これをGoogle翻訳で日本語に変換して、即座に英語に戻すと次のようなテキストになります。

A language model is a type of artificial intelligence model designed to predict or generate sequences of natural language. That is, a computer program trained on a large corpus of text data to learn to predict the most likely next word or phrase in a given sentence or document.

ChatGPT(英語)→Google翻訳(日本語)→Google翻訳(英語)

これは全面的に人間が書いたっぽいと判定されます。Google翻訳もAIが書いていることには変わりないのですが。
さらにこのGoogle翻訳の出力をChatGPTで文法ミスを直してと言うと

A language model is a type of artificial intelligence model designed to predict or generate sequences of natural language. In other words, it is a computer program trained on a large corpus of text data to learn to predict the most likely next word or phrase in a given sentence or document.

ChatGPT(英語)→Google翻訳(日本語)→Google翻訳(英語)→ChatGPTで校正

これも人間判定となりました。違いは In other words周辺だけですから当然かも知れません。もともとの文章が人間判定だと、ChatGPTの出力でも人間判定を得やすいようです。

英文をすこしいじって人間判定に変わるタイミングを測ったのですが、Perplexityが高めになるようにいじればよさそうな感じはします。ちょこっと表現を変えてやるとかすればすぐに人間判定になります。

ChatGPTはすごく大掛かりですが、所詮は言語モデルで、次の単語を予測しているだけです。ですから、GPTが予測する単語にことごとく一致するとAI判定をされますが、そこをちょっと見出してやればごまかすことができそうな感じはします。

とはいえ僕は学生でもないし、AIで書いた文章だからと言って批判されることはない立場だと思っているので積極的に下手な英語をきれいに直してもらおうと思います。

この記事が気に入ったらサポートをしてみませんか?