生成AIハルシネーションの謎

2024年3月30日 20:25

最近、ChatGPTとかMidjourney、Stable Diffusionみたいな生成AIが流行っとるやん。でも、こいつらのAIが時々変なこと言うたりするの、知っとった？例えば、質問に対して間違った答え返してきたり、あり得へん事実を語ったりするねん。これ、「ハルシネーション」言うねんて。

ハルシネーションいうたら、幻覚とか妄想みたいなイメージあるやんか。でも、AIの場合は、ちょっと違うねん。

別に間違ったデータを学習しとるわけでも、うっかり間違えたわけでもないんや。

ほな、なんでAIがハルシネーションを起こすんやろ？その理由の一つが、AIが学習したデータから抽象的な関係性を見つけ出して、それを新しい状況に当てはめようとするからやねん。

でも、ちょっと待ってや。「データを学習する」言うたら、みんなは「AIがデータを覚えとるだけ」って思っとるかもしれんけど、実はそれだけやないねん。AIの学習には、2つの側面があんねん。

一つは、確かに「データを記憶する」いう側面。でも、もう一つの側面、めっちゃ大事なんが、「データの構造や、他のデータとの関係性を発見し、学習する」いうことなんや。

ほな、生成AIはどっちの側面をメインに学習しとるんやろ？実は、生成AIは後者、つまり「データの構造や関係性の発見と学習」をメインにやっとんねん。

例えば、AIが様々なデパートの情報から「デパートの地下は食品売り場」いう知識を学習したとするやん。そしたら、知らんデパートの地下について聞かれたときに、「そこも食品売り場なんやろ！」言うて答えるかもしれへん。これが、データの関係性から新しい知識を生み出す生成AIの力なんやで。

でも、そのデパートの地下が実際には自転車売り場やったとしたら、「ハルシネーションや！」ってゆわれるやんか。AIは学習した知識を一般化して適用しようとするから、それが間違っとることがあんねん。

ほな、ワイら人間は、AIとは違うんか？いや、実はワイら人間も、過去の経験から学んだことを新しい状況に当てはめようとするやん。
それが妥当なときもあるけども、時々ええ加減な一般化をしてまうことあるやろ。偏見とかステレオタイプいうのは、まさにそれやね。

でも、この機能がないとAIも人間もあかんねん。

今まで一度も見たことがない毒々しい虫が脚に登って来たとするやんか。そんとき「初めて見るから、どんな虫か分からへん。放っておこう」とは普通ならへんやろwww
過去に学んだことを新しい状況に適応するからこそ、ワイらは生き延びられてこれたし、新しい状況にも対応できるわけや。実は、ハルシネーションゆうのは、その機能を別の側面から見とるだけやねん。

ここで、この問題をもっと深く理解するためにAIがどないに文章を生成しとるんか、ちょっと説明したるわ。AIの言語モデル（LLM）は、めっちゃ単純な原理で動いとんねん。それは、「次に来る単語の確率」を計算して、一番確率の高い単語を選ぶいう方法や。

たとえば、もし、モマエらが元モー娘。の市井紗耶香先生(国会議員されてはるやんか)と日本の社会問題について話しとって、「日本の未来は」言うたとするやん。そしたら、次に何て言うやろか？

普通に考えたら、「少子高齢化がもっと深刻な問題になる」とか、そういう社会問題の話になりそうやん。でも、市井紗耶香先生は、元モー娘。でもあるから、「Wowwowwowwow」（『LOVEマシーン』の歌詞）てゆう可能性もあるわけやん。話しとる相手との関係性とか、その場の状況、空気によって、次にゆう言葉の確率が変わってくるやん。これが、コンテクストゆうことやねん。

でも、AIにはまだまだ限界もあるねんで。ワイら人間みたいに幅広い知識や経験を持っとるわけやないし、すべてのコンテクストを完璧に理解でけへん。やから、時々変な文章を生成したりもするんや。

ほな、どないしたらAIのハルシネーションを減らせるんやろ？一つの方法は、もっとたくさんのデータを、もっといろんな観点から学習させることやね。そしたら、AIはもっと幅広い状況を理解できるようになるかもしれへん。

でも、それでもまだ完璧とは言えへん。だって、世の中にはありとあらゆる状況があるから、すべてのデータを学習させるいうのは無理な話やろ。AIにハルシネーションを完全になくすいうのは、めっちゃ難しい課題やねん。

ただ、ワイら人間も、ハルシネーションと無縁やないやろ。しやから、AIのハルシネーションを理解することで、ワイら自身の思考の癖についても考えるきっかけになるんや。

AIと上手く付き合っていくためには、AIのすごさも認めつつ、その限界もちゃんと理解しなあかんのよ。そして、AIにできへんことは、ワイら人間が補っていかなあかん。そういう意味で、AIのハルシネーションについて考えるいうのは、これからのAIと人間の関係を考える上で、めっちゃ大事なことやと思うねん。

次は、生成AIの学習方法と人間の学習方法の違いについて、もっと掘り下げて考えてみようと思うわ。お楽しみに！

この記事が気に入ったらサポートをしてみませんか？