見出し画像

今のChatGPTは津軽弁(青森の津軽地方の方言)を理解出来るのか

この記事では、比較的難解な方言である津軽弁をChatGPTが理解出来るか簡単に試してみる記事となります。
途中、ChatGPTに質問する津軽弁の文章をあげている箇所があるので、正解を見る前に、ぜひ考えてみてください!
やりとりは一部、おまけにて全量掲載しています。


津軽弁とは

端的に言えば、青森県の津軽地方で話されている方言です。独特の語彙や発音があり、他地域の人々には理解しにくいとされています。
古いCMですが、森三中が出演するパッソのCMで聞いたことがある人も居るのではないでしょうか。

さらに補足で、青森には「津軽弁」「南部弁」「下北弁」が存在しています。
それぞれ似て非なるものですし、文化的な背景の違いから、しばしば「南部」と「津軽」は軋轢があるとされています。
なので、ひとまとめで括らないようにしましょう。

前情報無しに理解出来るのか

試しに以下の質問だけをしてみます。
尚、質問に際して以下のサイト(弘前大学)より文章を引用しています。

以下にあげる文章は方言を含むものですが、これがどこの方言か分かりますか? だいだば?こごさゴミなげでらの!ゴミ箱さなげろ

プロンプト

回答が以下です。

この文章は、日本の方言の一つであると思われますが、特定の地域を示す特徴的な表現が含まれています。「だいだば」や「こごさ」、「なげでらの」などの表現は、特定の地域の方言である可能性が高いです。しかし、これだけの情報では正確な地域を特定するのは難しいです。

ただし、「だいだば」は驚きや確認の意味で使われることがある表現で、「なげでらの」は「投げてはいけない」や「投げるな」などの意味で使われることがあり、これらの言葉は青森県の津軽方言や、その周辺地域で見られることがありますが、確信は持てません。

方言には地域ごとの特色が強く、同じ国内でも多様な表現が存在します。このため、正確な地域を特定するためには、より多くのコンテキストや追加情報が必要です。それでも、提供された文章からは、日本の特定地域の方言であることは間違いなさそうです。

ChatGPTより

結論から言えば間違っていますが、津軽弁であることを類推できているのは素晴らしいですね。テキストという制約の中で、よくここまで読み取れるなというのに驚きます。
実際、津軽弁ネイティブの人でも、テキストに起こされるとぱっと見分からないこともあるかと思います。方言というものは、書く字まで必ずしも訛らないし、イントネーションまで再現できるものではありません。

上記の例で言えば、「誰ですか?ここにゴミを捨てているのは!ゴミ箱に捨てなさい!」が正になります。
ゴミを投げる、とした場合、ゴミを捨てると同義であることに注意ですね。

もう一つ続けて質問してみます。

このもぢ あめでらな?

プロンプト

さて、津軽弁ネイティブで無い方は、これの意味がわかるでしょうか。
ChatGPTは間違えました。

提供された津軽方言の文を共通的な日本語(標準語)に翻訳すると以下のようになります。

原文: 「このもぢ あめでらな?」

翻訳: 「今日は雨が降るのかな?」

「このもぢ」は標準語で「今日」を意味し、「あめでらな?」は「雨が降るのかな?」という疑問を表しています。津軽方言の特徴的な語尾や表現を標準語に置き換えて、より多くの人に理解しやすい形に翻訳しました。

ChatGPTより

正解は、「この お餅 腐ってない?」です。
このもぢ、までは大体分かりますね。あめでら、というのは、腐っているという意味です。
これ、実際に話す時は腐っているものをそこに指す場合があるので、
「このもぢ あめでまってら!」となる場合が多そうですね。

奥が深いですね。

もうちょっと津軽弁を掘り下げる

津軽弁の特色はいくつも存在しますが、面白いポイントとして「す」と「し」に発声の区別があまりありません。
こういったものは、テキストに起こしにくいのかな、と思います。
なので、将来的にAIとして活用するにあたって、一工夫ないと難しいのかなと思ってしまいます。
要するに、テキストとして保存した際に、かなりの情報が失われてしまうためです。他の方言も同様ですね。日本語だけれども、日本語のテキストに表現出来ないものは多くありそうですね。

また、東北の方言にも共通しますが、極端に短い文でやりとりが行えます。
津軽弁に関しては有名なもので「どさ」「えさ」や、「どさ」「ゆさ」があります。前者は「どちらへ行かれますか?」「家(自宅)に帰ります」といったニュアンスの会話です。後者は、「どちらへ行かれますか?」「湯(お風呂・銭湯)に行きます」といったニュアンスです。

いやぁ、興味深いですね!

試したこと(GPTs)

GPTs等でなんとかならないかと思い試しました。

先ず、上記の弘前大学のテキストを辞書化してGPTsに食べさせました。

回答

ちょっと辞書の入れ方があまり良くなかったと思いますが、登録されている範囲では正確に回答することができるようにはなりました。
模範解答は「昨日、友達と温泉に行ってきたよ」です。

以下、比較として普通のChatGPT4です。

回答

さっぱりダメですね。ただし、普通のChatGPTでも、辞書化したものをテキストとして、アップロードしてあげると可能性はありますね。
ただ、試した感じGPTsの方が優秀な気がします。

ちなみに、GPTsは公開しませんのであしからず。
(入力のそれの許可を取っていないので)

まとめ

方言というものは文化です。テキストだけでは無く、語られる地域や文脈、人によって継承されるものです。なので、このようにテキストだけで扱うのは極めて難しい問題だなと感じました。
ただ、今後様々な地域においては、少子高齢化により方言が失われてしまう可能性があります。これについては、かなり憂う問題ですね。

自分は結構仕事柄、様々な地域に住んでいましたが、その地域の方言を耳にする度に、「いいなぁ!」って思っていました。
地域ごとの魅力もまた内包しているんですよね。是非、自分の住んでいる地域もそうですが、興味を持たれたら、津軽弁もそうですし、その他の地域の方言に耳を傾けるのもいいかもしれません。
(今はYouTube等で比較的手軽に聞けるのも良いですね。)

おまけ(ChatGPTとのやりとり全量)

余談

イントネーション等をVOICEROIDで再現して、おまけで添付しようと思いましたが、難しすぎて断念しました。(時間さえかければできそうですが……)

試行錯誤

この記事が気に入ったらサポートをしてみませんか?