見出し画像

サカイマッスルを笑っていられるのも今のうち:AI翻訳ソフトの躍進と課題について

これなw

やっちまったな感がむしろ微笑ましく、もうサカイマッスルでよくね?みたいな投げやりでありつつも寛大な気持ちになったニュースなんだけど、これをSNSでRTしてたら、知り合いの在外経験組の仲間が「でもGoogle翻訳ではこうだったから」と英語を直されたことがあるよ、というショーゲキの証言が複数得られたので、これはヤバいっしょ、と書きたくなったのがこの文章。

実はこのところ、スキマ時間におうちでできる翻訳仕事として、AI翻訳ソフトの英文を直して、翻訳精度を上げるお手伝い、というのをやっていたんだけど、それも一区切りついていよいよ商品として世に出るというので、子どもの卒業式を見守る親のような気持ちでいたわけ。

これまで私が仕事で何かの文章を英訳するときは、日本語の文章を咀嚼して、いったんそれを忘れて、改めて同じ意味のことを英語で書き出す、という方法をとることが多かった。特許や法律関係の文章なら直訳に近い方法でやった方が早いだろうけれど、私が引き受けるのはテレビのナレーションとか、商品やサービスのPRとか、原文がふわっとした雰囲気を伝えようとする文章が多いで、直訳すると「なんのこと言ってんのかワケワカメ」になりがちなのね。スローガンやキャンペンフレーズのように、1つの文章になってなくて、短ければ短いほど、翻訳ソフトじゃ無理。正確な機械翻訳にはコンテクストというデータが必要だから。そしてその短い言葉が果たして他の文化でもちょうどぴったり同じものを言い表しているかは、その言葉が生まれてくる文化を肌感覚でわかっている人間じゃないと、わからないから。

一方で、翻訳ソフトが出してくる英訳は原文をdeconstructしてあっても、どこまでも忠実な直訳に近い。直す時も、バイリンガルだからと、えいやっと英語脳に切り替えて最初から文章を考える方法ではダメなのだ。翻訳ソフトの翻訳というのは、単語単位で見ていくと、辞書で引いて一番最初の意味をまず出してくるから、それをどういう場合(他にどういう単語が入っているか、何について書いてあるのか)なら、①の意味じゃなくて②の意味になる、ということを紐づけて再入力する。翻訳ソフトのすごいところは、一度覚えたら次からは絶対に間違えない、飲み込みのスピードがめっちゃ早い、紐づけたら意味を使い分けた翻訳を出してくる、ってところ。

人間の翻訳との違いを説明するのに思いついた例えで言うと、トランプのポーカーゲームかな。人間が出してくる英訳は、カードが5枚で(一般常識に値する基本的なルールは間違えないという点で)、「誰がどこでいつ何をどうした」と言いたいのか、その訳の「意図」を汲み取ってしまえば、あ、フルハウスを狙ってたんですね、となって、じゃ、このカードはクイーンじゃなくてキングにすればOK、と直せる感じ?

それが翻訳ソフトだと、これがポーカーだよ、っていう基本ルールを認識してなかったりしたら、カード52枚ぐわーっと、無作為としか思えない順番で出してきたりする。どんな長い文章でも瞬時に訳して、しかも単語単位で間違っているところはない。でも、何を言わんとしているかという「意図」は見えない、というか、機械にそんなものはないので、一体君は何が言いたいの?ってことになる。

そしてやっぱり機械なので一般常識まで組み込まれていない。だから、堺筋線はサカイ・マッスルだよね? だって、堺はサカイで筋はマッスルなんだから、何もまちがってないよね?」としれっとしている感じなのだ。

だから大阪メトロのサイトの件だったら、こんなもん、固有名詞である駅名のデータベース入れて、「大阪メトロ」というキーワードで紐づけてやれば一発で直せる。サカイマッスル?ぷぷぷ、って笑っている間に、人間の知能なんてあっという間に追いつかれる。だって、日本語って人間だって読み方わからなくて苦労する言葉でしょ? 大阪の駅名のクイズとか、大阪の人以外、みんな間違えるでしょ? わかんないでしょ? サカイマッスル笑えないでしょ? 関係ないけど、このクイズの難易度高かったな。大阪にルーツのある私でさえ、読めないのがけっこうあったわ。知らんけど。

これがヨーロッパ言語だと表記はみんなアルファベットなので、読み方わからなくてトンチンカンな訳になることはない。ある意味、日本語の翻訳ソフトの精度がなかなか上がらないのは、漢字に訓読み、音読み、そして最近はキラキラネームに好き勝手な読み方を許してしまった日本語の宿命とも言える。(それだけではないんだけど。)

で、話を元に戻すと、なんだろね?この日本人の、英語圏に長く暮らしていた人の英語よりも、Google翻訳を信じるっての? サカイマッスルも結局、マイクロソフト翻訳を使ったのをそのままチェックせずに載せちゃった、ってことらしい。でもさ、こんなの、中学生レベルの英語力あれば、読み返して「おかしいな?」ってわかる程度のミスじゃん。それさえもしないほど、盲目的に翻訳ソフトを信じるってのがわからない。

商品として市場に出回っているソフトウェアなんだから間違えるはずない、って思ってるのかな? でもそれは大間違い、今時シリコンバレーでも、Lean Start-upモデルといって、少数のエンジニア、少数のプログラマー、少ないサーバ容量でサービス構築して商品化するようになっている。とにかく始動が重要だから。バグだの、翻訳間違いだのってのはいくらでも後でアップデートして直していけばいいもの、というスタンスだ。だから断言する、世の中に出回っているパーフェクトな翻訳ソフトなんてないよ、って。人間だってそうじゃん。完璧な日本語喋ったり書いたりしてる人なんている? 何十年と同じ日本語力で生きてるじゃん。そのうちに翻訳ソフトに抜かれていくに決まってるじゃん。

でもそこに到達するまでは、やっぱり人間によるチェックを必要とするだろう。まだまだ「こう言う場合にはこういう言い方しないよ」とか「この単語は直訳だと英語だと違う意味にとられちゃうかも」みたいなふわっとした感覚的ことは、ソフトにインプットするのが難しく、言葉としての英語の感覚を持っている人じゃないと判断できないからだ。つまりは翻訳ソフトがどんどん進歩している時期ではあるけれど、だからこそ出来上がってきた翻訳をチェックするためにも、英語力が必要な時期はまだまだ続くだろうね。

この他にもAI翻訳ソフトのお仕事で気づいた「日本語の問題」が色々とあるので、そっちはまた別の機会に書くとするか。

しかし、仕事はえーやついて笑う。こっちがコラム書いてる間にTシャツ作っちまってるよw


この記事が気に入ったらサポートをしてみませんか?