CAT講座その2：翻訳メモリ後編

2022年3月26日 20:20

前回は、翻訳メモリの全体的な話をしました。今回は、同じ単語だけれど訳し分けしなければいけない場合や、逆に一括処理する場合の仕組みについて話したいと思います。

100％一致とContext Matchの違い

たとえば、次のようなテキストがあるとします。

<1> Heritage:
<2> Japanese
<3> Language:
<4> Japanese
<5> Heritage:
<6> Japanese
<7> Language:

<2>と<4>は同じJapaneseですが、素直に考えれば、あてはまる訳は異なりますね？

<1> Heritage: ->ルーツ:
<2> Japanese  ->日本人
<3> Language: ->言語:
<4> Japanese  ->日本語
<5> Heritage: ->ルーツ:
<6> Japanese  ->日本人
<7> Language:

このように、それぞれの単語の前に来ている単語が異なるので、コンテキストを踏まえると、<2>は”日本人”、<4>は”日本語”となります。
では、このような場合、CATツールではどのように表示されるのでしょうか？

こちらが<3>までを手動で入力し、残りのセグメントを自動入力した時の画面です。<4>と<6>の緑で描かれた一致率に注目してください。同じ”日本人”となっていますが、<4>はただの100％一致、<6>はCM（Context Match、ツールによっては101％一致と呼ぶこともある）となり確定まで自動で行われています。

この違いは、前後のセグメントにあります。翻訳メモリの提案は単にそのセグメントだけでなく、前後のコンテキストも見て、提示されているのです。

<4>の100％は、「んー、<2>で”日本人”って訳してるからこれでいいと思うけれど、前の文が違うし、もしかしたら訳し分けが必要かもしれないから、必要だったら編集してね😊」

<6>のCMは、「原文は前と後ろのテキストがおんなじだから、これだったらほぼほぼ”日本人”のままでいけるっしょ！主さんの作業を減らすために確定もしーちゃお😘」という感じです。

一括入力処理の設定について

もちろん、逆に訳し分けが必要な場合は、このような機能はかえって手間になります。設定でオフにしましょう。設定項目の説明については、こちら（http://fanblogs.jp/sakura2translation/archive/37/0）の記事がわかりやすいと思いました。参考にしてください。

とにかく、このような自動で変更が加えられてしまう機能については、成果物に影響しますので、ツールはよくわからない…などという言い訳はききません。きっちりと自分の目で設定を見て管理してください。最後の見直しをした時に、自分が意図しない形で修正が入っているのであれば、何か設定がまずいはずです。

みなさんには…ゲーム翻訳で”Yes”を何種類にも訳し分けていたのに、気がついたら一括で統一されていたことに後から気づくような悲劇を…避けていただきたいっ…うううっ…

OmegaTで慣れてみよう

さて、まだタグの処理など紹介していないことはありますが、翻訳メモリの仕組みがわかれば、実際にCATツールを触って慣れてみるのがよいと思います。OmegaT（https://omegat.org/ja/）は無料で使えるCATツールです。ダウンロードして、どんなものなのか自分で作業してみてください！

マシュマロ

2022年4月末までマシュマロを開放します。質問のある方は聞いてください！
https://marshmallow-qa.com/rie_18ra?utm_medium=url_text&utm_source=promotion

この記事が気に入ったらサポートをしてみませんか？