翻訳の小技：GREP検索のススメ

2022年7月26日 00:53

以前、翻訳メモリについて書きましたが、今回はそれとは少し違う切り口で翻訳作業の効率化を支えてくれる、GREP検索の紹介をしたいと思います。

GREPとは…

grep（グレップ、グレプ）は、UNIXおよびUnixオペレーティングシステムにおけるコマンド。テキストファイル中から、正規表現に一致する行を検索して出力する。

https://ja.wikipedia.org/wiki/Grep

…なのですが、まあ、この定義についてはあんまり気にしなくて大丈夫です。翻訳者として私が使っているGREP検索は、一言で言ってしまうと、指定のフォルダ内に存在するファイルの中身を、作成アプリに関わらず、一括で串刺し検索してくれる機能です。

たとえば、こういう構成のフォルダを対象にして、特定のフレーズを調べてみましょう。

GREP検索ソフトを使うと、このような結果を得られます。

GREP検索ソフトのウィンドウ上で解決しない場合のみ、そのファイルを開いて詳細を調べればよいので、大幅に検索時間を短縮できます。

導入方法

GREP検索をするには、対応のソフトを使用します（フリーソフトを紹介している https://www.gigafree.net/tool/grep/ などで探せば、すぐに見つかります）。ちなみに私が最近メインで使用しているのは、TresGrepです。使い方はそれぞれのソフトのサポートページで確認してください。TresGrepはかなりわかりやすいと思います（Excel/Word/Pdfファイル等なども検索する場合は、xdoc2txtのインストールも必要です）。

こんな時に便利！

・きれいに整理した用語集を用意する余裕がない場合。
たとえば、ネット上にある箇条書きで書かれた○○用語集をローカルに保存したようなファイルや、メモレベルの自作用語集など、ジャンルごとにフォルダに分けておけば、適宜調べられます。対訳データとして見た目が整えられた状態でなかったとしても、GREP検索であれば訳語を見つける分には困らないので、便利です。

・既訳での表記確認。
時間があいて依頼されたアップデート案件や、すでに別の翻訳者さんが作業を進めている案件の場合、既訳データを1つのフォルダにまとめて入れて、GREP検索で調べるようにすれば、これまでの表記との統一が楽です。たとえば「おもしろい」の表記が既訳でどうなっているか確認する場合は、「おもしろ」と「面白」をキーワード指定して検索します。複数の訳データをExcelで渡され、個別に開いて検索する時間の余裕がない場合にも使えます。

・参考資料が山ほどあるが、すべてを読む時間がない場合。
参考資料が何種類もあって説明が詳細にされており、すべてを読んでから翻訳をすると納期に間に合わない場合、私はとりあえず参考資料の本当に重要な部分だけを確認したら、翻訳を始めます。そして、参考資料は1つのフォルダにまとめておき、キャラクター名や地名などが登場した時点で、そのキーワードをGREP検索で調べます（ですので、ゲーム開発者の方は心配せずに参考資料はどっさりと提供してください。基本的に資料はあればあるほど、翻訳のクオリティはあがります）。

上級者編：正規表現

正規表現とは、[ や * などの特殊文字を組み合わせて、「文字列の集合を一つの文字列で表現する方法」です
（参照：https://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%8F%BE）。

[０-９]
全角数字すべてを表す正規表現

たとえば、こちらを検索語句に指定すると、全角数字が検出されます。つまり、数字は半角のみというルールの場合に、違反（全角数字）がないかを洗い出すことができます。

これをうまく組み合わせれば、半角と全角の間のスペース有無なども洗い出せます。もちろん、正規表現を用意するより自分の目で確認した方が早い場合もありますが、レビュー案件で大量に手直しが発生した時など、自分の目だけでは心配という場合に、正規表現での検索を取り入れています。

検索環境の効率化は、翻訳作業の効率化に直結するので、ぜひ皆さんも取り入れてみてください！

この記事が気に入ったらサポートをしてみませんか？