知財専門家はChatGPTの夢を見るか?:特許翻訳編

「そう、言葉の確率さ。それがコンピュータによる言葉の理解だった」
「<<私たちは、偶然、喋ってる?>>」

小説マルドゥック・スクランブル -排気- より

特許翻訳に求められること

ChatGPTに特許を翻訳させる前に、特許翻訳に求められることを話そう。
そもそも日本人にとって特許翻訳がどういう場面で必要となるのか?
まず知財業務の中で翻訳自体が発生するのは主に以下の5点。

  • 出願書類(パリ、PCT)

  • 特許調査

  • 中間処理

  • 訴訟系

  • 事務手続き(現地代理人との連絡等)

その中で機械翻訳を用いる場面はどういう場面か?
個人的に最も機械翻訳を使うのは中間処理と特許調査だろう。
例えば中間処理は正確な翻訳は不要であるし(Claimは自分で書く)、素早く引例を読み込む必要があり、かつ、公開情報の翻訳なので気軽に翻訳ツールにかけて内容のざっくり理解に役立てている。

しかしながらこれは「機械翻訳は精度が低い」「公開情報は入れづらい」ことを前提としているためともいえる。
ハッキリ言って、今の機械翻訳は「効率化ツール」に過ぎず、人間翻訳の「代替ツール」ではない。そのため、コスト削減にはあまり貢献していない。したがってコスト削減に最も効くであろう出願時にはあまり使用されていない(翻訳者が効率化ツールとしては使用しているが機械翻訳のみは行っていない)

ChatGPTの脅威を示すには、コスト削減に役立つことを示させばならぬ。
それはすなわち、出願時の特許翻訳に役立つことの証明である。

よって以下では、出願時の特許翻訳に役立つのか?
その視点で語ろう。

機械翻訳を当てはめるためのフロー

さて、出願時の特許翻訳に役立つのか?と述べようとすると必ず「出願時の書類は秘密情報だから」と言い出す人がいるので、先にそこをクリアするフローを述べておこう。

日本出願 → 日本語PCT出願 → アメリカ移行

このフローであれば、早期移行をしない限りは公開情報の翻訳となるため、秘密情報かどうかは気にしなくても良くなると思わないか?
さらに日本語PCT後であれば多くの国で審査過程で誤訳訂正が可能である

え、全件PCT出願は高いって?
これから述べる翻訳費用の削減を聞いても同じことを思うかな?

まぁ、ISRによる簡易特許性確認と、移行時期&権利化時期を先延ばしにできるというのは大企業にとって大きいメリットだと思うし、さらに全件PCT出願しても移行するのはその3-5割程度にすればパリ出願のみと比べても数年で見ればコストバランスは大きく変わらないし、事務管理も予実管理もしやすくなるので、そちらのメリットだけでも大きいと個人的には思うけどね。

出願の機械翻訳で得られるメリット

はよChatGPTによる翻訳を見せろや、という声が聞こえなくはありませんがもう少し語らせてくれや。
出願の機械翻訳で得られるメリットは実はコストだけではない。
スピードとクオリティ平均も得られるのだ。

コストが変われば外国出願数と出願国が増える。
出願時の翻訳スピードが変わると、移行検討をさらにゆっくりにできる。
クオリティ平均を得られると、クオリティマネジメントにやる気が出る。
本当はクオリティマネジメントでちょっと語りたい気持ちもあるのだがそこを書き出すとさすがに長いんでやめておこう。

年に1-2件の外国出願の企業であればあまり機械翻訳を導入するメリットはない。しかし、年500-2000の外国出願を行う企業で導入するメリットは非常に大きい。
大企業の場合、実際に使われる特許(交渉や訴訟、PR等)は100件に2, 3件と言われる(2, 3件ですら多いと思う人がいるかもしれない)。
すなわち、残りの90%以上の特許は使わない特許となる。
であれば、使わない特許については請求項はともかく(潜在的な牽制になる可能性があるので)、明細書は翻訳クオリティが多少マズかろうが問題なかろう。
その感覚で言うと、1件の人間翻訳が50万円、機械翻訳が5万円だとして、年500件の外国出願のうち450件を機械翻訳とすれば、差額45万円×450=2億円の節約となるのである!!!

ChatGPTの翻訳能力とは

ようやく本題。
ここまでの語りで、機械翻訳がもし高度となった世界では特許出願が変わる可能性を感じ取ってもらえたのではなかろうか。
では、実際にChatGPTで何か機械翻訳が変わるのか?そこを語ろう。

これまでにも特許翻訳ツールは色々なものが出てきた。
DeepLやGoogle翻訳といった汎用翻訳ツールだけでなく、特許翻訳に特化した様々な翻訳ツールがある。特許翻訳に特化した翻訳ツールはなかなか実力が高く、正直なところすでに私より翻訳能力は上であろう。
しかしながら、違いがある。

これまでの特許翻訳ツールは請求項の翻訳が致命的に下手なのだ。

したがって、私はこれまで機械翻訳を出願時に用いる場合は「請求項を人間が翻訳し、明細書を機械が翻訳。人間が翻訳した単語集を用いて機械翻訳部分を修正(単語置き換え)」というのを提案してきた。
しかしながら、それすらもいらなくなるかもしれない。

では実際にChatGPTの実力を見てみよう。
例文は以下の通りである。

【請求項1】
画像データを取得する取得部と、
前記画像データを記憶する記憶部と、
前記記憶した画像データに対して画像処理を行う処理部と、
を備える画像処理装置。
【想定翻訳】
An image processing device comprising:
processing circuitly configured to
  obtain image data,
  store the image data, and
  perform image processing on the stored image data.
【参考:DeepL翻訳】
[段落そのままの場合]
An acquisition unit for acquiring image data,
A storage unit for storing said image data; and
An image processing unit that performs image processing on the stored image data,
The image processing unit is equipped with an image processing unit that performs image processing on the stored image data.
[段落調整をした場合]
An image processing device comprising: an acquisition unit for acquiring image data; a storage unit for storing said image data; and a processing unit for performing image processing on said stored image data.

オリジナル例文+DeepL参考翻訳例

DeepLでも段落調整をすればそれなりにきれいなことに気づいただろうか?
ではChatGPTではどうなるだろうか?


さて、ChatGPTはプロンプト(入力文)によって大きく実力が変化する。
したがって、何パターンかプロンプトが変化した例をお見せしよう。
なお、Modelは全てGPT-4である。

パターン1:以下の文章を英語に翻訳してください。

[Claim 1]
An image processing apparatus, comprising:
an acquisition unit for obtaining image data,
a storage unit for storing the obtained image data, and
a processing unit for performing image processing on the stored image data.
★段落調整をせずとも一連の文章として把握し翻訳している。unit for ~ingとMPF気味になっているのはいまいちだが直訳調としては十分。

パターン2:以下の特許文章を最適なアメリカ特許出願クレームとなるように翻訳してください。

[Claim 1]
An image processing apparatus, comprising:
an acquisition unit configured to acquire image data;
a storage unit configured to store the acquired image data; and
a processing unit configured to perform image processing on the stored image data.
★MPFが多少改善。unit configured to~はMPF指摘される可能性は高いがMPFを避ける意思が感じられる。

パターン3:2+翻訳の際、means plus function claimと解釈されないようにクレームを翻訳してください。

[Claim 1]
An image processing apparatus, comprising:
an acquisition unit for acquiring image data, wherein the acquisition unit is not characterized by means for acquiring the image data;
a storage unit for storing the acquired image data, wherein the storage unit is not characterized by means for storing the image data; and
a processing unit for performing image processing on the stored image data, wherein the processing unit is not characterized by means for performing image processing.
そういうことではない。どうやら思いが伝わらなかったらしい。

パターン4:以下のルールに従って特許文章を翻訳してください。

[ルール] ①構成はprocessing circuitlyのみです。例えば、A comprising: processing circuitly configured to V, V, and Vと翻訳してください(Vは動詞)。 ②各部は動詞として記載してください。すなわち、画像データを取得する取得部=obtain image dataとなります。

[Claim 1]
A comprising: processing circuitry configured to obtain image data, store the image data, and perform image processing on the stored image data.
★序盤がルールに引っ張られすぎたらしいが、相当イメージに近づいてきた。段落が消えているのもルールに引っ張られすぎたためだろう。

パターン5:以下のルールに従って特許文章を翻訳してください ver2。

[ルール] ①構成はprocessing circuitlyのみです。例えば、~部を有する画像処理装置はAn image processing device comprising: processing circuitly configured to V, V, and Vと翻訳してください(Vは動詞)。 ②各部は動詞として記載してください。すなわち、画像データを取得する取得部=obtain image dataとなります。

[Claim 1]
An image processing device comprising: processing circuitry configured to obtain image data, store the image data, and perform image processing on the stored image data.
★Perfect。段落が消えているが調整用のルールを追加すれば良いだろう。

総評

おわかりいただけただろうか?
ルールさえしっかり作りこめばChatGPTは請求項を翻訳どころか、アメリカ判例に基づく出願クレーム作りすら可能なのである。

さらに、従属クレームも複数あった場合、
「マルチ従属クレームは最上位クレームに従属するように修正してください」とルールを追加すれば、きちんとClaim1-3としていたものをClaim1に従属するように修正するのである。
※1回目はダメでも、同じルールを繰り返し入力すると反映される。

これはさすがに痺れる。

翻訳者に必要なテクニックが、いかにアメリカ判例を読み込んで適切なプロンプトを入力するかになる、そんな日が来るかもしれない。

とはいえ、今はまだ翻訳者の頭の中のルールの方がはるかに多く、言語化が難しい知見も多い。
したがって、すぐにChatGPTを使って翻訳とはならないだろう。

そもそもの日本語が英語翻訳に適さない場合も非常に多い。
今回はかなり単純なクレームであったため成功した面も大きい。
そのあたりの知見もあるのだが、諸事情によりそこは書くのが憚れる。

だが、ChatGPTと特許翻訳専用ツール、日本語チェックツールを組み合わせ、最悪の場合は誤訳訂正も覚悟すれば、年間1-2億円の翻訳費用の削減が可能かもしれない。

最後に、誤解を生んでしまったかもしれないので述べるが、ChatGPTは翻訳精度が高いのではない。
翻訳ルールを教え込める、そのことに価値があるのだ。


そこに、夢があると思わないか?



….まぁ翻訳者にとっては悪夢かもしれないが。




※実は上記はかなりChatGPTの性能が良く見えるように記載している面もあります。最後に記載した通り、そもそもの日本語がクソだと英語もクソになるのは当たり前で、そこを人間翻訳では想像で補っていたりします。そのあたりの補填はChatGPTも可能ではあるのですが、あまりにルールが膨大になる&新規性追加のラインを教え込むのが難しいこともあり、一定の人間翻訳はまだまだ必要だなーというのが所感です。
※翻訳精度が高いというより、翻訳ルールを教え込める、というのがChatGPTの本質的な価値というのが現段階の個人的な結論です。翻訳ルールを大量に言語化する必要があるため、なかなか個人では難しいですが、そのうち特許翻訳特化のChatGPT使いこなし企業さんも出てくるかな?と期待。
※コストの話ばかりしていますが、もちろんクオリティも重要&日本語との相性の悪さもあって、導入されるのは早くて2年後、遅ければ5年後かなと予想。熱意ある担当者が中にいれば半年後だろうけど、そんなにいないと思う。
※実はトークン数の限界があるので、明細書翻訳をさせるのはかなり面倒だったりする。それが一番の課題かもしれない。


この記事が気に入ったらサポートをしてみませんか?