見出し画像

特許の公報番号の番号体系を変換(トランケーション)するためのChatGPT活用Tips


特許読解アシスタント「サマリア」

複数のデータベースを活用していると、公報番号の番号体系が相違していてたりして不便なことありますよね?

公報番号の番号体系の変換は「トランケーション」などとも呼ばれており結構煩雑な作業です。

従来は、Excelなどで自分自身でExcel関数を作成して変換されている方も多かったと思います。

ChatGPTを活用することでこのトランケーションを簡単に行わせることができます。

今回、お客様より他のデータベースからの公報番号をサマリアに入力したいとの問合せがあり、まさにChatGPTが得意とするタスクだったので記事を作成しました。

サマリアの公報番号体系は以下のようになっており、JPlatPat等をベースにした番号体系となっています。

サマリアの公報番号体系
https://patent-i.com/summaria/manual/database

今回、Orbit社の公報番号体系との変換作業をChatGPTに行わせてみましょう。

サマリアの公報番号体系

特開2020-049824
特開2021-023154
特表2020-500001
特許6675128
特許6834412
USA2004/000234
USP10610241
USP10907852
EPA3798445
EPA3803992
EPB3643057
EPB3415879

サマリア「番号体系」

Orbit公報番号体系

JP2020-049824A
JP2021-023154A
JP2020-500001A
JP6675128B2
JP6834412B2
US2004000234A1
US10610241B2
US10907852B2
EP3798445A1
EP3803992A1
EP3643057B1
EP3415879B1

Orbit「番号体系」

ChatGPTへ入力するプロンプト例

ChatGPTへは、以下のようなプロンプトを入力します。なお、今回のタスクは複雑な自然言語タスクではないためGPT3.5でも十分に良好な回答結果が得られています。

以下のプロンプトの<変換したい公報リストを入力>の部分に変換したい公報番号(今回はOrbitのリスト)を入力します。なお、件数が多い場合も考慮して「変換するためのExcel関数」も提案させています。

公報番号の番号体系を変換するプロンプト

#変換前:
JP2020049824A
JP2021023154A
JP2020-500001A
JP6675128B2
JP6834412B2
US2004000234A1
US10610241B2
US10907852B2
EP3798445A1
EP3803992A1
EP3643057B1
EP3415879B1

#変換後:
特開2020-049824
特開2021-023154
特表2020-500001
特許6675128
特許6834412
USA2004/000234
USP10610241
USP10907852
EPA3798445
EPA3803992
EPB3643057
EPB3415879

#変換前:
<変換したい公報リストを入力>

#変換後:

#変換するためのExcel関数も提案してください。

今回は一例として、<変換したい公報リスト>に以下の公報番号を入力します。

JP2008528260A
JP4510096B2
US20080138888
US7659108B2
ChatGPTの回答結果

実際に使用したプロンプトも参考に以下に添付します。

番号変換に利用したプロンプト

他のデータベース間の公報番号変換への活用方法

もちろん、上に記載したプロンプトは「Orbit」→「サマリア」の番号変換のプロンプトですが、最初に記載した「#変換前:」「#変換後:」の箇所の番号ペアを、任意のデータベースに合わせて書き換えれば、任意のデータベース間の公報番号変換に適用することができます。

このように、ChatGPTに代表される生成AIは公報番号の変換のように比較的単純なタスクであるものの明示的に「ルール化」することが煩雑なタスクを効率的にこなすことができます。

公報番号の変換作業に手間取った場合は、是非上記プロンプトを活用してみてください。

この記事が気に入ったらサポートをしてみませんか?