一括置換を用いた翻訳(上書き翻訳)支援用のアドイン「ぱらぱら」 について、久しぶりのサポート記事です。
ワイルドカード(Wordの正規表現)の辞書の作り方を少しご紹介します。
特許を例に示しますが、他の分野でも応用ができますので、エッセンスを参考にしてください。
<目次>
今回の置換で目指すこと
「請求項1~請求項3の何れか1つに記載の」という特許の請求項特有の記載を、
「according to any one of claims 1 to 3 」と置換します。
請求項○の数字がどのような数字であっても対応できるようにワイルドカードを使うというわけです。
上記では、青い数字と赤い数字がそれぞれ対応するように置換します。
手順
1.まず、ぱらぱらで、全角数字を半角数字に置換します。
これは大変重要です。
記載にゆれがあると、条件式をつくるときに考慮しなければならなくなるため、「対象の文書中の数字はすべて半角である」とう状況を自分で設定します。
日本語入力時に、テンキーを使うと半角数字で入力できますが、キーボードのアルファベットの上段にある数字キーを押すと全角の数字が入力されますよね。
なので、日本語文書中には、つねに全角と半角の数字が混ざっているという前提で取り扱うのが基本です。
以下の記事をご覧ください。
2.辞書を作ります。
ワイルドカードのルールをご理解いただいていると、ある程度読めると思いますが、以下のように設定します。
検索する文字列:請求項([0-9]{1,})~請求項([0-9]{1,})の何れか1つに記載の
置換後の文字列:according to any one of claims \1 to \2
注意点としては、"according to any one of claims \1 through \2 "というように、\2の後には半角スペースが入ります。
また、数字はすべて半角数字ですね。
3.さらに発展させます。
特許では、ご存知のように同じような表現が使われていますよね。
どうせなら、似た表現の辞書も作ってしまいましょう。
たとえば、こんなバリエーションがあります。
請求項1~請求項3の何れか1つに記載の
請求項1ないし請求項3の何れか1つに記載の
請求項1乃至請求項3の何れか1つに記載の
請求項1から請求項3の何れか1つに記載の
請求項1~請求項3の何れか1項に記載の
請求項1ないし請求項3の何れか1項に記載の
請求項1乃至請求項3の何れか1項に記載の
請求項1から請求項3の何れか1項に記載の
請求項1~請求項3の何れか一つに記載の
請求項1ないし請求項3の何れか一つに記載の
請求項1乃至請求項3の何れか一つに記載の
請求項1から請求項3の何れか一つに記載の
請求項1~請求項3の何れか一項に記載の
請求項1ないし請求項3の何れか一項に記載の
請求項1乃至請求項3の何れか一項に記載の
請求項1から請求項3の何れか一項に記載の
実際には、もっとたくさんありますよね。
「何れか」が、「何れかの」や「いずれか」や「いずれかの」になっていたりしますからね。
これだけで、あと48個パターンも増えます。
「検索する文字列」のパターン例
みなさんなら、ひとまず上記の16パターンに対して、どういう辞書を作りますか?
私は4つの検索式にしました。
無理をして知恵を絞って数を減らさなくてもいいかなと思います。
あと、自分が何を意図してワイルドカードを作ったのかわかりやすいようにして置いた方がいいでしょう。
バリエーションとして、「検索する文字列」には以下のような検索式が用いられます。
置換後の文字列は、上記と同じものを利用できます。
請求項([0-9]{1,})~請求項([0-9]{1,})の何れか[一1][つ項]に記載の
請求項([0-9]{1,})ないし請求項([0-9]{1,})の何れか[一1][つ項]に記載の
請求項([0-9]{1,})乃至請求項([0-9]{1,})の何れか[一1][つ項]に記載の
請求項([0-9]{1,})から請求項([0-9]{1,})の何れか[一1][つ項]に記載の
これを、案件ごとにヒットしなかったパターンを1回1回つぶしていけば、どんどん辞書がたまっていきます。