先日のワイルドカードセミナーの演習にて、特許明細書を例にお話をしました。
その時に、「段落番号(【0001】、【0002】など)の直前のスペースを削除する」というクイズをしました。
このクイズのまとめ記事です。
例に用いた日本語の特許明細書では、全角の4桁数字が墨付き括弧で囲まれています。
この段落番号は、段落先頭に記載されており、墨付き括弧の直後に改行されています。
つまり、1段落になっているわけです。
でも、部分的に、墨付き括弧の直前にスペースが入っているので、それをきれいに削除しましょう、という課題でした。
特許明細書をご存知でない方には少しわかりにくい課題でしたが、「段落番号」を記号としてとらえていただき、ワイルドカードの使い方を検討いただきました。
<目次>
原稿
段落番号の直前にスペースが空いていますね。
ゴール
以下のように変換できたらいいなと思っています。
方法
1.編集記号をすべて表示します。
まずは、スペースが何なのかを確認します。
段落先頭のスペースが意味するものを確認する必要があるからです。
半角スペース、全角スペース、タブ、インデントがありますよね。
私は、翻訳をする際にも、編集記号をすべて表示することをお勧めします。
実はこんなふうになっていました。
不自然な感じですが(笑)。クイズなのでしょうがないです。
実務レベルでもありうることを少し強調いたしました。
2.検索式、置換式を作ります。
スペースにもいろいろあるんだなと思って、以下のような式を作りました。
半角スペースを _ で示し、全角スペースを □ で示しました。
検索する文字列 [_□^t]{1,}(【[0-9]{1,}】) 置換後の文字列 \1
一括置換をする場合には、置換後の文字列に蛍光ペンをつけるといいですね。
上記にさらに、「段落番号が段落先頭に記載されていること」を検索条件にいれてもいいですね。今回は割愛しました。
完璧でなくてもいいです。
ワイルドカードの置換1回だけですべて解決しようなんて思わなくてもいいです。
3回、4回にわけて実行すればいいと思います。
自分が欲しい結果を、限られた時間の中で実現できればそれでいいですよね。
ワイルドカードの検索式を考えるのが難しかったら、手作業でスペースを削除すればいいわけですし。
一部分でもワイルドカードを使えたら、まずはそれで十分です。
まずは、ワイルドカードの検索や置換を使ってみること、そしてうれしさを実感いただくこと、そこから始まると思います。
関連記事
特許の「段落番号」直前のスペースを削除する置換(その2) 今回の記事の続き