前回の「特許明細書の段落番号の処理(ワイルドカードの活用)その2」に続きます。
ワイルドカードって奥が深くて面白いですね。
しかも、ひとりで考えていてもなかなかアイディアの幅が拡がりませんが、他の方の方法を見てたくさん学ぶところがあります。
なので、私もそうやって教えていただいたことを紹介させていただき、またフィードバックがかかることを期待しつつ(笑)、他の方へのヒントになればいいなと思っています。
さて、前回紹介した検索する文字列には限界があります。
実は、あの書き方だと、段落番号の直後には、改行記号が必ずあって、さらにその次にはかならず半角スペースが1つなければ検索されません。
もし、以下のように記載に揺れがある場合には、検索対象から外れてしまいます。
つまり、上の例でいくと、段落番号の次の段落の先頭に半角スペースがありません。
下の例の場合、段落番号の直後に半角スペースが3つ入っており、その後改行になっています。
このような場合には、以下のような検索式で対処できます。
検索式
検索する文字列:\[([0-9]{4})\][^13_]{1,} 置換後の文字列:[\1]^t
(注:上記で^13の後の _ は半角スペースを示しています。)
前回と比較して、検索する文字列だけ変更いたしました。
スクウェアブラケットで囲まれた半角4桁数字の直後に、1つ以上の(改行かスペース)の固まりが続くものを検索対象としています。
まずは使ってみてください。
完璧なワイルドカードの検索式や置換式を書けなくていやになる気持ち、ありますよね。
私もずっとそうでした。でもあんまり気にしなくてもいいと思います。
後で目視確認するときに気がつくので大丈夫です。
決して無責任なコメントではありません。ワイルドカードの不完全性に目を向けて使わない、というのはもったいないので、こう思っています。
手作業で1つ1つやると果てしなく時間がかかることを、ワイルドカードを使えばかなり短時間で済ませることができます(一括置換であれば一瞬です。1つ1つ確認しながらやっても速いです)。
まずは使ってみて、ワイルドカードのくせに気がつく必要がありますね。特に、ウェブに掲載されているような人が作ったものについては。
ちょっと得したなぁと思いながら、また、検索式を読んでパズルを解くような感じも楽しみながら、ワイルドカードをご利用ください。