用語集に頼りすぎると、機械翻訳が自然な訳文を出力できないことがあります。用語集の語句が訳文の可能性を狭めてしまうからです。
「出力された訳文の用語を修正する方法」でも説明しているとおり、用語集を用いることで訳文が劣化することがあります。
この記事では、用語集を用いることで翻訳エンジン(DeepL)の持っている力を引き出せなかった例を紹介します。
なお、用語集を積極的に使うのは、翻訳エンジンでは出てこないような特殊な専門用語や造語を使う場合です。特許翻訳ではよい結果になると思います。
2022年8月12日現在の翻訳結果です。
動詞で訳しうる箇所を名詞で訳してしまう
日英翻訳の例を紹介します。
原文:次にネットを用いた博士論文の検索方法について説明します。 |
上記の原文に対して、以下の2つの語句を用語集に登録しました。
博士論文:doctoral dissertations 検索:search |
用語集を用いたDeepLの翻訳結果は以下の通りです。赤文字に用語集を適用しています。用語集に登録した語句は必ず名詞句として訳出されますので、このような結果になりました。
訳文:Next, we describe the search method for doctoral dissertations using the net. |
同じDeepLでも用語集を用いずに翻訳をすると以下のようになります。この場合には、用語集はQAチェックにのみ用いられます。
この出力結果では、searchが動詞として使われています。原文の「検索方法」を「どのように検索するのか」と訳しているわけです。
訳文:Next, we will explain how to search for doctoral dissertations using the Internet. |
用語集に動詞に訳しうる語句を登録すると名詞として訳されます。その結果、品詞の変換のない「いかにも機械翻訳」な訳文が出力されるかもしれません。
好みの訳文が出力されない場合には、上記のように[用語集]チェックをオフにして訳文を取得するといいかもしれません。
別の言葉に訳しうる箇所を用語集の訳語に特定してしまう
今度は、用語集で定義した訳語が文脈によっては文意からずれてしまう例です。
原文:デジタル資料の科学技術論文 |
以下の用語集が設定されています。
資料:document |
この場合、以下の訳文が出力されました。これは誤訳ですね。なんだか意味が分かりません。「資料」を「document」として訳出してしまうと不自然になる例です。
訳文:Digital document scientific and technical papers |
文脈により訳語が変わりうる語句は用語集に登録する場合には工夫が必要です。登録をしないほうがいいかもしれません。登録する場合には、複数の訳語を用意しておき、その都度適用するか否かを判断する必要があります。
(参考:複数の候補から訳語を選択する)
また、1語の語句は複合語になり訳語が変わることが多いため、1語の語句も用語集に含めないことをお勧めします。
今度は、用語集を用いずにDeepLで訳してみます。以下のように意図する出力が得られました。
訳文:Scientific and technical papers in digital format |
用語集の適用は訳文を見ながら決めるとよいと思います。