出力された訳文の用語を修正する方法

用語集の適用機能を使わないほうがいい場合もある

ニューラル機械翻訳(NMT)では通常は用語集の適用が難しいとされています。大量のコーパス(原文と訳文の対)を用意して翻訳エンジンをトレーニングすると専門用語が正確に適用されることがあります。

このような翻訳エンジンのトレーニングには特殊な処理が必要です。GreenTでは様々な分野のユーザーさんに使っていただく翻訳エンジンを提供しているため、このような専門用語を覚えさせるようなトレーニングは実施していません。

そこで、翻訳エンジンのトレーニングなしで手持ちの用語集を反映する場合には、GreenT内で特殊な処理をして用語を適用させています。別の言い方をすると、原文と訳文を処理をして無理やり訳語を当てはめています

そのため、場合によってはNMTの出力性能が低下することがあります。たとえば、文が途中で切れてしまったり、係り受けが不自然になってしまったり。

(参考:用語集を使わないほうがよい例

特に、多くの用語を適用する場合に訳文の構造が壊れることがあります。

そこで、用語集をチェックにのみ用いて、出力された訳文を後処理(ポストエディット)で修正する方法を紹介します。この方法を用いると、NMTの訳文出力の能力を最大限に引き出しつつ、用語も正確に適用できるようになります。

用語集の適用機能を使わない出力例

DeepLの翻訳機能を用いて説明します。Googleの場合には、[T3]タブを利用します。考え方や操作方法はGoogle翻訳の場合でもDeepLの場合でも同じです。

今回、日英翻訳の例を紹介しますが、英日翻訳でも同じことができます。

まずは用語集を適用せずに普通に翻訳をしてみます。用語集欄に表示された用語は、チェックにのみ利用できます。

用語集を利用しない場合には、[DeepL]タブ[用語集]チェックをオフにして[GreenT]ボタンをクリックして翻訳をします。

すると以下のように訳文が出力され、同時に用語集の適用チェック結果が右側に表示されます。

さすがに、Wordで動く翻訳チェックソフトの名称「色deチェック」は機械翻訳では出力されません。英語名は「Iro de Check」なんですが、「Color de Check」と出力されました。

このチェック結果に基づき、訳文の用語を修正します。

2つの修正方法を紹介します。

手作業で修正

手作業で修正する場合には、[Alt]+[B]のショートカットキーで訳語候補を表示させて選択して入力してください。文字を手入力するのは誤入力の原因になりますし、何より時間がかかりますから極力やめましょう。GreenTでは用語集の言葉や数字、単位は自動入力できます。

(参考:ショートカットキー

では、具体的に説明します。まず、修正対象を選択します。

[Alt]+[B]のショートカットキーで訳語候補を表示します。

マウスで選択するか、矢印キー[Enter]キーで選択すると、修正対象箇所(今回はColor de Check)の位置に選択した用語(今回はIro de Check)が挿入されます。

ポストエディット機能で修正する方法

GreenTのポストエディット機能を使うと、間違った表現を正しい表現に自動的に修正できます。ただし、処理対象の項目を1つずつ登録する必要があります。

以下、今回の誤訳箇所「Color de Check」を正しく「Iro de Check」に修正する方法を紹介します。

修正対象を選択して[登録]ボタンをクリックします。

選択されている文字列がポストエディットの登録画面に自動入力されます。

変換後のドロップダウンのボタンをクリックしてリストを表示します。ここに、用語集に登録されている言葉が表示されますので選択します。

翻訳エンジンが出力する訳文に「Color de Check」が出てきたら自動的に「Iro de Check」に変換できるように登録します。

この場合には、以下のように[自動変換を使用する]チェックをオンにして[自動変換に登録]ボタンをクリックします。

これで、訳文の用語が置換されて、またこの用語がポストエディットの自動変換項目に追加されました。

上記のように訳文の誤訳箇所を自動修正するのではなく、確認をしながら修正もできます。このように個別に判断をしながら変換する場合には[個別変換に登録]ボタンをクリックしてください。

このポストエディットによる「自動変換」と「個別変換」についての詳しい説明は以下の記事をご覧ください。

(参考:ポストエディットの項目の登録と自動化

修正後のチェックをお忘れなく

訳文を修正した後には、必ず[QA]ボタンをクリックしてQAチェックを行ってください。

関連ページ

GreenTの使い方

用語集を使わないほうがよい例

訳文のポストエディット例(英日翻訳)

ポストエディットの項目の登録と自動化

DeepLの利用方法

2020年5月18日