機械翻訳の出力文を効果的に活用するとは？

私は、翻訳者のためのニューラル機械翻訳支援ツール「GreenT」の開発を通じて、翻訳者にとっての翻訳の効率向上について研究をしています。

すでに、翻訳者が機械翻訳を使って効率化できる場合とそうでない場合があることは多くの翻訳者や研究者が指摘しているのですが、どのような場合に効率化できるでしょうか。

大雑把に言うと、機械翻訳の出力文を使い、少ない編集作業で翻訳者（クライアント）が求める訳文を作れるのであれば、機械翻訳を使ってよかった！と言えると思います。つまり、機械翻訳を使って効率が上がったというわけです。

そうでない場合、機械翻訳なんて使えない！ということになります。

翻訳者にとっての「編集工数が少ない場合」というのはどのような場合なのでしょうか。

私は以下の2つの条件を満たす出力文が得られる場合だと思っています。

このような訳文が出力された場合、翻訳者は文脈を考慮して接続詞を検討したり、言葉を追加したり（削除したり）、言い回しを変えたりするだけで目指す訳文に近づけられることがあります。

上記の2つが満たされていない場合、係り受けの修正のために言葉の順序を変更しなければならなかったり、訳語を書き換えなければならなかったりと、少し面倒な作業が発生します。

そのようなわけで、私はGreenTの使い方の説明で「編集しやすい訳文」「利用しやすい訳文」と表現する場合、上記の2つの項目をイメージしています。

さらに言うと、以下のような場合、修正作業は非常に少なくなります。

編集工数が少なくなりますから効率化できると思います。

通常のニューラル機械翻訳では、原文の書き方や翻訳エンジンの癖により出力される訳文は勝手に決められてしまいます。

なので、訳文が出力されるまで何の働きかけもできません。つまり、翻訳者のノウハウが生かしにくいということなのです。

しかし、GreenTでは「プリエディット機能」、「用語集の適用機能」、「ポストエディット機能」、「原文を意味で区切り翻訳する方法」などにより、上記2つを満たす訳文を出力するように工夫ができるのです。

やみくもに用語集を使ったりプリエディットをするのではなく、目指す訳文を念頭に置きどのように操作したらほしい訳文の構文に近づくのかを考えながら各種機能をいじるという感覚です。

このような視点であれば、以下の記事の意味を理解できると思います。

また、よくある誤訳については自動処理で修正しています。

このように、編集しやすい出力文を積極的に取得することで、編集作業を最小化できるのです。これが機械翻訳を使う上での効率化の要であると思います。

あと、重要なのは、機械翻訳の出力文を無理やり使わないということです。また、原文をいじり倒して出力文が変化するのを楽しみ過ぎないということです。

あくまでも、私たちはクライアントが求める品質の訳文を期限内で提供することが仕事です。原文を読みやすくきれいに編集しても訳文が間違っていたら意味がありません。

時間をかけるべきところは訳文作成です。「機械翻訳の出力文を使ってやってもいい」というくらいのスタンスでいいと思います。

翻訳メモリを活用できるのであれば、翻訳メモリを優先したほうがいいかもしれませんし、駄文が出てきたらすぐに捨てる、というくらいでいいと思います。

GreenTを使うと、自分の工夫を次の翻訳に活かせますので、機械翻訳との付き合いが少しだけ面白くなります。何らかの工夫により効率化できれば翻訳品質の向上につながりますし、翻訳文字数の向上にもつながります。

翻訳作業を楽しく創造性に富んだ作業にするために、何かしらのツールを使って工夫していくことは大切だと思います。