【機械翻訳】愚直なGoogle翻訳と考えすぎなDeepL翻訳

2020年12月17日

いくつか例文を用いて、Google翻訳とDeepL翻訳の出力傾向の違いを紹介します。

私が開発するニューラル機械翻訳支援ツール「GreenT」で機械翻訳を使うのであれば、私はGoogle翻訳の方が使いやすいと感じます。Google翻訳のほうが原文編集をした際の出力を予測しやすいので内容を確認したり修正しやすいと感じます。

(参考)GreenTの原文編集(プリエディット)方法

GreenTのユーザーさんでも意見が分かれます。Google翻訳に使い慣れているのでDeepL翻訳の出力よりも扱いやすいという方がいます。一方でDeepL翻訳のほうが使いやすいという方もいます。慣れや、分野、お客さんの要求品質も関連しているでしょうから、画一的な見解はないと思います。そうすると「好みの問題」とひとくくりになってしまいそうです。

翻訳サイトを利用する友人の意見を聞いてみると、外資系企業に勤める友人やメーカーで英語の論文を書く技術者の友人には、DeepL翻訳の出力のほうが好きだという方がいます。Google翻訳よりも流暢な感じ(日本語らしい、英語らしい表現)というのがその理由です。

みなさんはどう感じますか?

どちらを仕事のパートナーに選ぶのか

2020年12月現在では、Google翻訳は原文の表記の違いを比較的正直に訳文に反映するように感じます。それに対して、DeepL翻訳は原文の表記の違いに過敏に反応するように思います。言い換えると、「愚直なGoogle翻訳」と「考えすぎなDeepL翻訳」という感じでしょうか。

私たち翻訳者がこれらの機械翻訳エンジンと向き合うときには、どちらのタイプならパートナーとして気持ちよく仕事を一緒にできるのか?ということです。場合に応じて両方をパートナーとしてもいいと思いますし、どちらも使いたくないというのもありうる回答だと思います。翻訳対象によって使い分けるのかもしれません。

翻訳実務で使うなら「編集しやすい訳文」であることを重視

本記事では2020年10月と12月のウェブ版の翻訳エンジンでの出力結果において、どのような誤訳があるのかを紹介します。特徴がよく表れている例を取り上げました。そのため、他のすべての文で同じような誤訳になるとは限りません。将来的には傾向が変わるかもしれません。よって、各自で専門分野の文章を使ってお試しください。

1文ずつ翻訳をする場合、つまり、GreenTやCATツール(Trados、Memsource、memoQなど)で機械翻訳を利用する場合には、前後の文脈は一切考慮せずに1文だけの文字情報から訳文を出力していますので誤訳は当然ながら発生します。翻訳者でも1文だけ見せられた場合には、正確に翻訳できないこともありますから。

他の記事「機械翻訳の出力文を効果的に活用するとは?」でも説明している通り、私は機械翻訳の出力を翻訳者が「編集しやすい文であるのかどうか?」基準にして評価しています。そして、「編集しやすさ」を「構文を正確にとらえた訳文であるのかどうか」で判断しています。構文を正確にとらえられていない訳文の場合、係り受けがごちゃごちゃになっており編集しにくくなる傾向があります。

また、私は「機械翻訳は専門用語を間違える」という点はあまり気にしていません。専門用語の誤訳に関しては、GreenTで用語集の適用をすれば回避できる可能性が高いですから。機械翻訳の訳語を用いるよりは、通常の翻訳と同様、自分で調べた用語を使うという姿勢で臨むほうが翻訳者にとっては気持ちがいいと思います。

DeepL翻訳がプリエディットで使いづらい3つの理由

DeepL翻訳ではプリエディットをしづらいと感じます。その理由は、DeepL翻訳が出力する訳文の変化の予測が困難だからです。このように思う理由を3つ紹介します。1文単位の翻訳における特徴です。

1.DeepL翻訳は和文の文頭の記号の変化に敏感

■DeepL翻訳

文頭の数字の表記により訳文の構文自体が変化していますし、数字の訳抜けも目立ちます。なお、構文の変化は必ずしも誤訳ではありません。訳文の構文の予測をしにくいという点においてデメリットだと私はとらえています。

■Google翻訳

文頭に数字の有無では訳文の構文にあまり変化がありません。

(2020年12月12日)

先頭行の表現と異なる箇所を赤文字にしました。

原文 DeepL翻訳(考えすぎ) Google翻訳(愚直)
本契約により、NITとの特別な取り決めがない限り、お客様は、一ライセンスにつき一台のコンピュータ上で本ソフトウェアを使用することができます。 This Agreement allows you to use the Software on one (1) computer per license, unless otherwise agreed with NIT. This agreement allows you to use the software on one computer per license, unless otherwise agreed with NIT.
本契約により、NITとの特別な取り決めがない限り、お客様は、一ライセンスにつき一台のコンピュータ上で本ソフトウェアを使用することができます。 (i) This Agreement allows you to use the Software on one (1) computer per license, unless otherwise agreed with NIT. (1) This agreement allows the customer to use this software on one computer per license unless otherwise agreed with NIT.
1. 本契約により、NITとの特別な取り決めがない限り、お客様は、一ライセンスにつき一台のコンピュータ上で本ソフトウェアを使用することができます。 Unless otherwise agreed with NIT, you may use the Software on one (1) computer per license. 1. This Agreement allows you to use the Software on one computer per license, unless otherwise agreed with NIT.
1.本契約により、NITとの特別な取り決めがない限り、お客様は、一ライセンスにつき一台のコンピュータ上で本ソフトウェアを使用することができます。 This Agreement permits you to use the Software on one computer per license, unless otherwise agreed with NIT. 1. 1. This agreement allows you to use the software on one computer per license, unless otherwise agreed with NIT.
1.本契約により、NITとの特別な取り決めがない限り、お客様は、一ライセンスにつき一台のコンピュータ上で本ソフトウェアを使用することができます。 1. This Agreement allows you to use the Software on one (1) computer per license, unless otherwise agreed with NIT. 1. This Agreement allows you to use the Software on one computer per license, unless otherwise agreed with NIT.

同様に文頭に数字や記号を追加し、さらに言葉を変化(「ニューラル機械翻訳(NMT)」→「統計的機械翻訳(SMT)」)させて訳文の変化を検証しました。この例でも、DeepL翻訳訳抜け構文の変化が見られました。

(2020年10月26日)

先頭行の表現と異なる箇所を赤文字にしました。

和文 DeepL翻訳(考えすぎ) 翻訳Google(愚直)
GreenTは、翻訳者のためのニューラル機械翻訳(NMT)による翻訳支援ツール(Wordアドイン)です。 GreenT is a neural machine translation (NMT) translation aid tool (Word add-in) for translators. GreenT is a translation support tool (Word add-in) by Neural Machine Translation (NMT) for translators.
GreenTは、翻訳者のためのニューラル機械翻訳(NMT)による翻訳支援ツール(Wordアドイン)です。 GreenT is a translation assistance tool (Word add-in) using Neural Machine Translation (NMT) for translators. GreenT is a translation support tool (Word add-in) by neural machine translation (NMT) for translators.
GreenTは、翻訳者のためのニューラル機械翻訳(NMT)による翻訳支援ツール(Wordアドイン)です。 GreenT is a translation assistance tool (Word add-in) using Neural Machine Translation (NMT) for translators. GreenT is a translation support tool (Word add-in) by neural machine translation (NMT) for translators.
1.GreenTは、翻訳者のためのニューラル機械翻訳(NMT)による翻訳支援ツール(Wordアドイン)です。 GreenT is a neural machine translation (NMT) translation aid tool (Word add-in) for translators. 1. 1. GreenT is a translation support tool (Word add-in) by Neural Machine Translation (NMT) for translators.
[1] GreenTは、翻訳者のためのニューラル機械翻訳(NMT)による翻訳支援ツール(Wordアドイン)です。 1] GreenT is a neural machine translation (NMT) translation assistance tool (Word add-in) for translators. [1] GreenT is a translation support tool (Word add-in) by Neural Machine Translation (NMT) for translators.
[A] GreenTは、翻訳者のためのニューラル機械翻訳(NMT)による翻訳支援ツール(Wordアドイン)です。 A] GreenT is a neural machine translation (NMT) translation aid tool (Word add-in) for translators. [A] GreenT is a translation support tool (Word add-in) by Neural Machine Translation (NMT) for translators.
[L] GreenTは、翻訳者のためのニューラル機械翻訳(NMT)による翻訳支援ツール(Wordアドイン)です。 L] GreenT is a neural machine translation (NMT) translation assistance tool (Word add-in) for translators. [L] GreenT is a translation support tool (Word add-in) by Neural Machine Translation (NMT) for translators.
GreenTは、翻訳者のためのニューラル機械翻訳(NMT)による翻訳支援ツール(Wordアドイン)です。 GreenT is a translation assistance tool (Word add-in) using neural machine translation (NMT) for translators. -GreenT is a translation support tool (Word add-in) by neural machine translation (NMT) for translators.
GreenTは、翻訳者のためのニューラル機械翻訳(NMT)による翻訳支援ツール(Wordアドイン)です。 GreenT is a translation assistance tool (Word add-in) using Neural Machine Translation (NMT) for translators. GreenT is a translation support tool (Word add-in) by neural machine translation (NMT) for translators.
GreenTは、翻訳者のためのニューラル機械翻訳(NMT)による翻訳支援ツール(Wordアドイン)です。 GreenT is a translation assistance tool (Word add-in) using Neural Machine Translation (NMT) for translators. (1) GreenT is a translation support tool (Word add-in) by neural machine translation (NMT) for translators.
GreenTは、翻訳者のためのニューラル機械翻訳(NMT)による翻訳支援ツール(Wordアドイン)です。 GreenT is a translation support tool (Word add-in) with neural machine translation (NMT) for translators. GreenT is a translation support tool (Word add-in) by neural machine translation (NMT) for translators.
GreenTは、翻訳者のための統計的機械翻訳(SMT)による翻訳支援ツール(Wordアドイン)です。 GreenT is a statistical machine translation (SMT) translation aid tool (Word add-in) for translators. GreenT is a CAT tool (Word add-in) by Statistical Machine Translation (SMT) for translators.
GreenTは、翻訳者のための統計的機械翻訳(SMT)による翻訳支援ツール(Wordアドイン)です。 GreenT is a translation assistance tool (Word add-in) using Statistical Machine Translation (SMT) for translators. GreenT is a translation support tool (Word add-in) by statistical machine translation (SMT) for translators.
GreenTは、翻訳者のための統計的機械翻訳(SMT)による翻訳支援ツール(Wordアドイン)です。 (1) GreenT is a statistical machine translation (SMT) assisted translation tool (Word add-in) for translators. (1) GreenT is a translation support tool (Word add-in) by statistical machine translation (SMT) for translators.

2.DeepL翻訳は、英文のアルファベットの大文字・小文字の変化に敏感

単文の文中の大文字・小文字を変化させてみました。

■DeepL翻訳

訳文の言い回しが変化します。

■Google翻訳

全く変化しません。

以下の例文のDeepL翻訳では、すべての大文字にすると大きく変わりましたが、文頭の1文字だけを変化させても訳文が変化しました。

(2020年12月12日)

原文 DeepL翻訳(考えすぎ) Google翻訳(愚直)
What brought you here? どうしてここに来たの? どうしてここに来たの?
WHAT BROUGHT YOU HERE? 何があなたをここに連れてきたの? どうしてここに来たの?
what brought you here? 何しに来たの? どうしてここに来たの?
What Brought You Here? どうしてここに来たの? どうしてここに来たの?

文頭のWを小文字にした場合と文中の単語が変化(Windows→Mac)した場合の訳文の変化を見てみます。この場合も、DeepL翻訳は訳文の言い回しが変化しました。

(2020年12月12日)

原文 DeepL翻訳(考えすぎ) Google翻訳(愚直)
What brought me back to Windows was when I had my first child. 私がWindowsに戻ってきたのは、第一子を出産した時でした。 私をWindowsに戻したのは、最初の子供が生まれたときでした。
what brought me back to Windows was when I had my first child. 私がWindowsに戻ってきたのは、最初の子供が生まれ時でした。 私をWindowsに戻したのは、最初の子供が生まれたときでした。
What brought me back to Mac was when I had my first child. 私がマックに戻ってきたのは、第一子を出産した時でした。 私をMacに戻したのは、最初の子供が生まれたときでした。
what brought me back to Mac was when I had my first child. 私がマックに戻ってきたのは、最初の子供を産んだ時でした。 私をMacに戻したのは、最初の子供が生まれたときでした。

(Mac OS X for Windows Users: A Switchers' Guide 書籍からの一文を引用)

ちなみに、この1文だけでは書き手の性別がわからないのですが、男性の場合には「●●●が生まれた」という表現のほうがいいかもしれません。こうすれば性別に関係なく訳文を使えます。

文脈によりますが、こなれた訳にするならば「一人目が生まれたことがきっかけで、Windowsをまた使い始めました。」のような表現にできると思います。

3.DeepL翻訳は、言葉を追加したときに出力の変化が大きい

以前の記事「【機械翻訳】DeepL翻訳とGoogle翻訳の性能を比較(その2)」でも紹介したように、DeepL翻訳では言葉を追加すると言い回しが大きく変化する事例がありました。

今回の出力では、上記記事を8月に公開した際の訳文からGoogle翻訳で「少数派」が「マイノリティ」に変化していました。DeepL翻訳は同じ訳文を出力しました。

(2020年12月12日)

原文 DeepL翻訳(考えすぎ) Google翻訳(愚直)
It was a salutary experience to be in the minority. 少数派であることが救いでした。 少数派であることは有益な経験でした。
It was a new and salutary experience to be in the minority. 少数派であること改めて実感しました マイノリティにいることは、新しくて有益な経験でした。

DeepL翻訳をどう活用するのか?

以上、原文の違いで訳文がどう変化するのか例を紹介しました。DeepL翻訳は原文の小さな違いが出力される訳文に大きな違いを生むことがあるため、「GreenT」でプリエディットをして訳文を調整しようとすると使いづらいと感じる場合があります。

(参考)GreenTの原文編集(プリエディット)方法

なので、「GreenT」ではプリエディットよりはポストエディットを中心に訳文を修正したほうがいいのかもしれません。

(参考)GreenTの訳文編集(ポストエディット)方法

DeepL翻訳を利用する場合、文脈を考慮できるというDeepL翻訳の特徴を活かすのであれば、前後の文章が入る状態(複数の文を一度に訳す場合)がいいのかもしれません。今回の記事では、1つの文の出力結果のみを紹介しているので、複数の文の場合にはまた別の結果になるのかも知れません。

ただ、複数の文を一度に訳すと、どの部分でどう誤訳があるのか特定しづらいので、ポストエディットの負担が増えるように思います。

いずれにしても、CATツールでは一般的に1文ずつの翻訳となりますので、DeepL翻訳の特徴を活かしづらいことになります。

GreenTではどのようにしているのか?

DeepL翻訳の出力の傾向については以前から研究をしており、いくつかの観点から訳文を自動修正しています。

(参考)訳文の自動修正例(DeepL)

次のバージョンのGreenTでは英日翻訳時に、複数の訳文候補を簡易に出力するための手段を追加します。内部処理で原文の特定箇所の大文字・小文字などを変化させて意図的に出力を変更できるようになります。ユーザーインターフェイスは公開時には変更されるかもしれませんが、以下のようになっています。

これまで、ユーザーさんからはいろいろな訳例を見てみたいという要望をいただいておりました。このようなユーザーさんには役に立つかもしれません。ご期待ください。

関連記事

-読み物
-, , ,