訳文の自動修正例(特許翻訳)

通常のニューラル機械翻訳(Google翻訳)と比較して、GreenTの出力がどの程度違うのか例を紹介します。

特許翻訳においていくつかの表記ルールがあります。通常翻訳をする場合(ポストエディットをする場合)には、このルールに従って表記を統一します。この作業があまりにも面倒なのです。ニューラル機械翻訳の出力文を修正する作業で心が折れる原因の1つだと思います。

ニューラル機械翻訳ではそもそもルールという概念がないので表記の揺れが生じてしまいます。GreenTではそのような表記揺れを自動修正しますので、一般に言われているような面倒な作業の発生が抑えられています。

この自動修正の効果は、特許の分野や原文の表記により異なりますので、ぜひご試用をいただきご自身の手で確かめてください。

なお、以下の例では用語集の適用をしていませんし文法の確認もしていません。単純に出力比較のためのサンプルです。そのため、誤訳が含まれている可能性がありますがご了承ください。

設定

[Style]タブ[General]タブで、英日翻訳では、文体を「常体」に設定します。英数字記号を全角にする場合には、[英数字記号を全角文字にする]をオンにします。

[Style]タブ[Field Specific]タブで、特許翻訳用の自動処理を適用するために、[特許明細書]のチェックをオンにします。クライアント指定のスタイルの項目をオンにします。

(旧バージョンをご利用の方)

[Style]タブの①の箇所で、英日翻訳では、文体を「常体」に設定します。英数字記号を全角にする場合には、[英数字記号を全角文字にする]をオンにします。

②の個所で、特許翻訳用の自動処理を適用するために、[特許明細書]のチェックをオンにします。クライアント指定のスタイルの項目をオンにします。

参照符号や図面番号の数字とアルファベットの泣き別れ対策

日英翻訳

Google翻訳では、エンジン100aがengine 100 a となる現象が見られます。100 と a の間の半角スペースを削除するのが面倒です。

原文 このタッチパネル16の3つの領域101a、101b、101c毎に割り当てられている操作種目が分かるように所定のアイコン101d乃至101fを各領域に表示する。
Google Predetermined icons 101 d to 101 f are displayed in each area so that the operation type assigned to each of the three areas 101 a, 101 b, and 101 c of the touch panel 16 can be known.
GreenT Predetermined icons 101d to 101f are displayed in each region so that the operation type assigned to each of the three areas 101a, 101b, and 101c of the touch panel 16 can be known.

また、図2(a)がFig. 2 (a) になり、2 と (a) の間の半角スペースも削除しなければなりません。

原文 2(a)は、従来の有機材料噴射ノズルの一例を示す図である。
Google Fig. 2 (a) is a view showing an example of a conventional organic material injection nozzle.
GreenT Fig. 2(a) is a view showing an example of a conventional organic material injection nozzle.

図面番号の表記調整

明細書の図面番号は特許事務所によりルールが異なります。これも調整するのが面倒ですが、GreenTでは自動処理をしています。

日英翻訳

Google翻訳では図面番号の図1(a)FIG. 1Aと表記したりFig. 1(a) と表記したり表現が揺れます。以下の例では、数字と括弧が泣き別れています。

GreenTでは指定した表記(FIG. 1AFIG. 1(a)Fig. 1AFig. 1(a))に揃えられます。

原文 図20(b)は製造装置の後方斜視図である。
Google FIG. 20 (b) is a rear perspective view of the manufacturing apparatus.
GreenT FIG. 20B is a rear perspective view of the manufacturing apparatus.
GreenT FIG. 20(b) is a rear perspective view of the manufacturing apparatus.
GreenT Fig. 20B is a rear perspective view of the manufacturing apparatus.
GreenT Fig. 20(b) is a rear perspective view of the manufacturing apparatus.

英日翻訳

Google翻訳の誤訳例としてよく「イチジク。」が挙げられています。Google翻訳では、FIG. 1Aのようにアルファベットが含まれる図面番号があると「イチジク。」や破綻した文章誤訳文が出力されてしまう傾向があるようです。

GreenTでは「イチジク。」は出てきません。また、FIG. 1A図1(a)や図1(a)に表記統一をします。さらに、英数字記号の表記を全角半角とで出力を統一できます。

原文 FIGS. 2A and 2B are perspective diagrams of a portable media device according to one embodiment of the invention.
Google 図1および図2を参照する。本発明の一実施形態による携帯型メディア装置の斜視図である。
GreenT 図2(a)および図2(b)は、本発明の一実施形態による携帯用メディア装置の斜視図である。
GreenT 図2(a)および図2(b)は、本発明の一実施形態による携帯用メディア装置の斜視図である。

図面番号の欠落対策

Google翻訳では図面番号の誤記や欠落がときどき見られます。GreenTでは対策が施されています。

日英翻訳

図を示すFig. や図面番号自体が欠落することがあります。以下の例では、Fig. が抜け落ちて番号が泣き別れています。

GreenTでは図面番号が欠落しないように処理され指定した表記に自動修正されます。

原文 図3(a)~3(c)は第1実施形態の半導体素子の製造方法を説明する断面図である。
Google 3 (a) to 3 (c) are cross-sectional views for explaining the method of manufacturing the semiconductor device of the first embodiment.
GreenT Figs. 3(a) to 3(c) are cross-sectional views for explaining the method of manufacturing a semiconductor device according to the first embodiment.

図番号が欠落する場合もあります。[GreenT]ボタンで上手く訳せない場合、[数字重視]ボタン([Alternative]ボタン)で対応してください。

原文 以下、図4のフローチャートを参照して、本発明の第2の実施の形態に係る撮像装置による特徴的な処理について詳細に説明する。
Google Hereinafter, characteristic processing by the imaging device according to the second embodiment of the present invention will be described in detail with reference to the flowchart in FIG.
GreenT
通常
Hereinafter, characteristic processing by the imaging device according to the second embodiment of the present invention will be described in detail with reference to the flowchart of FIG.
GreenT
数字重視
Hereinafter, characteristic processing by the imaging device according to the second embodiment of the present invention will be described in detail with reference to the flowchart of FIG. 4.

英日翻訳

以下の例ではGoogle翻訳では図面番号が欠落しています。

原文 Fig. 2A is a perspective diagram of a portable media device according to one embodiment of the invention.
Google 本発明の一実施形態による携帯型メディア装置の斜視図である。
GreenT 図2(a)は、本発明の一実施形態による携帯用メディア装置の斜視図である。

以下の例でも図面番号が欠落しています。

原文 Figure 2B is a side perspective view of the valve component shown in Figure 2A.
Google 図2Aに示される弁構成要素の側面斜視図である。
GreenT 図2(b)は、図2(a)に示される弁構成要素の側面斜視図である。

以下の例では、Google翻訳では「イチジク。」がでて更に図面番号を間違え、文章が破綻しています。これでは出力された文章を使うのが難しいです。最初から書いた方がいいと言われる原因となる出力です。

GreenTではこのようにGoogle翻訳が完全に誤訳をするような原文に対しても編集しやすい訳文を出力できます。

原文 FIG. 9C is a block diagram of a second surface of the media device shown in FIGS. 9A and 9B according to one embodiment of the invention.
Google イチジク。図9Cは、図8A〜8Cに示されているメディアデバイスの第2の表面のブロック図である。発明を実施するための最良の形態
GreenT 図9(c)は、本発明の一実施形態による、図9(a)および図9(b)に示すメディア装置の第2の面のブロック図である。

段落番号の欠落対策

Google翻訳では段落先頭に記載された段落番号が欠落することがありますが、GreenTでは欠落が起きません。

日英翻訳

原文

【0024】図3は本発明の第3実施形態における車軸制御装置の斜視図である。

Google FIG. 3 is a perspective view of an axle control apparatus according to a third embodiment of the present invention.
GreenT [0024] Fig. 3 is a perspective view of an axle control device according to a third embodiment of the present invention.

英日翻訳

原文 [0012] Fig. 2 is a perspective diagram of a portable media device according to one embodiment of the invention.
Google 図2は、本発明の一実施形態による携帯型メディア装置の斜視図である。
GreenT 【0012】図2は、本発明の一実施形態による携帯用メディア装置の斜視図である。

まとめ

以上のように特許翻訳における明かな誤訳や表記ゆれを自動修正する方法を紹介しました。

このページでは用語の統一については触れませんでしたが、用語統一も面倒な作業の一つです。これも用語集を適用しポストエディットの自動化をすることである程度解決できます。

一つ一つは小さな修正です。でも、ニューラル機械翻訳の出力を使える訳文にするためには、表記の修正や用語の修正を頻繁にする必要があります。なので、このような修正を自動化することで、翻訳者が原文を読み込んだり訳文を作成したりする作業に集中できるのです。

さらに図面番号の異なる表記を比較できるようにQAツールがチューニングされています。誤訳の発見を可能な限り自動化しています。

確認や修正の小さな作業の自動化が差を生み出す例でした。

関連ページ

2019年3月21日