機械翻訳と上手に対話する方法

僕は、某大学の研究員をしているのだが、英語が苦手科目の筆頭で、からっきしである。原因の大半は、某六本木で働いていた元社長の指摘するように、単語力不足である。

そこで、単語を主に補うための手段として、機械翻訳を使うことがある。(というか正直多い。)

ここしばらく、英語で原稿を書くことが少なかったので、機械翻訳を利用することは少なかったのだが、数日前に、久しぶりに機械翻訳を利用しようとして、ウェブサービスとして色々な点が改良されていて、驚いた。

また、研究室の学生と話していて、意外に、機械翻訳を上手に利用するためのテクニックが知られていないことにも最近驚いた。

とまあ、そういうわけで、表題の内容について少しまとめておく。後者については、正しい方法ということではなく、あくまで僕なりに到達したノウハウにすぎない。サポートする気はさらさらないので、own riskでお願いしたい。

最近の翻訳エンジンの注目株

僕は機械翻訳としては下記の3つを利用している。

  1. Yahoo!翻訳

  2. Excite翻訳

  3. 研究開発支援総合ディレクトリ(Read)の提供する日英機械翻訳

これらはそれぞれ異なる特徴を持っている。

Yahoo!翻訳

入力した原文の単語と、翻訳後の文章の単語との対応を確認することができる機能を持っている。

比較的文法に自身があるような人や、専門用語があるような場合に、この機能は割りと有効な気がする。

Excite翻訳

翻訳結果を再翻訳することができる。

研究開発支援総合ディレクトリ(Read)の提供する日英機械翻訳

Readのトップページからは見えないところにあるので、知っている人はかなりマニアックな人だろうとおもう。

インタフェースという点ではまったく特徴が無い。むしろ、ちょっとダメなのだが、翻訳の内容については特筆にあたいする。(と個人的に思っている。)

実は、理工学系に特化した辞書を搭載しているので、数学の言い回しや、情報系の専門用語がなんの問題もなくすんなり翻訳されてしまう。

また、自動的に文章を受動態に直して翻訳してくれるので、論文風の言い回しに出力結果がなってしまっている。これが実に便利。

もう少し宣伝すればいいのに。>JST

翻訳エンジンとの付き合いかた

(心構え:当然のことだが、機械翻訳の出力結果は、9割くらい、使えないと思う。そう思って使わないと痛い目にあう。特に論文の場合専門用語がある。その専門用語については、Readの機械翻訳についてはかなり良い線を行く(それでも完璧とは言えない)が、その他については論外である。)

受動態で入力しよう

論文の英語化のサポートとして機械翻訳を利用する場合、日本語の文章をそのまま入力しても、良い翻訳には近付かない。

これは、日本語の論文での表現と英語の論文での表現の違いに因る部分が、比較的に多いように個人的に思う。

英語deha「客観的な事実」のような事柄を説明する際には、受動態やIt ~ that~構文を使用する。(と少なくとも、英語論文の書き方で習った。)

一方日本語の場合は、あからさまな受動態の表現は論文ではついぞ見ない。

したがって、機械翻訳に文章を入力する際は、特に日英翻訳の場合には、日本語を日本語の受動態の表現に変換して入力することが実は必要になる。

ぼくがよく利用するはじめの2つの場合、あくまで、直訳なので、主語が明示的に書かれていない文章でも翻訳しようとがんばる。

そのため変な主語を補完してしまったりする。

文章のブロックを考慮しよう

論文を書いていると修飾語が1文になってしまっているようなことは多い。これをそのまま機械翻訳にかけると、たいてい、変な文章になる。

これは、機械翻訳のエンジンが、文章の大きな構造を把握することについてはそんなに長けていないためである。

そこで、文章のブロックを切り分けるようにする。

例えば、

「今日の朝したことと言えば、古いハブラシをつかってくつの掃除をしたことと、庭の花に水をやったことくらいだ。」というような文章があったとしたら、「今日の朝したことと言えば、AとBくらいだ。」という入力と、「古いハブラシをつかってくつの掃除をしたこと」と「庭の花に水をやったことくらい」の合計3つの文章にして翻訳し、AとBはあとから’代入’する。

#もちろん、代入の際には、時制や、主語等々ちゃんと調整する必要がある。

まとめ

以上で、ぼくなりの方法を公開する。

当たり前のことだが、英語はできないよりはできるほうが良いと思うが。。。