先日、次の質問を受け付けました。
貴社に頼まなくてもGoogle翻訳とかってあるじゃないですか。あれじゃダメですか?
一般生活の中で翻訳に触れる機会が少ないので、そういう疑問を抱くのももっともなことだと思います。これまでも、家族!を含めていろんな人に聞かれたことがあります。その都度お答えしてきましたが、今回を機に、改めて機械翻訳の話を取り上げてみようと思います。
結論:そのままでは使えません
まず結論からいうと、現在の機械翻訳による訳文は、そのままでは印刷物などの間違いが許されない正式な場面では使えません。
外国語ではなく、日本語の印刷物を作成するときを想像すればわかりやすいですが、1文字もミスが許されないのはもちろんのこと、ライターまで使って良質な文章に仕上げています。
これが外国語の印刷物になるとミスが出てもしょうがない、ということにはならないでしょうし、外国語版だから文章が間違っていたり、不自然であっても大丈夫だと許容できる人も少ないと思います。
しかし現在の機械翻訳はミスが出ない保証はありませんし、ましてスタイルの統一されたよい文章を仕上げることは極め困難だと言わざる得ません。
その理由は、機械翻訳の仕組みを勉強してここに書くのも一つの手ですが、難し過ぎて多分完全に理解できませんし、生半可な理解でご紹介するわけにはいけませんので、やめときます。
その代わりに、実際機械翻訳を使ってみて、どのような訳文が出力されるか見てみたいと思います。
機械翻訳の出力を見ればわかる
通常日本国内で発生する翻訳のニーズは日本語から外国語へ、その中でも英語へ、というパターンが多いと思いますが、日本語から英語に翻訳された文章を確認するには英語の読解力が必須になりますので、すべての読者に向いていないと思います。そこで今回は逆に英語を入力し日本語の訳文を出して、どのような結果が返ってくるかを確認してみたいと思います。
1つ目の例
ではさっそく、旅行通販サイトExpediaの2022年11月30日のトップページにある以下の文章をGoogle翻訳に入れてみたいと思います。
いざ投入!
。。。。。
意味の通じる普通に読みやすい文章が出力されました。正直ちょっと肩透かしを食った気分です。
でもよく読むと、この日本語の文章をそのまま正式な場合に使えるかと言われると、おそらくノーということになるのではないでしょうか。
まず「さらに節約」は「さらにお得」などに置き換えなければ日本語として不自然ですし、その後の文章も手直しが必要だということは読めばそう感じると思います。
2つ目の例
もう1つやってみます。
カリフォルニアのレストランを紹介するサイトの文章です。
この国を缶付のスープの混迷から新鮮なテクニカラーの世界へと揺るがし始めた
これは意味がわからないですね。他のところも、結局はなんとなくわかるレベルで、とても正式な場合にはそのまま使えないことがわかります。
3つ目の例
もう1つ面白い例があります。
「No music no life」(音楽なしでは生きていけない)をもじって「No beef no life」を入れてみたら、「ビーフ・ノー・ライフ」になりました。カタカタ直訳はまあ許すとして、最初の「ノー」が抜けると意味がまったく違うものになってしまいます。
上記Google翻訳で検証しましたが、ツールによってはもっと良い結果が出ることもあるかもしれません。しかし機械が言葉の意味を理解しているのではなく、訳例を大量学習することにより品質を向上させている以上、思わぬ誤訳を完全に防ぐことは不可能だと思います。
また上記の例は内容も平易ですが、難しい内容になれば、また特に長い文章になれば、もっと結果が悪くなる可能性があります。
日英はさらに悪くなる可能性
以上で英語から日本語への機械翻訳を見てきましたが、日本語から英語への翻訳も推して知るべしです。けれども、実は日本語から英語に翻訳する場合、さらに精度が落ちる可能性があります。
というのは英語は文法的な構成が非常にわかりやすい言語であるのに、日本語はいろんな要素を省略できる文法的な不明瞭さをかなり持つ言語だからです。例えば英語では主語は欠かせないし、述語、目的語など主要成分が一式揃っているのですが、日本語は主語は多くの場合省略できますし、同音異義語もかなり多いです。また書き手にもよりますが「がにおは」が正しく使われなかったり、わかりやすく書かれていなかったりする文が英語より総じて多い傾向にあります。
これはつまりそういった日本語の文を英語に翻訳するときに、足りない要素を補ったり、同音意義語を正しく選択して翻訳したり、原文のわかりにくさを分析してわかりやすくする必要があるということを意味していますが、機械翻訳でパーフェクトにそれができません。
日韓でも安心できない
一般に機械翻訳は言語の似ている度合いが高いほど、機械翻訳でよい結果が得られると言われています。ほとんどの欧州言語はインド・ヨーロッパ語族に属しており、文法がお互い近いので、機械翻訳でよい結果が得られると言われていますが、それでも欧州連合(EU)の場合、議事録などは翻訳者が機械翻訳の下書きを元に人力で仕上げていると聞いたことがあります。
日本語と似ている言語はどれか、と言われれば、ずばり韓国語です。韓国語は日本語と文法的に九割以上同じで、ほぼ日本語の発想で文を組み立て、それを韓国語の言葉に置き換えれば韓国語として成り立つと言われています。少し韓国語をかじった私自身の経験からでも、事実だと認められると思います。
しかしそんな日韓間の翻訳でも、人力の介在がやはり必要になります。たとえば韓国語では日本語ほど体言止め(「5月に兄が上京。」という体言で文が終わるスタイル)しないと言われていますが、日本語の体言止め文を機械翻訳に投入すると、名詞で終わる韓国語の文が訳出され、結局はそれが不自然な文だということなります。
また日本語に特有の概念や難しい漢語等はそのままでは翻訳はできるけれども、説明や漢字を付け加えてあげないと読者に伝わらない内容もあり、こちらも人間の翻訳者が平易な翻訳に直したり、追加の説明を入れたりする必要があります。
以上見てきた通り、機械翻訳は長足な進歩を遂げてきていますが、人力翻訳に変えられるものではなりません。
これは翻訳会社のポジショントークではなく、機械翻訳だけでお客様の課題が解決するのであればスタッフ一同転職します。
そもそも、機械翻訳が完璧なら世の中に翻訳会社がなくなるはずですが、そのようになっていないことからでも、人力翻訳の代え難さがわかると思います。
どう機械翻訳を使うべきか
人力翻訳の補助として使う
実は機械翻訳は弊社もよく使っています。というと矛盾に感じられるかもしれませんが、人力翻訳を行う中で、「これ英語ではなんというんだっけ?」「日本語の原文に引きずられてなんか新しい発想ができない」といったときに、機械翻訳を利用することで往々にして良い示唆を得られます。
つまり人力翻訳の補助、という使い方です。これは翻訳ができないと結局はできないですので、限定的な使い方となります。
手軽なやり取りに利用
次に考えられる使い方は、私個人でもそうしていますが、チャット、メールなど海外の人とのやりとりの中で利用するのは十分にありだと思います。この時に必ずやっておいたほうがいいのは、日本語を日本語らしからぬスタイル、例えばすべての文に「私は」をつけたりして、誰が、何を、どうするのか、をわかるように修正することです。
たとえばソフトウェアのサポートを求めていて、自分の操作を説明して、「そのボタンを押すとポップアップ画面が出てきます。」と相手に伝えたいとします。これはGoogle翻訳では次の結果が返ってきます。
「When you ... 」と動作の主体がYouになっていますね。これを防ぐために、「私はそのボタンを押すと…」とすると、動作の主体が自分にもどってきます。
主語の補足以外に、文を短く切る、同音異義語を別の表現に変える、難しい表現を平易な表現に変えるなど、要するに文をわかりやすくしたほうがよい結果が得られます。
欠点を承知の上で利用
機械翻訳が完璧じゃないのはわかっているけど、翻訳費用が高額。背に腹は変えられないので欠点を我慢してあえて利用するというのは、特に官公庁サイトなどの機械翻訳を利用する理由ではないかと思いますが、十分な情報伝達がされていないことを理解の上で利用するのであれば大丈夫だと思います。
そういう場合、問題になるのは画像バナーの存在です。画像上の文字でもあくまで画像なので機械翻訳エンジンによって認識されないため、翻訳されません。画像バナーが多いとかなりの情報抜けになりますので、できれば画像を使うのではなく、CSSなどでテキストを画像に重ねるといった手法が望ましいです。
機械翻訳による失敗例
最後に有名な翻訳の失敗例をいくつか紹介したいと思います。
機械翻訳のまま本を出版した例
1つ目は書籍の翻訳で間に合わないので一部の章で機械翻訳をそのまま使い出版してしまった事件です。事の顛末はこちらのブログに詳しいですが、要約しますと以下になります。
『アインシュタイン その生涯と宇宙』という本を複数の翻訳者が和訳することになったが、12、13、16を担当する翻訳者が断ったため、編集部は別途「科学系某翻訳グループ」に依頼。しかし上がってきた訳があまりにもひどいので、(前記ブログに明確な記載はないですが、ここで機械翻訳されたのだと推測します)編集部は自分たちで修正することに。だが修正も時間の関係で12、16章しかできておらず、13は機械翻訳のまま出版してしまった。
どれだけひどい翻訳かも前記ブログで確認できますのでよろしければ確認してみてください。
ちなみにこれは2011年のできごとで、もう今は重版で人間によるちゃんとした翻訳に直されているようです。2011年当時Amazonの評価は本当にブログの言っているように星1つばかりでしたが、今は4つ以上になっています。
機械翻訳で英語サイトが非公開となった例
2019年の記事ですが、大阪メトロの英語サイトで「堺筋線」が「サカイマッスルライン」に、「3両目」が「3アイズ」、「天神橋筋」が「テンジンブリッジ」、「天下茶屋」(てんがちゃや)が「ワールドティーハウス」などに翻訳されたこを利用者が指摘したため、大阪メトロがサイトを一時非公開にしたとのことです。
ここの誤訳は要するに機械翻訳のデータベースにこれらの地名が入っていなくて、しかし機械翻訳の性質上かならず翻訳が出力されるので、わからない言葉は要素を分解して翻訳した結果だと思います。
ほかにもたくさん誤訳があり、前記記事に詳しいのでよければご覧ください。ちなみにこちらはマイクロソフトの機械翻訳ソフトだったそうです。
奈良市観光協会がサイトを閉鎖した例
次はこちらの記事に詳しいですが、奈良市観光協会が機械翻訳を導入したが、多くの誤訳があることを受け、一時閉鎖したとのことです。
東大寺の大仏は苗字の「おさらぎ」として「Mr. Osaragi」に、「仏の慈悲」は「仏」がフランスとして「French Mercy」に翻訳されたなど奇想天外な結果になったそうです。こちらは特に後者は日本語で「仏の」という使い方の場合、「フランスの」という意味には普通ならないはずですから、機械翻訳ソフト自体に問題がかなりあったと言わざる得ないと思います。
萌えは断れない?
以前某地に行くとき、こんな張り紙を見かけました。燃えないゴミの張り紙で、英・中・韓の翻訳が日本語の下に配置されています。
そのうちの中国語が燃えないゴミの意味に断じてなっていないところが面白いです。
「萌」=「萌え」
「无法」=「できない」
「拒绝」=「拒絶」「断る」
つまり、「萌えは断れない」という意味です。
なぜ「もえないゴミ」が「萌は断れない」になったのか。まず断言して良いのはこれは人間による翻訳ではないことです。どんな酔狂な人でもこんな翻訳は考えつかないでしょう。そして勘の良い方は「もえ」が二次元の「萌え」として翻訳されたことにもう気づいたと思います。機械翻訳ソフトにとっての「もえ」は「燃える」よりも「萌え」のほうが一般的な解釈だったということかもしれません。オタク文化が海外に受容されている証左の1つとも言えるかもしれません。
それにしても「断れません」はどこから来たのでしょう。これはどう頭をひねってもわかりません。
そしておそらく、この時ひらがなではなく、漢字変換して「燃え」としていたら、正しい翻訳になっていたのかもしれません。現に現在、Google翻訳に「燃えないゴミ」を入れる「不可燃垃圾」という正確な訳が出てきますが、「もえないゴミ」だと「不会燃烧的垃圾」と、ちょっと違和感を感じる拙い表現になっています。
機械翻訳利用法のところで紹介した通り、機械翻訳をどうしても使う時は、誤解を与えないことが重要です。
以上機械翻訳が正式な用途にはそのまま使えないこと、使うなら工夫する必要があることを実例を交えて紹介しました。機械翻訳ソフトが常に進化しているので、昨日の誤訳は今日直されている可能性が大きく、上記の実例のうち、再現性がないものはほとんどだと思います。しかし冒頭で伝えたように、機械翻訳が言葉の意味を理解して翻訳しているわけではない以上、地雷を踏む危険性はこれからもずっと存在するでしょう。