「堺筋線」Google翻訳でも“筋肉線”、「堺筋」は“大腿筋” 機械翻訳の難しさ
大阪メトロの英語サイトで、「堺筋線」が「サカイマッスルライン」(堺筋肉線)などと誤訳されていた問題。Bing翻訳の精度の問題との指摘もあり、Google翻訳も試してみた。その結果は……
大阪メトロの英語サイトで、「堺筋線」(さかいすじせん)という路線名が「サカイマッスルライン」(堺筋肉線)などと誤訳されていた問題。3月19日には「サカイマッスル」がTwitterトレンドになるほど話題になった。
大阪メトロによると誤訳の原因は、米Microsoftの自動翻訳ツールによる翻訳をそのまま掲載していたこと。このため、「MicrosoftのBing翻訳は精度が低いのでは」との指摘もある。
実際に、Bing翻訳の精度が低いのだろうか? 今回「誤訳」が指摘された単語を、Bing翻訳とGoogle翻訳に入力して比べてみた。
「堺筋線」はGoogle翻訳でも「マスキュラーライン」
まず「堺筋線」と入力。意外なことにBing翻訳は「Sakaisuji Line」と正しく翻訳した。対するGoogle翻訳は、「Muscular Line」(マスキュラーライン)……「筋肉線」と翻訳されてしまった。
次に「堺筋」(さかいすじ・道路の名称)を入力してみた。Bing翻訳では、やはり「Sakai Muscle」(サカイマッスル)になってしまう。Google翻訳はどうかというと、「Thigh muscle」(タイマッスル)……なんと、「大腿筋」(太ももの筋肉)と翻訳されてしまった。
大阪メトロのサイトで「プリンスブリッジイマイチ」と翻訳された駅名「太子橋今市」(たいいしばしいまいち)は、Bing翻訳だとやはり「Price Bridge now City」(プリンスブリッジナウシティ)と王子様風に。Google翻訳は「Taishi Bridge Imaichi」(タイシブリッジイマイチ)だった。
東京メトロのサイトで「3 Eyes」と翻訳されていた「3両目」は、Bing翻訳だと「3 Both eyes」。3つの両目になってしまった。Google翻訳は「third car」と正しく翻訳した。
「文脈アリ」対決は意外な結果に
ここまで4つの“翻訳対決”の結果、Bing翻訳はGoogle翻訳よりやや精度が低そうだ。ただ、両翻訳とも苦戦した「堺筋」「堺筋線」は、地名だと知らなければ、日本語話者でも「筋肉の名前かも?」と思ってしまうかもしれない。文脈がない状態で正確に翻訳するのは、人間でも難しい。
文脈がある状態での精度はどうだろうか。「堺筋」や「3両目」の誤訳があった大阪メトロのページの日本語文を、改めてBing翻訳とGoogle翻訳にかけてみた。
すると、両サービスとも「堺筋」は「Sakaisuji」(サカイスジ)と正しく翻訳した。2019年時点での両サービスは、文脈があれば、「堺筋」を筋肉と間違えることはないようだ。
一方で「3両目」は微妙な結果に。Bing翻訳は「the car near the 3rd」と原文に近い翻訳になっていたが、Google翻訳は「third eye」、「3番目の目」と誤訳。Google翻訳は「3両目」の単語だけなら正しく翻訳できていたのに……。
機械翻訳は日々進化しているとはいえ、まだまだ発展途上の技術。現時点ではその精度を盲信せず、参考程度に使うのがよさそうだ。
関連記事
- 御堂筋も「御堂筋マッスル」と誤訳 堺筋→「堺マッスル」問題、太子橋は「プリンスブリッジ」
「堺筋線」が「サカイマッスルライン」と誤訳されていた、大阪メトロの英文サイト。誤訳はこれにとどまらず、「御堂筋線」は「ミドウスジマッスルライン」、「太子橋今市」は「プリンスブリッジ イマイチ」に。 - 「堺筋線」を「Sakai Muscle line」と誤訳 大阪メトロ、外国語ページを非公開に
大阪メトロが、公式サイトの外国語ページを非公開に。「堺筋線」を「Sakai Muscle line」などと誤訳していた。自動翻訳ソフトの利用が原因という。 - 「JSONという気味の悪い拡張子」“誤訳”で物議 東洋経済オンラインの記事修正「原文とかい離していた」
東洋経済オンラインの翻訳記事に「JSONという気味の悪い拡張子」といった表現があり、「JSONは一般的なデータ形式だ」「原文と意味が違う。誤訳では」などと物議に。同誌は「原文とかい離した訳だった」とし、記事を訂正した。 - 機械翻訳時代に英語を学ぶ必要はあるのか?
AI(人工知能)による機械翻訳の精度が日々進化を続けている。このまま自動翻訳が進化していけば、われわれはもう英語などの外国語を勉強する必要はなくなるのだろうか。
Copyright © ITmedia, Inc. All Rights Reserved.