ITmedia NEWS > ネットの話題 >
ITmedia AI+ AI活用のいまが分かる

「堺筋線」Google翻訳でも“筋肉線”、「堺筋」は“大腿筋” 機械翻訳の難しさ

» 2019年03月20日 13時16分 公開
[岡田有花ITmedia]

 大阪メトロの英語サイトで、「堺筋線」(さかいすじせん)という路線名が「サカイマッスルライン」(堺筋肉線)などと誤訳されていた問題。3月19日には「サカイマッスル」がTwitterトレンドになるほど話題になった。

 大阪メトロによると誤訳の原因は、米Microsoftの自動翻訳ツールによる翻訳をそのまま掲載していたこと。このため、「MicrosoftのBing翻訳は精度が低いのでは」との指摘もある。

 実際に、Bing翻訳の精度が低いのだろうか? 今回「誤訳」が指摘された単語を、Bing翻訳とGoogle翻訳に入力して比べてみた。

「堺筋線」はGoogle翻訳でも「マスキュラーライン」

 まず「堺筋線」と入力。意外なことにBing翻訳は「Sakaisuji Line」と正しく翻訳した。対するGoogle翻訳は、「Muscular Line」(マスキュラーライン)……「筋肉線」と翻訳されてしまった。

画像 「堺筋線」、Bing翻訳は「Sakaisuji Line」と正しく翻訳
画像 「堺筋線」、「Muscular Line」、筋肉線と翻訳

 次に「堺筋」(さかいすじ・道路の名称)を入力してみた。Bing翻訳では、やはり「Sakai Muscle」(サカイマッスル)になってしまう。Google翻訳はどうかというと、「Thigh muscle」(タイマッスル)……なんと、「大腿筋」(太ももの筋肉)と翻訳されてしまった。

画像 Bing翻訳の「堺筋」は「サカイマッスル」
画像 Google翻訳の「堺筋」は「タイマッスル」、大腿筋に

 大阪メトロのサイトで「プリンスブリッジイマイチ」と翻訳された駅名「太子橋今市」(たいいしばしいまいち)は、Bing翻訳だとやはり「Price Bridge now City」(プリンスブリッジナウシティ)と王子様風に。Google翻訳は「Taishi Bridge Imaichi」(タイシブリッジイマイチ)だった。

画像 Bing翻訳の「太子橋今市」は「プリンスブリッジナウシティ」
画像 Google翻訳の「太子橋今市」は「タイシブリッジイマイチ」

 東京メトロのサイトで「3 Eyes」と翻訳されていた「3両目」は、Bing翻訳だと「3 Both eyes」。3つの両目になってしまった。Google翻訳は「third car」と正しく翻訳した。

画像 Bing翻訳の「3両目」は「3 Both eyes」(3つの両目)
画像 Google翻訳の「3両目」は正しく翻訳された

「文脈アリ」対決は意外な結果に

 ここまで4つの“翻訳対決”の結果、Bing翻訳はGoogle翻訳よりやや精度が低そうだ。ただ、両翻訳とも苦戦した「堺筋」「堺筋線」は、地名だと知らなければ、日本語話者でも「筋肉の名前かも?」と思ってしまうかもしれない。文脈がない状態で正確に翻訳するのは、人間でも難しい。

 文脈がある状態での精度はどうだろうか。「堺筋」や「3両目」の誤訳があった大阪メトロのページの日本語文を、改めてBing翻訳とGoogle翻訳にかけてみた。

 すると、両サービスとも「堺筋」は「Sakaisuji」(サカイスジ)と正しく翻訳した。2019年時点での両サービスは、文脈があれば、「堺筋」を筋肉と間違えることはないようだ。

 一方で「3両目」は微妙な結果に。Bing翻訳は「the car near the 3rd」と原文に近い翻訳になっていたが、Google翻訳は「third eye」、「3番目の目」と誤訳。Google翻訳は「3両目」の単語だけなら正しく翻訳できていたのに……。

画像 Bing翻訳で全文翻訳。「堺筋」は正しく翻訳、「3両目」も「アイズ」(目)にはならなかった
画像 Google翻訳で全文翻訳すると、「3両目」が「アイ」(目)になる誤訳に

 機械翻訳は日々進化しているとはいえ、まだまだ発展途上の技術。現時点ではその精度を盲信せず、参考程度に使うのがよさそうだ。

Copyright © ITmedia, Inc. All Rights Reserved.