Facebookのニュースフィードに外国語の投稿が流れてくると、文章の下に「翻訳を見る」と表示されます。
Facebookアカウントの設定メニューにある「言語」の「ニュースフィードFacebook翻訳の設定」から、「どの言語を理解できますか?」の項目を日本語だけにして、「自動翻訳しない言語を選択してください。」で何も選択しなければ、この「翻訳を見る」が表示されます。
Facebookのミッションは「世界のつながりをより密に」なので、これで言葉の壁をなくそうということです。
Facebookは2008年から多言語化を推進してきました。最初は人力でしたが、徐々に機械学習に移行し、先日ニューラルネットワークでの翻訳に完全移行したと発表しました。
ちなみにGoogleも2016年、Google翻訳を「フレーズベース機械翻訳(PBMT)」からニューラルネットワーク採用の「Google Neural Machine Translation(GNMT)」に切り替えています。
ざっくり言うと、ニューラルネットワークは文の構造を翻訳の判断材料に使うようになるので、単語の意味を1つずつ置き換えるフレーズベースよりかなりまともな訳ができる(はず)ということです。
Facebookが採用したのは、ニューラルネットワークの一種、リカレント(再帰)ニューラルネットワーク(RNN)のそのまた1種であるLSTM(長期短期記憶)です。何だかややこしいですが、LSTMは連続したイベントを予測できるので語順が大きく違う言語同士の翻訳に向いているんだそうです(比較的分かりやすい論文はこちら)。
LSTMにはでも、膨大な量の学習データとそれを学習するための高性能システムが必要という弱点があります。それをFacebookは、20億人がこれまで投稿してきたテキストを学習データとし、自ら開発したディープラーニングフレームワーク「Caffe2」を使うことで乗り越えました。なんだかすごーい。
でも、多分構造が似ている「英語→ドイツ語」などの翻訳なら問題ないのでしょうが、「英語→日本語」を訳してもらってみると、あれれな感じです。
マーク・ザッカーバーグCEOの投稿を幾つか試してみたんですが、なぜかごっそり省略したり、重複したりしてしまいます。下の例では「メンロパーク」と「イーストパロアルト」という地名が省略され、逆に重複しちゃっている部分があります。
試しに、同じ文をGoogle翻訳で日本語にしてみると「毎年夏に私たちはフェニックスアカデミーを運営し、メンロパークとイーストパロアルトの地元コミュニティーの高校ジュニアとメンターを結び付け、ハイテク業界での経験を得ることができます。来年の今年の卒業生と幸運にもおめでとう!」と、こちらの方がかなりいい感じでした。
Facebook AcademyをフェニックスアカデミーとしたのはGoogleのおせっかいで、恐らくEast Palo Altoという地名から、Facebook AcademyをEast Palo Alto Phoenix Academyの間違えだと推測したんでしょう。それはそれですごいです。
ここで「Facebookだめじゃん」と見捨てずに、「この翻訳の評価」をクリックして地道に評価していくことで、日本語訳もよくなっていくことでしょう。
ところで、幾つか翻訳してもらっていた中で1番「なぜ?」と思ったのはこれです。
「私のお気に入りの写真のつで、アラスカでの巨大な健康な氷河を妊娠している」と訳されています。人間による翻訳は「お気に入りの写真の1枚。妊娠中のプリシラと数週間前にアラスカの広大な氷河の上で撮影した」といったところです。
Facebookは将来的には、自動翻訳でCNN(畳み込みネットワーク)を採用するとも言っています。CNNは画像解析で知られていますが、これを翻訳に使うとLSTMより高速に処理できるのだそうです。英仏や英独のCNNモデルは既にかなりよくなっているとあるので、そのうち今度は自動翻訳をCNNに切り替えるという発表がありそうです。
そして、「投稿に添えられた画像のようなコンテキストも翻訳のための要素として追加していく」としています。
そうすると、先ほどのザッカーバーグさんの投稿では、写真に写っているのがザッカーバーグ夫妻であることや、プリシラさんのお腹が大きいことを判断し、もうちょっとましな翻訳になるかもしれませんね。
Copyright © ITmedia, Inc. All Rights Reserved.