PC USER Pro

20億人の投稿から学んだ「Facebook自動翻訳」を試してみるITはみ出しコラム

» 2017年08月06日 08時00分 公開
[佐藤由紀子ITmedia]

 Facebookのニュースフィードに外国語の投稿が流れてくると、文章の下に「翻訳を見る」と表示されます。

cnn 1

 Facebookアカウントの設定メニューにある「言語」の「ニュースフィードFacebook翻訳の設定」から、「どの言語を理解できますか?」の項目を日本語だけにして、「自動翻訳しない言語を選択してください。」で何も選択しなければ、この「翻訳を見る」が表示されます。

cnn 2

 Facebookのミッションは「世界のつながりをより密に」なので、これで言葉の壁をなくそうということです。

 Facebookは2008年から多言語化を推進してきました。最初は人力でしたが、徐々に機械学習に移行し、先日ニューラルネットワークでの翻訳に完全移行したと発表しました。

 ちなみにGoogleも2016年、Google翻訳を「フレーズベース機械翻訳(PBMT)」からニューラルネットワーク採用の「Google Neural Machine Translation(GNMT)」に切り替えています。

 ざっくり言うと、ニューラルネットワークは文の構造を翻訳の判断材料に使うようになるので、単語の意味を1つずつ置き換えるフレーズベースよりかなりまともな訳ができる(はず)ということです。

 Facebookが採用したのは、ニューラルネットワークの一種、リカレント(再帰)ニューラルネットワーク(RNN)のそのまた1種であるLSTM(長期短期記憶)です。何だかややこしいですが、LSTMは連続したイベントを予測できるので語順が大きく違う言語同士の翻訳に向いているんだそうです(比較的分かりやすい論文はこちら)。

 LSTMにはでも、膨大な量の学習データとそれを学習するための高性能システムが必要という弱点があります。それをFacebookは、20億人がこれまで投稿してきたテキストを学習データとし、自ら開発したディープラーニングフレームワーク「Caffe2」を使うことで乗り越えました。なんだかすごーい。

 でも、多分構造が似ている「英語→ドイツ語」などの翻訳なら問題ないのでしょうが、「英語→日本語」を訳してもらってみると、あれれな感じです。

 マーク・ザッカーバーグCEOの投稿を幾つか試してみたんですが、なぜかごっそり省略したり、重複したりしてしまいます。下の例では「メンロパーク」と「イーストパロアルト」という地名が省略され、逆に重複しちゃっている部分があります。

cnn 3

 試しに、同じ文をGoogle翻訳で日本語にしてみると「毎年夏に私たちはフェニックスアカデミーを運営し、メンロパークとイーストパロアルトの地元コミュニティーの高校ジュニアとメンターを結び付け、ハイテク業界での経験を得ることができます。来年の今年の卒業生と幸運にもおめでとう!」と、こちらの方がかなりいい感じでした。

 Facebook AcademyをフェニックスアカデミーとしたのはGoogleのおせっかいで、恐らくEast Palo Altoという地名から、Facebook AcademyをEast Palo Alto Phoenix Academyの間違えだと推測したんでしょう。それはそれですごいです。

 ここで「Facebookだめじゃん」と見捨てずに、「この翻訳の評価」をクリックして地道に評価していくことで、日本語訳もよくなっていくことでしょう。

 ところで、幾つか翻訳してもらっていた中で1番「なぜ?」と思ったのはこれです。

cnn 4 氷河を妊娠している?

 「私のお気に入りの写真のつで、アラスカでの巨大な健康な氷河を妊娠している」と訳されています。人間による翻訳は「お気に入りの写真の1枚。妊娠中のプリシラと数週間前にアラスカの広大な氷河の上で撮影した」といったところです。

 Facebookは将来的には、自動翻訳でCNN(畳み込みネットワーク)を採用するとも言っています。CNNは画像解析で知られていますが、これを翻訳に使うとLSTMより高速に処理できるのだそうです。英仏や英独のCNNモデルは既にかなりよくなっているとあるので、そのうち今度は自動翻訳をCNNに切り替えるという発表がありそうです。

 そして、「投稿に添えられた画像のようなコンテキストも翻訳のための要素として追加していく」としています。

 そうすると、先ほどのザッカーバーグさんの投稿では、写真に写っているのがザッカーバーグ夫妻であることや、プリシラさんのお腹が大きいことを判断し、もうちょっとましな翻訳になるかもしれませんね。

バックナンバー

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2026年03月14日 更新
  1. きょう発売の「MacBook Neo」、もうAmazonで割安に (2026年03月11日)
  2. 新品は絶滅、中古は高騰──「令和にMDを聞きたい」と願った筆者が、理想の再生環境を整えるまでの一部始終 (2026年03月13日)
  3. M5 Max搭載「14インチMacBook Pro」がワークステーションを過去にする 80万円超の“最強”モバイル AI PCを試す (2026年03月13日)
  4. セールで買った日本HPの約990gノートPC「Pavilion Aero 13-bg」が想像以上に良かったので紹介したい (2026年03月11日)
  5. 12機能を凝縮したモニタースタンド型の「Anker 675 USB-C ドッキングステーション」が27%オフの2万3990円に (2026年03月11日)
  6. 3万円超でも納得の完成度 VIA対応の薄型メカニカルキーボード「AirOne Pro」を試す キータッチと携帯性を妥協したくない人向け (2026年03月12日)
  7. ワコム上位機に肉薄? 10万円で18.4型4K! 高コスパ液タブ「GAOMON Pro 19」の長所と弱点 (2026年03月13日)
  8. 「MacBook Neo」を試して分かった10万円切りの衝撃! ただの“安いMac”ではなく絶妙な引き算で生まれた1台 (2026年03月10日)
  9. 高音質・良好な装着感・バッテリー交換式――JBLのフラッグシップ「Quantum 950 WIRELESS」は妥協なきヘッドセットか (2026年03月12日)
  10. 10万円切りMacが17年ぶりに復活! 実機を試して分かったAppleが仕掛ける「MacBook Neo」の実力 (2026年03月10日)
最新トピックスPR

過去記事カレンダー

2026年