速報
Facebook、英語を中間言語としない機械翻訳システムをGitHubで公開
Facebookが英語を中間言語として介さずに2つの言語を直接翻訳する多言語機械翻訳(MMT)モデルをGitHubで公開した。毎日200億回以上の翻訳を行っているニュースフィードでも将来的にはこのモデルを採用する計画だ。
米Facebookは10月19日(現地時間)、中間言語として英語を使わずにダイレクトに2国語間の翻訳を行う多言語機械翻訳(MMT)モデル、「M2M-100」を発表した。GitHubで公開している。
Facebookは現在、プラットフォーム上で提供している翻訳サービスでは中間言語として英語を介している。
新モデルでは英語データに依存せずに100言語の組み合わせで直接翻訳できるとしている。これにより、機械翻訳の評価に一般的に使わるBLEUの評価が、英語を介するシステムより平均で10ポイント高くなったという。
中間言語として英語を用いるのは、サンプルデータが豊富だからだ。Facebookは数年かけて100言語の75億文のデータセットを構築し、150億以上のパラメータを使ってユニバーサル翻訳モデルをトレーニングした。
Facebookのニュースフィード上では1日当たり200億件以上の翻訳を行っているという。M2M-100を本番環境に移行するために、さらにモデルを改善していくとしている。
関連記事
- Google翻訳にウイグル語など5カ国語追加で108言語対応に
Google翻訳に4年ぶりに新言語が5つ追加され、対応言語が108になった。ウイグル語、トルクメン語、ルワンダ語、タタール語、オリヤー語で、一部は仮想キーボードも利用可能だ。 - 「Google翻訳」アプリ、音声を翻訳してテキスト化する機能が数カ月中に追加
「Google翻訳」のモバイルアプリに、端末のマイクから入力した音声を翻訳しつつテキスト化する機能を追加するとGoogleが発表した。まずは数カ月中にAndroid版に追加する計画。 - Facebook、「Minecraft」内で活動するAIアシスタントを開発中
FacebookがMicrosoftのゲーム「Minecraft」内でプレイヤーと対話しながら成長するAIアシスタントを開発し、公開した。人間が指示する多様なタスクをこなす協調的なアシスタントを育てるのが目的としている。 - Facebookも自動翻訳にニューラルネットワーク採用 「Caffe2」で実用化
Facebookのニュースフィードの「翻訳を見る」の翻訳システムが、従来のフレーズベースの機械翻訳からディープラーニングフレームワーク「Caffe2」に実装したニューラルネットワークsequence-to-sequence LSTMベースに切り替わった。 - 「Google翻訳」にニューラルネット機械翻訳技術を採用 まずは中国語→英語で
Googleが、Google翻訳で採用する技術を、従来のフレーズベース機械翻訳(PBMT)からGoogle開発のニューラル機械翻訳(GNMT)に置き換えていくと発表した。中国語から英語への翻訳については既に実施済みだ。 - Facebook、AI画像認識技術「DeepMask」などをオープンソース化
Facebookが、写真に写っている物体を抽出してそれぞれの物体が何かを認知するコンピュータビジョン技術のコードをGitHubで公開した。 - Facebook、投稿を自動翻訳する「複数の言語で投稿」機能を一般公開へ
Facebookが、ユーザーの投稿を自動翻訳し、友達それぞれの母国語で表示する機能を一般公開した(ローリングアウト中)。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.