米Facebookは10月19日(現地時間)、中間言語として英語を使わずにダイレクトに2国語間の翻訳を行う多言語機械翻訳(MMT)モデル、「M2M-100」を発表した。GitHubで公開している。
Facebookは現在、プラットフォーム上で提供している翻訳サービスでは中間言語として英語を介している。
新モデルでは英語データに依存せずに100言語の組み合わせで直接翻訳できるとしている。これにより、機械翻訳の評価に一般的に使わるBLEUの評価が、英語を介するシステムより平均で10ポイント高くなったという。
中間言語として英語を用いるのは、サンプルデータが豊富だからだ。Facebookは数年かけて100言語の75億文のデータセットを構築し、150億以上のパラメータを使ってユニバーサル翻訳モデルをトレーニングした。
Facebookのニュースフィード上では1日当たり200億件以上の翻訳を行っているという。M2M-100を本番環境に移行するために、さらにモデルを改善していくとしている。
Google翻訳にウイグル語など5カ国語追加で108言語対応に
「Google翻訳」アプリ、音声を翻訳してテキスト化する機能が数カ月中に追加
Facebook、「Minecraft」内で活動するAIアシスタントを開発中
Facebookも自動翻訳にニューラルネットワーク採用 「Caffe2」で実用化
「Google翻訳」にニューラルネット機械翻訳技術を採用 まずは中国語→英語で
Facebook、AI画像認識技術「DeepMask」などをオープンソース化
Facebook、投稿を自動翻訳する「複数の言語で投稿」機能を一般公開へCopyright © ITmedia, Inc. All Rights Reserved.
Special
PR