ITmedia NEWS > 速報 >
速報
» 2020年10月20日 14時33分 公開

Facebook、英語を中間言語としない機械翻訳システムをGitHubで公開

Facebookが英語を中間言語として介さずに2つの言語を直接翻訳する多言語機械翻訳(MMT)モデルをGitHubで公開した。毎日200億回以上の翻訳を行っているニュースフィードでも将来的にはこのモデルを採用する計画だ。

[ITmedia]

 米Facebookは10月19日(現地時間)、中間言語として英語を使わずにダイレクトに2国語間の翻訳を行う多言語機械翻訳(MMT)モデル、「M2M-100」を発表した。GitHubで公開している。

 Facebookは現在、プラットフォーム上で提供している翻訳サービスでは中間言語として英語を介している。

 trans Facebookは現在、プラットフォーム上の翻訳は1つの言語を一旦英語に翻訳し、そこからもう1つの言語に翻訳している

 新モデルでは英語データに依存せずに100言語の組み合わせで直接翻訳できるとしている。これにより、機械翻訳の評価に一般的に使わるBLEUの評価が、英語を介するシステムより平均で10ポイント高くなったという。

 中間言語として英語を用いるのは、サンプルデータが豊富だからだ。Facebookは数年かけて100言語の75億文のデータセットを構築し、150億以上のパラメータを使ってユニバーサル翻訳モデルをトレーニングした。

 trans 2 「M2M-100」での翻訳の流れ

 Facebookのニュースフィード上では1日当たり200億件以上の翻訳を行っているという。M2M-100を本番環境に移行するために、さらにモデルを改善していくとしている。

Copyright © ITmedia, Inc. All Rights Reserved.