米Googleは9月27日(現地時間)、「Google翻訳」の新しい翻訳システム「Google Neural Machine Translation(GNMT)」を発表した。まずは機械翻訳が難しいことで悪名高い中国語から英語への翻訳で採用した。
Neural Machine Translation(NMT)を大まかに説明すると、ある言語の単語を系列データとして固定長のベクトルに置き換え、それを別の言語の系列データに変換する「エンコーダ・デコーダ」モデルをニューラルネットワークで行うというものだ。デコーダは元の言語のベクトル間の関連性の重みに注意を払いながらデコードする。
GNMTは同社がオープンソースで公開している機械学習システム「TensorFlow」および機械学習向けハードウェア「Tensor Processing Unit(TPU)」で実現したオリジナルのNMTシステムだ。
Google翻訳では現在、フレーズ間の翻訳確率を計算して翻訳先の言語の適切な語順に並べ替える、フレーズベース機械翻訳(PBMT)を採用しているが、GNMTはほとんどの言語でPBMTよりも翻訳精度が上がるという。
PBMTとGNMTの翻訳精度をWikipediaやニュースサイトのテキストを使って幾つかの言語間で比較したところ、GNMTの方が翻訳エラーが55〜85%少なかったという。
Googleは、向こう数カ月をかけて、中国語から英語以外の組み合わせについてもGoogle翻訳でのGNMT採用を拡大していく計画だ。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR