ITmedia NEWS > STUDIO >

「Google翻訳」にニューラルネット機械翻訳技術を採用 まずは中国語→英語で

» 2016年09月28日 13時25分 公開
[佐藤由紀子ITmedia]

 米Googleは9月27日(現地時間)、「Google翻訳」の新しい翻訳システム「Google Neural Machine Translation(GNMT)」を発表した。まずは機械翻訳が難しいことで悪名高い中国語から英語への翻訳で採用した。

 Neural Machine Translation(NMT)を大まかに説明すると、ある言語の単語を系列データとして固定長のベクトルに置き換え、それを別の言語の系列データに変換する「エンコーダ・デコーダ」モデルをニューラルネットワークで行うというものだ。デコーダは元の言語のベクトル間の関連性の重みに注意を払いながらデコードする。


 GNMTは同社がオープンソースで公開している機械学習システム「TensorFlow」および機械学習向けハードウェア「Tensor Processing Unit(TPU)」で実現したオリジナルのNMTシステムだ。

 Google翻訳では現在、フレーズ間の翻訳確率を計算して翻訳先の言語の適切な語順に並べ替える、フレーズベース機械翻訳(PBMT)を採用しているが、GNMTはほとんどの言語でPBMTよりも翻訳精度が上がるという。

 gnmt 1 翻訳精度の6段階評価での比較(人間が評価)

 PBMTとGNMTの翻訳精度をWikipediaやニュースサイトのテキストを使って幾つかの言語間で比較したところ、GNMTの方が翻訳エラーが55〜85%少なかったという。

 gnmt 2 中国語の翻訳結果比較

 Googleは、向こう数カ月をかけて、中国語から英語以外の組み合わせについてもGoogle翻訳でのGNMT採用を拡大していく計画だ。

Copyright © ITmedia, Inc. All Rights Reserved.