米Googleは9月27日(現地時間)、「Google翻訳」の新しい翻訳システム「Google Neural Machine Translation(GNMT)」を発表した。まずは機械翻訳が難しいことで悪名高い中国語から英語への翻訳で採用した。
Neural Machine Translation(NMT)を大まかに説明すると、ある言語の単語を系列データとして固定長のベクトルに置き換え、それを別の言語の系列データに変換する「エンコーダ・デコーダ」モデルをニューラルネットワークで行うというものだ。デコーダは元の言語のベクトル間の関連性の重みに注意を払いながらデコードする。
GNMTは同社がオープンソースで公開している機械学習システム「TensorFlow」および機械学習向けハードウェア「Tensor Processing Unit(TPU)」で実現したオリジナルのNMTシステムだ。
Google翻訳では現在、フレーズ間の翻訳確率を計算して翻訳先の言語の適切な語順に並べ替える、フレーズベース機械翻訳(PBMT)を採用しているが、GNMTはほとんどの言語でPBMTよりも翻訳精度が上がるという。
PBMTとGNMTの翻訳精度をWikipediaやニュースサイトのテキストを使って幾つかの言語間で比較したところ、GNMTの方が翻訳エラーが55〜85%少なかったという。
Googleは、向こう数カ月をかけて、中国語から英語以外の組み合わせについてもGoogle翻訳でのGNMT採用を拡大していく計画だ。
「Google翻訳」アプリ、ディープラーニング採用で画像読み取りに20カ国語追加
Google、日本語もサポートのクラウド自然言語APIとスピーチAPIを一般向けにβ公開
Google、自然言語理解(NLU)の基礎となる「SyntaxNet」をオープンソース化
GoogleとUDACITY、「TensorFlow」で学ぶディープラーニング講座を開設Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR