「Google翻訳」にニューラルネット機械翻訳技術を採用 まずは中国語→英語で
Googleが、Google翻訳で採用する技術を、従来のフレーズベース機械翻訳(PBMT)からGoogle開発のニューラル機械翻訳(GNMT)に置き換えていくと発表した。中国語から英語への翻訳については既に実施済みだ。
米Googleは9月27日(現地時間)、「Google翻訳」の新しい翻訳システム「Google Neural Machine Translation(GNMT)」を発表した。まずは機械翻訳が難しいことで悪名高い中国語から英語への翻訳で採用した。
Neural Machine Translation(NMT)を大まかに説明すると、ある言語の単語を系列データとして固定長のベクトルに置き換え、それを別の言語の系列データに変換する「エンコーダ・デコーダ」モデルをニューラルネットワークで行うというものだ。デコーダは元の言語のベクトル間の関連性の重みに注意を払いながらデコードする。
*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***
GNMTは同社がオープンソースで公開している機械学習システム「TensorFlow」および機械学習向けハードウェア「Tensor Processing Unit(TPU)」で実現したオリジナルのNMTシステムだ。
Google翻訳では現在、フレーズ間の翻訳確率を計算して翻訳先の言語の適切な語順に並べ替える、フレーズベース機械翻訳(PBMT)を採用しているが、GNMTはほとんどの言語でPBMTよりも翻訳精度が上がるという。
PBMTとGNMTの翻訳精度をWikipediaやニュースサイトのテキストを使って幾つかの言語間で比較したところ、GNMTの方が翻訳エラーが55〜85%少なかったという。
Googleは、向こう数カ月をかけて、中国語から英語以外の組み合わせについてもGoogle翻訳でのGNMT採用を拡大していく計画だ。
関連記事
- 「Google翻訳」アプリ、ディープラーニング採用で画像読み取りに20カ国語追加
Google翻訳のモバイルアプリの、端末のカメラで映した映像内のテキストをリアルタイムで翻訳する機能が新たに20カ国語に対応した(日本語はまだ)。Googleはこの機能で採用したディープニューラルネットワーク技術について説明している。 - Google、日本語もサポートのクラウド自然言語APIとスピーチAPIを一般向けにβ公開
Googleがクラウドサービス「Google Cloud Platform」で利用できる自然言語APIと音声認識APIをβ公開した。Googleが「Google Now」などで使っている技術を無料〜低価格で利用できる。 - Google、自然言語理解(NLU)の基礎となる「SyntaxNet」をオープンソース化
Googleが、自然言語理解のためのニューラルネットワークフレームワーク「SyntaxNet」をオープンソースで公開した。機械学習システム「TensorFlow」の一部としてGitHubで公開された。SyntaxNetの構文解析ツール「Parsey McParseface」は“世界一正確に構文解析するツール”という。 - GoogleとUDACITY、「TensorFlow」で学ぶディープラーニング講座を開設
機械学習に注力するGoogleが、MOOCのUDACITYと協力し、ディープラーニングの基本を無料で学べるコースを開設した。教材には同社のオープンソースの機械学習システム「TensorFlow」を使う。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.