ITmedia NEWS > STUDIO >

Google、自然言語理解(NLU)の基礎となる「SyntaxNet」をオープンソース化

» 2016年05月13日 18時56分 公開
[佐藤由紀子ITmedia]

 米Googleは5月12日(現地時間)、機械学習システム「TensorFlow」に統合されたニューラルネットワークフレームワーク「SyntaxNet」をオープンソースで公開したと発表した。GitHubで公開されている。

 自然言語理解(NLU)システムの基礎を提供するものという。SyntaxNetには、新たなモデルに学習させるのに必要なすべてのコードと、英語の文章の構文解析のためにGoogleが開発した英文解析ツールの「Parsey McParseface」が含まれる。

 Parsey McParsefaceは、言語構造解析方法を学習する強力な機械学習アルゴリズム上に構築されており、文章内の各ワードの機能的役割(動詞、形容詞など)を解析できるという。Parsey McParsefaceは世界で最も正確な構文解析ツールだとGoogleは説明する。

 コンピュータにとって、人間の話す自然言語はあまりにあいまいで多数の解釈の可能性があるため、解析するのは非常に難しいが、Parsey McParsefaceはニュース記事のような文章であれば94%の確度で解析できるという。

 以下のような基本的な構文はもちろん、

 parsey 1 「アリスはボブを見た」の構文解析

 例えば以下のような比較的複雑な構文でも解析できる。

 parsey 1 「アリスは昨日、SyntaxNetについて読んでいた時、ボブが廊下にいるのを見た」の構文解析

 なお、Parsey McParsefaceという人名のようなツールの名称には特に意味はないとGoogleは説明している(構文解析するという意味の動詞「parse」から来ているようだが)。

 自然言語の解析は、Googleの「Google Now」や「Now on Tap」、「Google翻訳」のようなツールや、人工知能botなどに欠かせない技術だ。同社はTensorFlowおよびSyntaxNetをオープンソース化することにより、エコシステムでの関連技術の向上を目指しているようだ。

Copyright © ITmedia, Inc. All Rights Reserved.