ITmedia NEWS > 社会とIT >
ITmedia AI+ AI活用のいまが分かる

世界で活躍するチャットbot 広がり続ける「自然言語処理」の可能性よくわかる人工知能の基礎知識(3/5 ページ)

» 2019年09月24日 07時00分 公開
[小林啓倫ITmedia]

ニューラル機械翻訳のすごさ

 連載の第3回で解説したように、ディープラーニングは人間が大量のデータを与えるだけで、(形態素解析のような)データを処理するアプローチを設定しなくても、データを解釈するための思考回路を機械が自らつくり出す。例えば日本語で書かれた文章と、それを正しい英語に訳した文章のデータが大量にあれば、それをディープラーニングで処理させることで、「和文を英文にする」思考回路をコンピュータの中につくり出すことができる。つまり機械翻訳アプリだ。

 これは「ニューラル機械翻訳」と呼ばれるアプローチで、2016年にはGoogleが提供する「Google翻訳」サービスの精度を飛躍的に向上させたとして話題になった。

 それまでの機械翻訳では、ある言語と別の言語との対訳データを統計的に処理し、「このような言葉はこのように訳される可能性が高い」という結果に基づいて翻訳を行っていた。このアプローチは「統計翻訳」と呼ばれる。この統計的処理を行う際、語彙(ごい)や構文など文章が持つどのような要素でどのような処理をしていくかについてのルールは、言語学の知識を基に人間が設定していた。

 一方のニューラル機械翻訳では、画像認識の場合などと同様、そうしたルールをあらかじめ設定しなくても、与えられたデータの中から機械が処理のモデルを編み出していく。人間が母語を習得するときのように、文法などの知識を前提とせず、与えられたサンプルの中から自ら思考回路を形成する。そのため、より人間に近い形で高精度に文を解釈し、さらに翻訳(学習)を続けることで精度向上も期待できる。

 この説明は、自然言語処理におけるディープラーニングの応用を非常に単純化したものだ。実際にはどのように思考回路を形成すればより精度の高い翻訳を実現できるのか、研究者の間でも模索が続いている。

 また学習には質の良いデータが大量に必要で、それを処理するための大きなコンピューティングリソースと時間も必要だ。結果として生成された思考回路はブラックボックスに近い存在になってしまう。実際には文章が続いているのに、AIが勝手に終わったと解釈して翻訳を終えてしまい、訳されない部分が残るといったニューラル機械翻訳特有の問題も存在している。

 人間のコミュニケーション全体を考えると、そこには言葉だけでなく、ジェスチャーや表情、さらにはコミュニケーションの参加者たちが共通して持つ「文化的背景」に至るまで、さまざまな要素が関係している。

 文章によるコミュニケーションでも「行間を読む」という表現があるように、メッセージの受け手側に言語以外の共通基盤が必要となる。ある言葉を機械が100%正しく理解できるよう、こうした要素にどう対応していくのか。さらなるテクノロジーやアプローチの進化が求められている状況だ。

Copyright © ITmedia, Inc. All Rights Reserved.