検索
ニュース

Microsoftが「会話Bot」に力を注ぐ理由Build 2016(3/3 ページ)

米Microsoftの開発者会議「Build 2016」で少々予想外だったのが、会話Botや認識コンピューティングに関する発表だ。ITを直接的な生産性向上ツールに限らず、アシスタントとして活用する方向性がより明確になってきた。

Share
Tweet
LINE
Hatena
前のページへ |       
※本記事はアフィリエイトプログラムによる収益を得ています

認識コンピューティングの先にあるもの

 IBMではWatsonを紹介するにあたって「Cognitive Computing(認識コンピューティング)」という表現を使っている。コンピュータが問い合わせを理解し、それに対して適切な回答を返すという仕組みだ。よく「AI(Artificial Intelligence)」というキーワードがこの周辺で用いられているが、筆者の認識ではWatsonやMicrosoftが今回発表した一連の仕組みは、いわゆるAIとは違うものだと考えている。

 AIでは自ら意志を持って決定するが、WatsonやMicrosoftの自然言語インタフェースは「問い合わせに対して適切な処理」を行う仕組みであり、コンピュータ側にとって何らかの意志が介在する余地はない。厳密にはプログラミング次第と考えられるが、現在想定されているサービスの数々は「コンピュータによる自動処理」という域を出ていない。

 意志が介在しないとはいえ、こうしたBotの仕組みは自然言語処理だけでなく、工夫次第でさまざまな機能強化が可能だ。Microsoftが提供しているCognitive ServicesのAPIを活用することで、BotにさまざまなCognitive(認識)機能を付与できるようになる。

 例えば画像認識のAPIを追加することで、カメラや写真に写る映像を解析してその内容を理解し、音声認識のAPIを利用することで、普通の人間よりも正確に多人数の会話を聞き取ることができる。このCognitiveなAPI群は、特にCortana型のパーソナルアシスタント機能で大きな効力を発揮するだろう。

複数の認識型APIを用意
「Cognitive Services」では複数の認識型APIが用意されており、開発者はこれらを組み合わせてBotの強化が可能になる
画像認識API(1)
画像認識のAPIを利用すると、スマートフォンで撮影した画像をクラウドが自動処理して構成要素を自動的に割り出す
画像認識API(2)
撮影した画像に何が写っているのかを自動判別しているデモ
画像認識APIを利用したBot
この画像認識APIをBotに応用すると、このようにアップロードした画像が何を意味しているのかを自動判別して返答する仕組みも構築できる
音声認識API
音声認識APIでは、複数人の音声会話を自動的に認識してテキスト化(キャプション化)することが可能になる。複数人が同時にしゃべっていたとしても、問題なく内容を聞き取って、まるで聖徳太子のように結果を返してくれる

 米Microsoftのサティア・ナデラCEOとともにBuild 2016の基調講演に登場したのは、同社ロンドン拠点のBingチームエンジニアであるシャキーブ・シャイク氏だ。同氏は視力にハンディキャップを抱えており、もしこれらのCognitiveなAPI群を活用したアプリケーションで視力を補うことができれば、日常生活がより便利になるという紹介ビデオが会場で流された。このようにBot FrameworkとCognitive Servicesの組み合わせは、非常に大きな可能性を秘めた仕組みだ。

シャキーブ・シャイク氏
米Microsoftのサティア・ナデラCEO(右)の横に立つのは、同社ロンドン拠点のBingチームエンジニアであるシャキーブ・シャイク氏(左)。視力にハンディキャップを抱えてる
シャキーブ・シャイク氏が出演しているCognitive Servicesの紹介ビデオ。認識APIと適切な「アシスタント」さえいれば、周囲の状況を把握し、対面にどのような人物がいて、さらにレストランで紙のメニューを渡されても、その内容を理解できるようになる……というのが、この一連のサービスの目指す方向の1つでもある

 興味深いのは、自然言語処理と認識型APIともに、中国の北京に拠点を置くMicrosoft Research Asia(MSRA)での研究成果がベースとなっていることだ。その成果については過去の連載記事でも紹介したが、MSRAは将来のMicrosoftを担う重要な基盤となりつつあるのかもしれない。

 技術のさらなる進化と合わせて、その応用例としてサードパーティーの興味深いアプリケーションがどれだけ出てくるのか、今後1〜2年先の動向を見守っていきたい。

←・前回記事:Windows 7時代のアプリを「10」対応にするメリットは?

前のページへ |       

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る