Microsoftが「会話Bot」に力を注ぐ理由Build 2016(3/3 ページ)

» 2016年04月07日 13時30分 公開
前のページへ 1|2|3       
※本記事はアフィリエイトプログラムによる収益を得ています

認識コンピューティングの先にあるもの

 IBMではWatsonを紹介するにあたって「Cognitive Computing(認識コンピューティング)」という表現を使っている。コンピュータが問い合わせを理解し、それに対して適切な回答を返すという仕組みだ。よく「AI(Artificial Intelligence)」というキーワードがこの周辺で用いられているが、筆者の認識ではWatsonやMicrosoftが今回発表した一連の仕組みは、いわゆるAIとは違うものだと考えている。

 AIでは自ら意志を持って決定するが、WatsonやMicrosoftの自然言語インタフェースは「問い合わせに対して適切な処理」を行う仕組みであり、コンピュータ側にとって何らかの意志が介在する余地はない。厳密にはプログラミング次第と考えられるが、現在想定されているサービスの数々は「コンピュータによる自動処理」という域を出ていない。

 意志が介在しないとはいえ、こうしたBotの仕組みは自然言語処理だけでなく、工夫次第でさまざまな機能強化が可能だ。Microsoftが提供しているCognitive ServicesのAPIを活用することで、BotにさまざまなCognitive(認識)機能を付与できるようになる。

 例えば画像認識のAPIを追加することで、カメラや写真に写る映像を解析してその内容を理解し、音声認識のAPIを利用することで、普通の人間よりも正確に多人数の会話を聞き取ることができる。このCognitiveなAPI群は、特にCortana型のパーソナルアシスタント機能で大きな効力を発揮するだろう。

複数の認識型APIを用意 「Cognitive Services」では複数の認識型APIが用意されており、開発者はこれらを組み合わせてBotの強化が可能になる
画像認識API(1) 画像認識のAPIを利用すると、スマートフォンで撮影した画像をクラウドが自動処理して構成要素を自動的に割り出す
画像認識API(2) 撮影した画像に何が写っているのかを自動判別しているデモ
画像認識APIを利用したBot この画像認識APIをBotに応用すると、このようにアップロードした画像が何を意味しているのかを自動判別して返答する仕組みも構築できる
音声認識API 音声認識APIでは、複数人の音声会話を自動的に認識してテキスト化(キャプション化)することが可能になる。複数人が同時にしゃべっていたとしても、問題なく内容を聞き取って、まるで聖徳太子のように結果を返してくれる

 米Microsoftのサティア・ナデラCEOとともにBuild 2016の基調講演に登場したのは、同社ロンドン拠点のBingチームエンジニアであるシャキーブ・シャイク氏だ。同氏は視力にハンディキャップを抱えており、もしこれらのCognitiveなAPI群を活用したアプリケーションで視力を補うことができれば、日常生活がより便利になるという紹介ビデオが会場で流された。このようにBot FrameworkとCognitive Servicesの組み合わせは、非常に大きな可能性を秘めた仕組みだ。

シャキーブ・シャイク氏 米Microsoftのサティア・ナデラCEO(右)の横に立つのは、同社ロンドン拠点のBingチームエンジニアであるシャキーブ・シャイク氏(左)。視力にハンディキャップを抱えてる
シャキーブ・シャイク氏が出演しているCognitive Servicesの紹介ビデオ。認識APIと適切な「アシスタント」さえいれば、周囲の状況を把握し、対面にどのような人物がいて、さらにレストランで紙のメニューを渡されても、その内容を理解できるようになる……というのが、この一連のサービスの目指す方向の1つでもある

 興味深いのは、自然言語処理と認識型APIともに、中国の北京に拠点を置くMicrosoft Research Asia(MSRA)での研究成果がベースとなっていることだ。その成果については過去の連載記事でも紹介したが、MSRAは将来のMicrosoftを担う重要な基盤となりつつあるのかもしれない。

 技術のさらなる進化と合わせて、その応用例としてサードパーティーの興味深いアプリケーションがどれだけ出てくるのか、今後1〜2年先の動向を見守っていきたい。

←・前回記事:Windows 7時代のアプリを「10」対応にするメリットは?

前のページへ 1|2|3       

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2026年04月04日 更新
  1. 迷走の5年間を経て――MicrosoftがWindows 11の“不都合な真実”を認め、改善を宣言した背景 (2026年04月01日)
  2. Windows 11(24H2/25H2)の3月オプション更新でインストールできないトラブル 「帯域外更新」で対処 (2026年04月02日)
  3. 安いMacは「使えない」? MacBook Neo 8GBモデルで試す、後悔しないための活用術と注意点 (2026年04月02日)
  4. 視野2.4倍に拡大したオートフォーカスアイウェア「ViXion2」を試す 近視と老眼の悩みを一気に解消、11万円の価値はあるか? (2026年04月03日)
  5. 3COINSで880円の「3D構造マウスクッション」を試す 通気性抜群、これはトラックボールや分割キーボードに適したリストレストかも (2026年04月03日)
  6. 液晶なのにE Ink風? 約10万円の価値はある? TCLの異色電子ノート「Note A1 NXTPAPER」徹底レビュー (2026年04月03日)
  7. “録画文化”は死ぬのか? 物理メディアの終わりが見えてきた今、TV番組保存の現実的な代替案を考える (2026年04月01日)
  8. 3COINSで1430円の「PCケース:13.3インチ」を試す 収納ポケット充実、フリーアドレスのオフィス移動に便利 (2026年04月02日)
  9. アキバの一部ショップでHDD購入制限の動き――大容量モデルを中心に品薄感 (2026年04月04日)
  10. 1万円台〜3万円台で買える多機能スマーウォッチ――Amazfitの各モデルがセールでさらにお得 (2026年04月02日)
最新トピックスPR

過去記事カレンダー

2026年