連載
» 2016年04月25日 15時30分 公開

Microsoftが仕掛ける「会話Bot」の仕組みとは?鈴木淳也の「Windowsフロントライン」(1/2 ページ)

Microsoftを筆頭に、FacebookやLINEからも続々と「会話Bot」の開発環境が発表され、今後の盛り上がりを予感させる。Microsoftが発表したBot開発の仕組みを見ていこう。

 米Microsoftが3月末に開催した開発者会議「Build 2016」で発表された大きなトピックの1つに「Bot Framework」がある。その名の通り、ユーザーと自動で対話できる「会話Bot」のサービスを開発するための仕組みだ。その概要やメリットについては、同会議のイベントレポートでも触れているが、今回はその中身をもう少し詳しく見ていこう。

Bot Microsoftが開発者会議「Build 2016」で発表した「Bot Framework」と「Cognitive Services」は、ユーザーとコンピュータとのやりとりを大きく変えていくかもしれない

「Bot Framework」と「Cognitive Services」

 Bot Frameworkは、同じくBuild 2016で発表された「Cortana Intelligence Suite」に含まれる機能セットの1つだ。

 Cortanaと銘打っているものの、Cortana Intelligence Suiteは「大量のデータを集め、理解し、必要なアクションを起こす」という「ビッグデータ」「機械学習」「データ解析」といった要素を集めた機能群の総称であり、音声対応パーソナルアシスタントのCortanaは、そのインタフェースの1つでしかない。

 収集されたデータに対して必要なアクションを起こし、ユーザーとの仲介を果たすのがCortanaであり、今回のテーマでもあるBot Frameworkとなる。

 また、集めた大量のデータや機械学習を経て、人間に近い知覚や認識が可能な機能群は「Cognitive Services」と呼ばれる。図では「Intelligence」でくくられているが、機械があたかも人間のように振る舞ってユーザーの行動をアシストする仕組みを構築するのがCortana Intelligence Suiteの狙いと言える。

Cortana Intelligence Suite 「Cortana Intelligence Suite」におけるインタフェース的な役割として「Bot Framework」と「Cognitive Services」は存在する

 もしあなたがアプリやサービスの開発者だとして、こうした「認識」に関わる機能を自らのアプリやサービスに組み込もうとした場合、自前でそれを実現するのは容易ではないことはすぐに分かるだろう。写真の中の人物を認識したり、あるいは相手の話している内容を理解したりすることは、その筋の専門家でなければ「使える機能」として実装するのは難しい。

 そこで登場するのがCognitive Servicesだ。同サービスでは画像認識から構文理解、さらには言語変換まで、認識に必要なあらゆる機能群が網羅されており、これらを適時アプリやサービスに組み込むことで、より「インテリジェントな仕組み」を構築できるようになる。

Cognitive Services(1) Cognitive Servicesで提供される5つの要素
Cognitive Services(2) Cognitive Servicesの5つの構成要素を機能別にまとめたもの
自然言語処理 Cognitive Servicesによる自然言語処理の例
画像認識 Computer Vision APIによる画像認識の例

 このCognitive Servicesで提供される機能の幾つかは、Build 2015で発表された「Project Oxford」がベースとなっている。Project Oxfordでは顔認識から音声認識、言語解析(Language Understanding Intelligent Service:LUIS)などが網羅されていたが、これらを体系化してまとめたのがCognitive Servicesだと言える(実際、Project Oxfordのページにアクセスしようとすると、Cognitive Servicesのページへと自動転送される)。

 筆者も北京にあるMicrosoft Research Asia(MSRA)でProject Oxfordを見たが、近年のMicrosoftは特にこの分野での研究開発を強化していたと認識している。先のCortana Intelligence Suiteはその集大成だ。

Project Oxford Cognitive Servicesは2015年発表された「Project Oxford」が基になっている
Project Oxfordの顔認識 Project Oxfordにおける顔認識の例。この機能はそのままCognitive Servicesに受け継がれている
       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2023年11月11日 更新
  1. 「Meta Quest 3」を仕事に生かす 最大5画面のデスクトップを表示するMR対応「Immersed」は神アプリか (2023年11月09日)
  2. Googleの新型スマートウォッチ「Pixel Watch 2」はどこが変わった? 試して分かったこと (2023年11月10日)
  3. 次世代の「Core Ultraプロセッサ」に採用! リアルタイムレイトレに対応したIntel内蔵GPUの“秘密”に迫る (2023年11月09日)
  4. ウエスタンデジタル、小型スティック筐体を採用したUSB外付けポータブルSSD (2023年11月10日)
  5. ウエスタンデジタル、USB 3.2外付けポータブルSSD「サンディスク ポータブルSSD」の新モデル 転送速度を最大800MB/sに高速化 (2023年11月09日)
  6. 今後のMacはどうなる!? 新型「iMac」に見るGPUを強化したM3チップの実力 (2023年11月07日)
  7. M3ファミリー搭載の新型iMacと16インチMacBook Proを試して分かったこと (2023年11月06日)
  8. 「Steam Deck」にOLEDディスプレイ採用の上位モデルが追加 (2023年11月10日)
  9. 創業111周年を迎えたシャープのターンアラウンド 技術を軸にエッジAIで他社と連携も CTO兼R&D担当役員に聞く (2023年11月08日)
  10. 18.5型のビッグサイズでデスクトップ用スタンドも付属! VGA接続にも対応したアイティプロテックのモバイルディスプレイ「LCD18HCR-IPS」を試して分かったこと (2023年11月08日)