連載
» 2017年08月02日 06時00分 UPDATE

鈴木淳也の「Windowsフロントライン」:AIチップ搭載の「次世代HoloLens」で可能になること

それ自体がWindows 10搭載マシンでもあるMicrosoftの高性能なMR HMD「HoloLens」。次世代モデルはディープラーニング処理までHMD側で行えるようになる。

[鈴木淳也(Junya Suzuki),ITmedia]

 今世界で最先端を走る企業にとって「AI」への取り組みは大きな比重を占めている。単純にAIと言うと意図が見えにくいが、膨大の量のデータを処理する機械学習、そしてその手法の1つであるディープラーニングの能力向上が、効率的なデータ処理や認識技術の精度上昇などをもたらし、日常生活に欠かせないものになるはずだ。

 Microsoftのここ最近の動きを見ても、Skypeにおける機械翻訳精度の向上や、ビデオ編集機能(Windows Story Remix)に用いられる自動の画像認識サービスなど、さまざまな形で現出している。

 一方、こうしたディープニューラルネットワーク(DNN)の実現には、機械学習における膨大なデータ処理だけでなく、既存の汎用(はんよう)的なプロセッサとメモリアーキテクチャでは高速処理が難しいという問題が存在する。

 これに対し、高性能なGPUやFPGAを大掛かりに利用するトレンドがあり、例えばGoogleでは「TensorFlow」という機械学習ライブラリを効率的に実行できる専用プロセッサ「TPU(Tensor Processing Unit)」を発表するなど、各社がハードウェア設計に踏み込んだ独自のアプローチを見せつつある状況だ。

 Microsoftも例外ではなく、2016年9月に米ジョージア州アトランタで開催したイベント「Ignite 2016」において、「世界初のAIスーパーコンピュータ」と銘打ってAzureデータセンターにFPGAモジュールを導入し、DNNの高速処理を実現していることをアピールしている。

AIコプロセッサ「HPU 2.0」でHoloLensがより高性能に

 現在はデータセンター方面で激しい動きがみられるディープラーニングの世界だが、膨大なデータを通信帯域を圧迫せずに低遅延で処理するために、センサーで得られたデータの処理をエッジ側で行う試みが進んでいる。

 つまりクラウド側で全てのディープラーニング処理を行うのではなく、末端のデバイスにディープラーニング処理が可能な高性能プロセッサを搭載することで、特にレスポンスが要求される部分の認識処理をローカルで済ませてしまおうというのだ。

 実際、MicrosoftはAI処理に特化したチップを搭載するコプロセッサ「HPU(Holographic Processing Unit) 2.0」を開発したことをMicrosoft Researchの公式ブログで報告している。同社が開発するMR(Mixed Reality)対応HMDである「HoloLens」の次世代モデルに、このHPU 2.0が搭載される計画だ。

HPU 2.0
HPU 2.0 HPU 2.0の紹介動画より

 もっとも、HPU 2.0を搭載した「HoloLens v2(仮称)」はすぐには登場しない。以前にもレポートしたように、現在のターゲット時期は2019年ごろと言われており、まだしばらくは内部開発フェーズが続くことになりそうだ。

 HPU 2.0の取り組みは、米ハワイ州ホノルルで7月に行われたAI関連の会議「CVPR 2017」にて、米MicrosoftのAI&リサーチ部門エグゼクティブバイスプレジデントであるハリー・シュム氏が講演して発表した。

 既存のHPU(1.0)を備えたHoloLensは、ヘッドギアの部分にディスプレイだけでなく、バッテリーからセンサー、そのままWindows 10搭載PCとして機能するプロセッサまで全ての要素を盛り込んでおり、スタンドアロンで動作するのが特徴だ。

 さらに周囲の地形や物体の動きなどの状況を認識するための「センサーフュージョン」という仕組みを備えており、これにHPUを組み合わせることで、「あたかも現実空間にCGで描かれた物体が存在する」かのように、装着者に現実とデータが融合した世界を見せることができる。

HoloLens 現行のHoloLensに搭載されるHPUを含むプロセッサボード

HPU 2.0を備えたHoloLens試作機のデモ

 それでは、HPU 2.0を備えた次世代のHoloLensでは、どのようなことが実現できるようになるのだろうか。米MSPoweruserでは、現地の参加者が録画してネット上に公開した映像を紹介しており、その一端を見ることができる。

 現在、装着者がHoloLensに対して操作を行う場合、主にカーソルを動かす「視線移動(Gaze Tracking)」とクリック動作にあたる「AirTap」と呼ばれるジェスチャーを用いる。しかし公開されているCVPRのデモ動画を見ると、両手の10本の指の動きをHoloLensが認識できており、より細かいジェスチャー操作が可能になっていることが分かる。

 開発中のため、これは実現される機能の一部にすぎないと予想されるが、センサーフュージョンで得られるデータの種類が増え、よりリアルタイムで緻密な動きをHoloLensが認識できるようになると考えられる。この研究開発の過程は、今後何らかの形でMicrosoftから段階的に発表されることになるだろう。今後の動向に注目したい。

Copyright© 2017 ITmedia, Inc. All Rights Reserved.

この記事が気に入ったら
ITmedia PC USER に「いいね!」しよう