News 2002年12月10日 11:50 PM 更新

“ロボット研究所”が成果を公開――産総研「オープンハウス2002」(2/3)


前のページ

ロボットの「目」となる“実時間3次元ビジョンシステム”

 HRP-2の特徴的な頭部には、3眼ステレオカメラが搭載されている。プロトタイプではゴーグル部分に3つのカメラが収められていたが、今回の最終成果機では、アゴの両サイドに設けられたエアダクトのような部分に1眼ずつ割り振ることで、すっきりしたフェイスラインと、ステレオ画像処理の性能向上を図っている。


HRP-2の頭部には3眼ステレオカメラが搭載されている

 この3眼ステレオカメラに採用されているのが、産総研3次元視覚システム研究グループが開発した「Hyper Frame Vision」だ。「静止することなく移動する物体をステレオ処理によって実時間で位置決めすることが可能な、世界初の“実時間3次元ビジョンシステム”」(産総研)。


HRP-2にも採用された3眼ステレオカメラの「Hyper Frame Vision」

 従来の動画像処理は、センサーから時系列で入力される画像フレームを短時間で処理することを基本としていたため、「ピンク色のボールを追いかける(2自由度)」といった単純な機能しか実現できなかった。Hyper Frame Visionでは、複数のCCDカメラを使ったステレオ画像処理アルゴリズムと大容量のフレームバッファを用いることで6自由度の位置決めが可能となった。また、一般に売られているPCとCCDカメラでシステムを構築できるのも特徴だ。


移動する物体の位置姿勢計測や追跡は、ロボットの「目」には必須機能

 「未知の背景や異なる物体が混在する環境下でも、移動する物体の位置姿勢計測や追跡が行える。3次元的な位置測定を6自由度で計測する処理は、ロボットの視覚システムには必須機能。ロボットが移動物体を操作したり、逆に移動するロボットの環境認識などに応用できる」(産総研)。

コンパクトなシステムで自然な音声合成を実現

 機械に発声させる「音声合成」も、ロボット開発に欠かせない研究の1つだ。最近では、カーナビゲーションシステムやCTI、福祉分野などさまざまな場所で音声合成は利用されている。だが、いわゆる“ロボットボイス”でイントネーションが不自然で聞き取りにくかったり(規則合成方式)、語彙が少ないケース(録音編集方式)が多かった。

 産総研の知的インタフェース研究グループが開発した音声合成システムは、コーパス(言語分析用データベース)型音声合成にサブバンド技術を融合させることで、人間の肉声による自然な音声合成システムが、従来よりも大幅にコンパクトな音声辞書で構築できるという。「コーパスとなる外部音声辞書は、サブバンド処理によって周波数データのみで済むため、従来の1/10のデータ量で済む」(産総研)。


自然な音声ナビを行うケンウッド製カーPC試作機

 サイズがコンパクトになったことで、組み込みシステムでも肉声による自然な音声合成を可能にしている。会場では、Crusoe搭載のケンウッド製カーPC試作機に同システムを組み込んで、自然な音声ナビゲーションを行うデモンストレーションを行っていた。

[西坂真人, ITmedia]

Copyright © ITmedia, Inc. All Rights Reserved.

前のページ | 2/3 | 次のページ