News 2003年10月23日 09:51 PM 更新

ちょっと内気な君のために「CGキャラでテレビ電話」

テレビ電話で会話をしてみると、「表情」が伝えてくれる情報は実に多彩で便利。けっこう遊べるコミュニケーション手段だが、自分の代わりにアニメキャラが「目からはぁと」してくれたら、いえない想いも楽に告白できるかも。

 「画面に向かって話しかけるのは、まだまだ恥ずかしい」という声がありながら、テレビCMで見る機会が多くなってきた「テレビ電話」的ビジュアルコミュニケーション。

 沖電気が23日に発表した「FaceCommunicator-BBE」(FaceComm-BBE)も、ビジュアルコミュニケーションの世界を広げるソフトの一つだが、自分の代わりに「3DCGのキャラクター」をテレビ会議ソフトに表示できるのがユニークなところ。

 ビジュアルコミュニケーションでは、表情の変化も大事な意思伝達手段に使われるが、FaceComm-BBEでは自分の身代わりである3DCGキャラクターも、ユーザーの動きにあわせて顔を向けたり、表情の変化を認知して喜怒哀楽を「アニメ的デフォルメ」で表現してくれる。


FaceComm-BBEで表示された3DCGのキャラクター。背景の絵も用意されている


猫にもなれるFaceComm-BBE。猫キャラには眉毛が描かれていないので、表情作りに重要な眉の動きは耳の動きにリンクする。そういえば家の猫も、耳と尻尾を見ていれば、思っていることはなんとなく分かるにゃー

 画面に出てくるキャラクターを見ていると「とってもお気軽なお遊びソフト」的雰囲気を醸し出しているが、ソフトの構成や仕掛けは意外と複雑だ。

 カメラに入力された画像から顔の部分を抽出して動きを認識。そしてその認識した顔を構成するパーツの動きにあわせてキャラクターを描画する。この一連の処理を行うのが、沖電気が開発した「FaceCommunicator」(FaceComm)と呼ばれるソフトモジュール。

 FaceCommの内部は大きく分けて「表情ジェネレータ」と「アニメーションジェネレータ」で構成されている。このうち重要になるのが、カメラから入力される画像から顔を認識して、表情を判別する処理を行う表情ジェネレータだ。

 入力された画像から「両目」「眉の線」「口の周り」の点情報を抽出して、両目の位置から顔の動きを判読し、眉の傾きや口の形などから表情を判断。キャラクターの描画で使うパーツの指定や変形量をアニメーションジェネレータに受け渡す。アニメーションジェネレータは受け取った指示に従ってキャラクターを3Dで描画するわけだ。


FaceCommunicatorのモジュール構成


画像センサで捉えたユーザーの顔情報。処理を軽くするために、眉は2点、眼は一つ1点、口は周りの線を8点と、位置と表情を判読するための最小限必要なポイントだけを捉えている

 表情ジェネレータからは、入力される顔画像以外にも、用意された感情表現の定型パターンの指定や、あらかじめボックスに入力されたテキストデータが送り込まれる。

 アニメーションジェネレータでは、指定されたパターンにあわせて、「涙ドバァーッ!!」「目か“はぁと”」といった、アニメチックな効果を表現してくれたり、打ち込まれたテキストを合成音声で読み上げてくれたりする。

 また、現在は試作段階だが、音声認識エンジンを実装して、入力されたユーザーの声をFaceComm-BBEが合成音声で話してくれる機能も予定されている。


FaceComm-BBEに用意されているコントロールパネル。キャラクターの指定や定型動作、キャラクターに話させるテキストなどを指定できる

 FaceComm-BBEをインストールすると、カメラのドライバとテレビ会議ソフトの間で動作するようになる。従来、カメラのドライバから直接テレビ会議ソフトに画像データが渡されていたわけだが、インストール後は、ドライバが出力した画像データをFaceComm-BBEが受け取り、変換された3DCGデータを画像データとしてテレビ会議ソフトへ渡すようになる。

 テレビ会議ソフトから見ると、FaceCommはカメラドライバとまったく同じように認識されるため、現在使われているシステムの構成を変えることなく、FaceComm-BBEを導入できるのが特徴だ。

 また、ネットワークインフラがナローバンドでも対応できるように、表情ジェネレータが出力しているデータを、そのままコミュニケーションの相手に送信することも可能になっている。


FaceComm-BBEをドライバとソフトの間に割り込ませるだけで済むので、既存のテレビ電話システムに変更を加える必要はない

 このように仕掛けは複雑だが、将来的には携帯電話でも十分なフレームレートで描画できるように、処理が重くならないような工夫がなされている。顔の抽出でも、バイオメトリックスの顔認証のような精度は求められていないため、顔を認識するポイントを少なくし、100MHzで動作するARMでも15fpsの描画が可能になっている。

 ただし、キャラクターの3DCGをリアルタイムで描画する必要があるため、コミュニケーションに使うデバイスには専用の3Dグラフィックチップがないと、実用的なフレームレートは出せないだろうと、沖電気の担当者は述べている。

 FaceComm-BBEは、映像入力のみに対応したトライアル版が11月1日から出荷を開始する。2004年の2月には映像とテキスト入力に対応したVer1.0も出荷される予定。Ver 1.0では、3DCGキャラクターをユーザーが自分で作成できるツールの供給も検討されている。

 ただし、どちらもインターネットサービスを提供するISPや、通信キャリア向けに出荷されるため、コンシューマー市場では入手できない。ISP向けの販売価格はオープンプライスとなっているが、1000ライセンス契約時の1ライセンスあたりの価格は2400円程度になる見込み。

 今回発表されたFaceComm-BBEはPC向けの製品でこれから3年間で10万ライセンスを目標としているが、沖電気が主なターゲットと考えているのは携帯電話を使ったビジュアルコミュニケーション市場。この市場では3年間で100万ユーザーを目指すとしている。


製品発表当日は沖電気の「OKI 情報通信融合ソリューションフェア2003」が行われており、ブースに展示されてたシステムでFaceComm-BBEを体験できるようになっていた



顔を傾けると3DCGキャラも首を傾げ、渋い表情をするとキャラも眉を八の字に。デモ機はCeleron/1GHzマシンを使っていたが、キャラクター描画の遅延はほとんどなくスムーズに動いていた。ただし、カメラアングルが上から見下ろす角度になっていたため、表情描写や変化が正確に読み取れない場面も見られた

関連リンク
▼ 沖電気

[長浜和也, ITmedia]

Copyright © ITmedia, Inc. All Rights Reserved.



Special

- PR -

Special

- PR -