あなたの声で、1枚の写真がしゃべる3Dモデルに──「絵しゃべりメール」の裏にある技術ケータイサービスを支える技術

» 2007年07月25日 17時09分 公開
[後藤祥子,ITmedia]
Photo 絵しゃべりメールの裏で動くバーチャルキャラクター合成技術「Veepers Content Engine」を提供するPulseの千財悟郎代表取締役

 自分の声でハニワやモアイ像、犬、魚がしゃべる──。こんなムービーを手軽に作成できるのが、au携帯向けサービスの「絵しゃべりメール」(月額利用料105円)だ。KDDIがauの一部秋冬モデル向けにサービスを開始し、夏モデルではWIN端末の全機種に標準搭載した。

 ユーザーは端末にプリインストールされた絵しゃべりメールアプリを立ち上げ、用意されたさまざまな画像の中から好みの画像を選択。自分の声を録音して決定ボタンを押せば、ムービーが自動で生成されダウンロード可能になる。

 作成したムービーは、3キャリアの3G携帯向けに送信できるほか、端末内に保存して着信ムービーとして使うことも可能。携帯動画が普及し始める中、ムービーでメールコミュニケーションの幅を広げるユニークなサービスだ。

 このサービスにバーチャルキャラクター合成技術「Veepers Content Engine」を提供しているのが、米Pulse Entertainment。このVeepers Content Engineの特徴と応用分野について、Pulseの千財悟郎代表取締役に聞いた。

Photo 大仏、モアイ像からラバーダッキー、犬、ぬいぐるみ、熱帯魚まで、さまざまな画像が用意される

写真と音声データがあれば、リアルな表情でしゃべる3Dモデルを作れる

 「写真に目と口さえあればしゃべらせることができる」(千財氏)──これがVeepers Content Engineの特徴を端的に言い表している。顔の特徴点を抽出できる静止画と音声さえあれば、声にシンクロして口を動かしたり、まばたきしたりする3Dモデルを容易に生成できるというわけだ。

 絵しゃべりメールでは、あらかじめ目、鼻、口などの特徴点を調整した写真やイラストが用意され、ユーザーが吹き込んだ声に合わせて口の動きやまばたきなどの表情をつけたムービーを生成する。「音を吹き込むと、自動的に母音や子音、何をしゃべっているかを解析し、それに合わせてしゃべるところまでを全自動で生成できる。初めて利用する人でも、3分程度で(自分の声で話す)キャラクターを作成できる」(千財氏)

 Veepers Content Engineには、写真から顔の特徴点を自動抽出して3Dキャラクター化する機能があり、写真を取り込むだけで3Dモデル化が可能だと千財氏。声の抑揚に合わせて頭に動きをつけたり、眉を少し上げたりといったこまかい仕草まで、音声から自動で生成できるという。

 「目線を下げるというコマンド以外、口と首から上の動きはすべて自動で生成できる。リアルタイムの音声にも対応できるので、簡単なニュース配信程度なら生成したモデルの音声を差し替えるだけで、簡単にアップデートできてしまう」(千財氏)

 すでに携帯分野以外の導入事例もあり、国内では絵本の付録CD-ROMの、動物がことわざを話すシーンに使われたほか、ニュース番組でペットの写真が占いを読み上げるコーナーに採用されたと千財氏。海外ではBudweiserやCoca-ColaのWebサイトに採用されて人気を博したという。「Budweiserのサイトではユーザーが手持ちの写真をアップロードでき、自分のペットをしゃべらせたりすることもできる。グリーティングカードに近い形のサービスとして提供され、サイト内のコンテンツの中でも人気が高かった」(千財氏)

Photo よりリアルな動きにするための、パーツごとの細かい調整も可能
Photo 感情や目線、表情の設定にも対応する

人とマシン間にあるインタフェースの垣根を取り払う

 千財氏は携帯向けサービスではまず、絵しゃべりメールを軌道に乗せることが目標だと話す。「このサービスは、コンテンツの新しいプラットフォームともいえる。キャラクターを持っているコンテンツプロバイダには、既存のコンテンツを手間をかけずに再利用できるというメリットがある」(千財氏)。

 他の分野についても、さまざまな形で応用できそうな技術だ。「インタフェースが強みなので、その下に“どんなアプリを持ってくるか”によっていろいろと応用が利く。Eラーニングなのか、コミュニケーションなのか情報配信なのかにかかわらず、いろんなものを上に載せることができる」(千財氏)

 Veepersを通じて同社が目指すのは、“人とマシン間にあるインタフェースの垣根を取り払う”ことだという。「いかに心理レベルでコミュニケーションを図られるかの研究開発を進めている。そこをやらない限り、一定のレベル以上にはいけないのではないかと考えている」(千財氏)

 こうした視点で考えると、カーナビやATM、自動受付案内などへの搭載の可能性が見えてくる。「人と機械とが触れあう接点があるところなら、ディスプレイがあるかぎりどこでも載せられる。機械の先にあたかも人がいるような、自然な意志疎通の手段を提供するのが目標」(千財氏)

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年03月29日 更新
最新トピックスPR

過去記事カレンダー

2024年