ITmedia NEWS >

それよりもっと未来を見つめて〜NHK技研公開2004(3/3 ページ)

» 2004年05月28日 07時09分 公開
[こばやしゆたか,ITmedia]
前のページへ 1|2|3       

 こちらもキャスターライトなんだけど、いまをときめく有機ELを使っている。もともとが面光源なので、LEDよりもまぶしくない。熱の発生も少ない。薄くて軽いので、どこにでも貼り付ける(蛍光燈やLEDでは「置く」だ)ことができる。そして、RGBの膜を調整すれば色温度も好きなようにできるなんていう大きなメリットがある。消費電力は5Wくらい。蛍光燈は8Wなので、思ったよりも省電力ではなかった。

photo

 なにより、いまのところの弱点は寿命だ。だいたい5000時間。今使われている蛍光燈は8000時間くらいだそうだから、それよりも短い(高いのに)。LEDと比べると1割以下だ。これさえクリアされれば、こっちのほうが使いやすいってことになりそうだ。

 それにしても、これを見に来る人がみんな「寿命は?」って聞いているのが、おかしかった。いま、「有機EL」と「寿命」ってのは対句なのかもしれない。

バーチャルパペット

 被写体をさまざまな方向から19台のカメラで撮影した画像から3D形状モデルを作成し、任意方向から見ることができるようにするという技術の応用例。

 白い板に黒い四角が書いてある。四角の中には黒い四角の中にはズズやスプー*3あるいはおねえちゃんなんかの絵が書いてある。この板をもってカメラの前に立つ。すると目の前のディスプレイに自分の姿が映る。左右反転されているので鏡の前に立っている雰囲気だ。そして、画面を見ると白い板の上にズズやスプーが立って踊っているのだ。板を傾けるとちゃんとそれに合わせてズズのむきも変わる。板をカメラに近づけて大きく映すと、ズズも一緒に大きくなる。ちょっとMixed Reality。

photo 動画はこちら(304Kバイト)

 カメラに映った黒い四角の形や大きさから、板の角度を判断してキャラクタを表示しているのだ。そして、その板がどのキャラの板かというのは、ほんとに書かれている絵を見て判断している*4。こっそりバーコードが書かれていたりはしない。

 これだけなんだけど、結構おもしろい。板をかなりきつい角度にしてもちゃんとついてきてくれるので、どんどん振り回したくなる。3Dモデルを任意方向から見るデモなんていうと、たいていジョイスティックでぐるぐるなんてことになるのだけど(となりにある基礎技術展示はそうなっている)、それよりこっちのほうがずっと楽しい。

高品質な音声合成(バーチャル森田美由紀)

 テキストデータをコンピュータに読ませるのはもうパソコンレベルで普通にできることになった。でも、まだまだ「合成くささ」が消えない。そこで、ここでは、NHKの森田美由紀アナウンサーが今までに読んだアナウンスの音声と、その原稿とを元に、大きな音素のデータベース(辞書)を作り上げたのだ。

 日本語は、カナと音とがほとんど一対一対応しているような気がするけど、実際にはそんなことはない。たとえば、「ツキ(月)」というときの「ツ」と「ツギ〔次)」というときの「ツ」とは音が違う(「ツキ」の「ツ」は母音が発音されない)*。実際に発音される音は、音のつながり方によって変わってくるのだ。音素のデータベースというのは、このつながり方と実際に発音される音の「辞書」のことだ。

 これを使って、コンピュータにニュース原稿を読ませると、非常に滑らかな、それらしい読み方になるのだ。もともとがニュース原稿で作った辞書なので、ニュースを読むのが一番上手い。

 現時点では、アクセントやイントネーションのデータは持っていない。だからときどき変なイントネーションになることがある。でも、それを除くと、しっかり森田美由紀なのだ。

photo 動画はこちら(904Kバイト)

 さらに限定した用途として、株式情報の自動読み上げもあった。こちらは、聞いていても、音声合成だなんて全くわからない。もともと、機械的に、ある一定のイントネーションで読み上げるというものだから、とてもやりやすいのだろう。

 動画はこちら(460Kバイト)


*3おかあさんといっしょのの中の「ぐ〜チョコランタン」のキャラクタ。スプー、ジャコビ、アネム、ズズ。このズズがいいキャラなんだ

*4このパターン認識にはARToolKitというフリーウェアが使われているBR>

前のページへ 1|2|3       

Copyright © ITmedia, Inc. All Rights Reserved.