News：「顔」認識の可能性――NEC研究者に聞く

News

2002年11月28日　11:48 AM 更新

「顔」認識の可能性――NEC研究者に聞く（2/2）

　「1枚の画像で認識するためには、その画像から横を向いたらどうなるか、照明が変わったらどう見えるかといった“環境の変動”による“画像の変動”を内部で作っておきます。これを『摂動画法』と言います。（画像を）登録するときには、環境の変動があっても普遍な空間を内部で作っておき、それに対して入力とのマッチングをするわけです」。

　ただし、NeoFaceでは、単純に画像同士のマッチングを行っているわけではない。というのも、画像全体のマッチングをすると、表情が変わったり、メガネをかけているなど顔の一部が隠れていたりするとスコアが下がってしまう。つまり、認識精度が落ちるからだ。「照明や姿勢はわりとモデル化しやすいが、例えばマスクをしたりとかメガネをかけたりというものは、モデル化しにくい」（佐藤氏）。

　そこで、NeoFaceでは、画像全体をマッチングするのではなく、部分部分に画像を分けてマッチングをすることで、そういった変動に対してよらないようなスコアリングを行っている。つまり、摂動画法によるバリエーションを登録して、照合時には、予想していない部分があっても、それによらないようなマッチングをしているのだ。

NeoFaceでは、人の顔を格子状に分割して、1部分ずつ内部で3Dエミュレートを行い、比較を行う。

認証できる顔、できない顔

　2D/3Dで培った技術を生かし、摂動画法で1枚の画像からでも高い精度で顔認証を行えるようにはなった。とはいえ、2D/3Dに匹敵するほどの精度ではないという。

　「2D/3Dでは人の顔が本当に3次元で分かっているので、どういう照明条件でいるのかといったことも全部モデル化できます。当然、認識精度はNeoFaceよりも高くなります。しかし、NeoFaceの場合は、そこまで3次元の形状がわかっていないので、わりと大ざっぱなモデル。ある程度の“近似”によって（3次元の）処理を行っています」。この近似にまだ“粗い”という問題があり、その精度を上げていくことは今後の課題の1つだ。

　顔は指紋と比べて変動が大きく、その分、精度の向上は難しい。

　「基本的には、人間の目で区別できないような場合は、認識できません。どのくらい変装したらバレないかとか、経年変化にどう対処するかという問題は、顔認識にとって大きな課題です」。例えば、5年10年たったときに、人間でも同じ人だとわからない場合があるし、数カ月で10キロとか20キロ太ったり、やせたりといった場合は、顔による本人認証は困難なのだという。

　また、化粧なども「どの部分かによりますが、例えば、眉毛が全くないといった、あまりにも変動が大き過ぎる場合は、スコアが下がるとしか、今のところ言えません。ただ、直接的な変動には左右されない方法で設計しているので、候補の上位に来るとは思いますが……」（佐藤氏）。

　その一方で、人間が人の顔を目で見て識別するのとは違った、「機械ならでは」の長所もあるという。「人の目は髪型の印象にとても左右されてしまいますが、このシステムは、（識別に）髪型を使っていません。髪型には左右されることなく見分けられると思います」（佐藤氏）。

　また、よく“外国人はみんな同じに見える”ということが言われるが、機械による認証ではそういったことも生じない。「（人の目では）外人から見て日本人の区別がつかないのと同様に、日本人からは、例えば黒人はみんな同じように見えるということがあります。つまり、人は、見慣れていない人（人種）に対しては、覚えにくいということがあります。しかし、このシステムでは、そういった学習はしていませんから、惑わされません」。NeoFaceでは人種に関係なく判別できる。そういった意味では、「人間の目を超えるということはあるでしょう」（佐藤氏）。

どうやって認識精度を向上させるか

　では、今後の精度の向上は、具体的にどういう方針で進めていくのだろうか。

　「登録情報を増やせば、どんどん精度はあがります。しかし、それでもやはりアルゴリズムなど、内部の技術もやっていかなければいけません」。2D/2Dで顔の形状が分からなくても、形状を推定して2D/3D並みの性能までもっていくのが現在の目標だと佐藤氏は話す。

　その方法となるのが“顔のモデル”だ。「2D/3Dでは、ちゃんと本人の顔の形状というか、モデルをもっています。2D/2Dでもそういうモデルを内部で持たせて照合性能を上げたい」。

　この顔のモデルとは、例えば、顔というのはこういう形で、こういう風にできていて、照明がこうあたればこんな感じの影ができる――といったモデルのことだ。「顔のモデルは、1つではなくたくさんでもよいのですが、汎用的な顔のモデルが必要でしょう」。

　こうしたモデルが必要になるのは、2D/2Dの顔認識では、1枚しかない画像で違う絵を合わせて認識するため、統計ベースのパターン認識が効かないからだ。「統計が効かない分野には、それを補う先見的な知識をもっていなくては精度が向上しません。それが“なんらかのモデル”です」。例えば、人が笑ったらどういった筋肉が使われて、どういった笑い方をするのかというモデルまで作りこんでいければ、顔認識の性能ももっと向上するという。

　「まず、汎用的な顔のモデル。次が、表情の変化に対応させるために筋肉などのモデルを追加。そうしたら、太っていくとどうなっていくかといったことを入れることになります。そうすれば、かなり認識精度が向上するはず」（佐藤氏）。

さまざまな分野への応用が可能

　機械がすべての処理を行うので、顔認識は人間の目よりも正確な判断が行えそうだが、実のところ、現状では、人間の判断を超えるところまではいっていない。このため、強固なセキュリティの認証に使用するというのは難しい。

　しかし、まだまだ性能改善の余地は残されている。そればかりか、印象に左右されやすい人間よりも分け隔てなく認識できるというメリットがある。さらに顔認識には、“特定の人を判別すること”以外の使い方も多い。

　例えば、スコア順に似た人をデータベースから取り出すといったこともできる。この機能を使えば、「誰が一番、指定した芸能人に似ているとか、そういったお遊びにも使えます」（佐藤氏）。

　他に、NeoFaceのエンジンを使用した顔写真エミュレータなども面白い。NeoFaceは、同社の開発した2D/3Dという技術を使用し、内部で3Dによる顔の部分合成を行っている。この技術を使えば、1枚の画像から、太った場合、やせた場合などの顔写真を作成することができる。これは顔だけでなく、全身にも応用することが可能だ。

　精度は「モデルを入れることで確実に向上する」（佐藤氏）ということなので、近い将来、このエンジンを使った認証システムだけでなく、高精度なCGエミュレータのようなものまで販売される可能性もありそうだ。

関連記事

替え玉受験はもうできない？――NEC、顔検出・顔照合エンジンを発表
NECは10月17日、人の顔を認証に使う顔検出／顔照合エンジン「NeoFace」を製品化した。パスポートや受験票の本人確認、お店での接客サービス向上などへの利用を目指していくという

ケータイに組み込み可能な顔認証システムなど――｢Security Solution Expo 2002｣

関連リンク

NEC

[北川達也, ITmedia]

前のページ | 2/2 | 最初のページ

ITmediaはアイティメディア株式会社の登録商標です。