ITmedia NEWS >
ニュース
» 2005年06月08日 05時31分 公開

いつでも“ベストショット”――デジカメ向けの新技術が登場 (2/2)

[芹澤隆徳,ITmedia]
前のページへ 1|2       

 並行して、両目と思われる黒い部分が横に直線で並んでいる場所を選ぶ。こちらは、人間の目が横に並んでいることを利用した判別方法だ。

photo 2つの方法を併用して検出精度を上げる

 実験には、研究室内で撮影した画像を使用した。「計98人が写っている48枚の画像に対して、正確に検出できたのは75人分でした。検出率は76.5%ですから、顔の検出率向上は今後の課題といえます」。

 うまく抽出できなかった原因はいくつかあった。たとえば撮影時に照明が暗すぎたり、逆に飛んでしまっている場合は肌色の検出が困難だ。また目を検出する段階では、「もともと目が細い人が、低い解像度で写っている場合」(同氏)が難しい。アップなら認識できるものの、ロングで撮影した場合は、目を開いていても“閉じている”と判別されることがあったという。

 目の場所が特定できたら、次は目が開いているかどうかを判別する(まばたき検出)。ここで使用するのは、「高次局所自己相関特徴量」と呼ばれる手法。15枚の画像を時系列に並べ、目の部分を用意したパターンと照らし合わせて目の状態を特定する。パターン検出としては一般的な手法だが、まばたき検出用に11通りのパターンを作成。これにより、前述の顔検出で成功した75人分の写真のうち、72人分が正しく認識できたという。検出率は96%だから、かなりの精度だ。

photo 高次局所自己相関特徴量の低い画像を開眼画像とする

 最終的には、15枚の画像すべてに対してこれらの処理を行い、誰も目を閉じていない画像があればそのまま出力する。ない場合には、目を閉じている人が少ない画像を選び、まばたきしている人の目をほかの画像と入れ替える。目の周囲を拒形に切り取り、貼り付けて境目をぼかすというレタッチ技を自動処理で行うわけだ。なお、記念写真では人は静止していることが前提になるため、不自然な境界線ができることは少ないという。

 気になる処理時間は、5人が写っている場合で1フレームあたり8〜10秒、15フレームなら2〜2分半程度だった。使用したのは、Pentium 4/2.2GHz、1Gバイトメモリの標準的なWindowsマシンだ。

 「人数が多ければ処理時間も増えますが、アルゴリズムを最適化し、またデジカメ用に専用LSIなどを起こすことができれば、処理時間を短縮できるでしょう」。たとえば“最初の1コマでまばたきをしていると判別したら、0.2秒(まばたきにかかる時間)分の画像をスキップする”などして、処理速度は短縮できるという。


 まばたき検出には、これまでも複数の方法があった。ただし、従来の技術は主に自動車運転中の“いねむり検出”がメインで、目を正面から捉えなければならなかったり、解像度が高い画像を前提にしているるなど、制約が大きかった。対して“ベストショット技術”は、複数の人数に適用できるうえ、従来技術が苦手としていた“複雑な背景”の画像や“解像度の低い画像”にも強い。

 「目の部分の画素数がわずか26×4ピクセルという低解像度でも検出できた。たとえば実用的に認識できる下限を“両目で40画素”と仮定した場合、横1000画素程度の写真なら、人の肩幅などを考慮しても、1つの画面に30人程度が収まる計算になります」。

 これはつまり、解像度さえ確保できれば、より大人数の集合写真にも対応できるということだ。もちろんデジタルカメラの性能向上が前提となるが、最近では家庭用ハイビジョンカムコーダーも登場しており、あるいはカムコーダー用のアプリケーションにする方法もあるだろう。金子教授は、「まだ手を挙げるメーカーはないが、ライセンスなどの形で技術供与することは可能だ。数年のうちに実用化できればと考えている」と話していた。

 このほか、ベストショットを応用して、片方の目だけを閉じた「ウインク画像」を作成するアプリケーションも開発中だ。下の写真のように、できあがったウインク画像は少し不自然だが、デジカメのオマケ機能としては面白いかもしれない。

photo 「顔の筋肉の動きが伴わないために、多少不自然な画像ができてしまいました」というウインク画像の実験例
前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.