ITmedia NEWS > AI+ >
ITmedia AI+ AI活用のいまが分かる

静止画なのに回って見える AIも「錯視」 ディープラーニングで再現に成功

» 2018年03月22日 09時30分 公開
[ITmedia]

 静止画にも関わらず、まるで動いているかのように見える「蛇の回転錯視」を、ディープラーニングで学習する深層学習機(ディープラーニングマシン)で再現したと、基礎生物学研究所や立命館大学などの研究チームが発表した。錯視をディープラーニングマシンで再現した世界初の事例という。

画像 北岡明佳博士考案の蛇の回転錯視(左図)。右図は回転しないネガティブコントロール。北岡博士のWebサイトでより強い錯視を体験できる

 「蛇の回転錯視」は、研究チームの一員である立命館大学の北岡明佳博士が2003年に考案した錯視。静止画だが、とぐろを巻いた蛇が回転しているかのように見える

 今回、大脳の有力な理論の一つである「予測符号化理論」を組み込んだディープラーニングマシンを開発。大脳は入力される感覚情報を常に予測しており、その予測と実際の感覚情報との差分を学習していくとされる理論だ。その上で、このマシンが人間の脳機能どの程度再現しているか検証するため、蛇の回転錯視の知覚の再現を試みた。

画像 予測符号化理論を組み込んだ深層学習機の概念図

 ディープラーニングマシンには、人間が日ごろ目にする自然な景色を撮影した約5時間分の動画を繰り返し入力。学習済みのディープラーイングマシンが回転運動をうまく予測できるかどうかを、実際に回転するプロペラを撮影した画像を使って検証した。その結果、ディープラーニングマシンは、プロペラの左回転、右回転、無回転をうまく予測できた。

画像 ディープラーニングマシンのトレーニングに使用した動画の一部。人間の帽子にカメラを取り付け、遊園地内を自由に動いてもらったもの
画像 ディープラーニングマシンによる回転するプロペラ(左図は左回転、右図は右回転)の予測。連続した2枚の予測画像からオプティカルフローを検出し、ベクトルとして表現したもの(黄色の点がベクトルの始点、赤い線がベクトルの方向と大きさ)

 次に、蛇の回転錯視画像を検証した。蛇の回転錯視は、色の配列を入れ替えることで、右回転、左回転、無回転の知覚を引き起こせる。動画を学習した深層学習機に、右回転、左回転、無回転の錯視画像を入力したところ、それぞれ回転に応じた回転運動の予測をしていることが分かった。

画像 ディープラーニングマシンによって再現された蛇の回転錯視(左図は左回転、右図は無回転)の運動知覚。連続した2枚の予測画像からオプティカルフローを検出し、ベクトルで表現した(黄色の点がベクトルの始点、赤い線がベクトルの方向と大きさ)

 この結果、ディープラーニングマシンが人間と同様、錯視を知覚すること、蛇の回転錯視を引き起こしているメカニズムの一つとして予測符号化理論が有力であることが分かった。蛇の回転錯視は、ヒトだけではなくネコや魚にも知覚されていると考えられており、予測符号化理論によって動物の種を超えた大脳の動作原理を理解することが可能だとしている。

 また、ディープラーニングマシンが心理学研究に直接応用できることを示したとしており、研究グループは論文でこの手法を「逆心理学」と提唱。さらに、ディープラーニングマシンが錯視というエラーを起こす可能性が分かったため「人工知能をリスク管理する観点からも重要な知見だ」としている。

Copyright © ITmedia, Inc. All Rights Reserved.