静止画なのに回って見える　AIも「錯視」　ディープラーニングで再現に成功

» 2018年03月22日 09時30分公開

[ITmedia]

　静止画にも関わらず、まるで動いているかのように見える「蛇の回転錯視」を、ディープラーニングで学習する深層学習機（ディープラーニングマシン）で再現したと、基礎生物学研究所や立命館大学などの研究チームが発表した。錯視をディープラーニングマシンで再現した世界初の事例という。

北岡明佳博士考案の蛇の回転錯視（左図）。右図は回転しないネガティブコントロール。北岡博士のWebサイトでより強い錯視を体験できる

　「蛇の回転錯視」は、研究チームの一員である立命館大学の北岡明佳博士が2003年に考案した錯視。静止画だが、とぐろを巻いた蛇が回転しているかのように見える

　今回、大脳の有力な理論の一つである「予測符号化理論」を組み込んだディープラーニングマシンを開発。大脳は入力される感覚情報を常に予測しており、その予測と実際の感覚情報との差分を学習していくとされる理論だ。その上で、このマシンが人間の脳機能どの程度再現しているか検証するため、蛇の回転錯視の知覚の再現を試みた。

予測符号化理論を組み込んだ深層学習機の概念図

　ディープラーニングマシンには、人間が日ごろ目にする自然な景色を撮影した約5時間分の動画を繰り返し入力。学習済みのディープラーイングマシンが回転運動をうまく予測できるかどうかを、実際に回転するプロペラを撮影した画像を使って検証した。その結果、ディープラーニングマシンは、プロペラの左回転、右回転、無回転をうまく予測できた。

ディープラーニングマシンのトレーニングに使用した動画の一部。人間の帽子にカメラを取り付け、遊園地内を自由に動いてもらったもの

ディープラーニングマシンによる回転するプロペラ（左図は左回転、右図は右回転）の予測。連続した2枚の予測画像からオプティカルフローを検出し、ベクトルとして表現したもの（黄色の点がベクトルの始点、赤い線がベクトルの方向と大きさ）

　次に、蛇の回転錯視画像を検証した。蛇の回転錯視は、色の配列を入れ替えることで、右回転、左回転、無回転の知覚を引き起こせる。動画を学習した深層学習機に、右回転、左回転、無回転の錯視画像を入力したところ、それぞれ回転に応じた回転運動の予測をしていることが分かった。

ディープラーニングマシンによって再現された蛇の回転錯視（左図は左回転、右図は無回転）の運動知覚。連続した2枚の予測画像からオプティカルフローを検出し、ベクトルで表現した（黄色の点がベクトルの始点、赤い線がベクトルの方向と大きさ）

　この結果、ディープラーニングマシンが人間と同様、錯視を知覚すること、蛇の回転錯視を引き起こしているメカニズムの一つとして予測符号化理論が有力であることが分かった。蛇の回転錯視は、ヒトだけではなくネコや魚にも知覚されていると考えられており、予測符号化理論によって動物の種を超えた大脳の動作原理を理解することが可能だとしている。

　また、ディープラーニングマシンが心理学研究に直接応用できることを示したとしており、研究グループは論文でこの手法を「逆心理学」と提唱。さらに、ディープラーニングマシンが錯視というエラーを起こす可能性が分かったため「人工知能をリスク管理する観点からも重要な知見だ」としている。

あなたはどう見える？　「静止画が動いて見える」不思議な錯視の世界
東大の新井仁之教授が解説する錯視連載が本格スタート。「オオウチ錯視」「ピンナ錯視」って知ってます？
人の静脈、実は灰色だった　青く見えるのは錯視　
腕などで透けて見える人間の静脈は実は灰色で、青色に見えるのは錯視──こんな事実が明らかになった。
真っすぐなのに斜めに見える“不思議な図形”の正体　「歴史から消えた錯視の発見者」とは
東大・新井仁之教授が解説する錯視の世界。第7回では、直線でありながら斜めに見える不思議な図形が登場。錯視にまつわる歴史もご紹介します。
真っすぐなのに斜めに見える“不思議な文字列”　その仕組みとは？
東大・新井仁之教授が解説する錯視の世界。第6回では、平行なのに文字が傾いて見える「文字列傾斜錯視」の謎に迫ります。文字列が傾斜する錯視文字列の自動生成ソフトも期間限定で公開！
2つ並んだ正方形、あなたは同じ色に見える？　「客のクレーム対応」で始まった錯視研究とは
東大・新井仁之教授が解説する錯視の世界。同じ色が違って見える「色の同時対比」という錯視を紹介する。