検索
ニュース

「私はロボットではありません」AIで突破 他のディープラーニングより“300倍”効率的なモデルが登場

少ない訓練データで「CAPTCHA」の文字画像を認識できる学習モデルが、科学雑誌「Science」に掲載された。

PC用表示 関連情報
Share
Tweet
g+
LINE
Hatena

 Webサイトでの登録やログイン時に表示される「私はロボットではありません」の文言と、ぐにゃぐにゃに曲がった読みにくい文字。これらはWebサイトをクロールする「ボット」を弾き、人間が作業していることを証明する「CAPTCHA」というテストだ。

 米国のAI企業Vicariousの研究者たちは、効率良くデータを学習してCAPTCHAに表示された文字を認識できる学習モデルの研究結果を、科学雑誌「Science」に掲載した。CAPTCHAの文字を認識するために必要となる訓練データは、従来のディープラーニング手法に比べて約300倍効率的になったという。


文字を効率的に学習してCAPTCHAを突破する「再帰的皮質ネットワーク」

 彼らは、少数の例から学習して一般化できる能力を持つ人間などの脳を参考に、神経科学の知見を導入した「再帰的皮質ネットワーク」(Recursive Cortical Network)を作成。

 結果として、1文字当たり5つの訓練サンプルを用意するだけでreCAPTCHA(CAPTCHAの一種)の文字画像を文字ベースで94.3%、単語ベースで66.6%の精度で正答することができた。

 少ない訓練データでCAPTCHAを突破できることから、研究者らは「Webサイトはボットを弾くためにより強固なメカニズムに移行するべきだ」と述べている。


文字の「面」と「輪郭」を認識する階層構造のモデル

reCAPTCHAの文字画像を文字ベースで94.3%、単語ベースで66.6%の精度で正答

Copyright© 2017 ITmedia, Inc. All Rights Reserved.

ページトップに戻る