NTT、「脳解読技術」を開発 AIで“脳内イメージ”を言語化できるように
NTTは11月17日、脳の活動データをもとに、人が見たり思い浮かべたりした視覚情報を言葉に変換する技術「マインド・キャプショニング」を開発したと発表した。大量のテキストデータを学習させることで、自然言語処理性能を高めたAIモデル「深層言語モデル」を活用。将来的には、発話困難者の意思伝達などに役立つことが期待されるという。
マインド・キャプショニングでは、MRI装置を使って脳活動を調べる「fMRI」で得たデータを基に、視覚情報を文章で出力する。開発段階では、人が動画を見ている際の脳の活動データと、その動画の視覚情報を説明する文章を収集。深層言語モデル「DeBERTa-large」により、脳の活動から、動画の説明文の意味を示す数値を予測するデコーダーを構築した。これに、文章の単語を一部隠し、その単語を予測するタスクで訓練したAIモデル「RoBERTa-large」を組み合わせた。
NTTはマインド・キャプショニングで生成した文章をもとに、候補となる100本の動画から、人が見たり思い浮かべたりした動画を当てられる確率も調べた。6人が参加した検証では、脳全体の活動データを利用した場合「観察(知覚)時は約50%、想起時でも約30%の精度で正しい動画を同定できた」(NTT)という。
NTTによると「言語処理に関与する脳部位」(前頭葉から側頭葉にわたる言語ネットワーク)の活動を除外しても、精度に大きな変化は無かったという。マインド・キャプショニングが「非言語的な情報を言語として解釈可能にしていることを示唆している」とした。
NTTは今後、マインド・キャプショニングが脳内の情報をどれほど正確に捉えているかより詳細に検証する。「将来的には、乳幼児や動物など、言葉を話せない対象の脳における構造化された思考の発達過程を解明する研究にも応用できると期待される」(NTT)
一方、マインド・キャプショニングについて「個人の心的プライバシーを侵害するおそれを内包している」とNTT。今回は実験の参加者に同意を得て、数日にわたり、1人当たり延べ17時間ほど脳の活動を測定した。しかし将来的には「より少ないデータから個人の思考内容を解読できる可能性が生じる」と指摘。予測精度とプライバシーの保護を両立する研究手法やデータ運用にも注力する。
今回の研究成果は、米国の科学誌「Science Advances」のオンライン版に5日(現地時間)に掲載された。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
Google、“動画版Nano Banana”こと「Gemini Omni」公開 会話で映像を生成・編集
-
2
日立、Anthropicと提携 グループ29万人に「Claude」などAI導入 社会インフラ分野にも展開へ
-
3
Appleが5年がかりで開発したセキュリティ対策を5日で突破 「Mythos」が見せつけた脆弱性攻撃の威力
-
4
GoogleのAIサブスク、最上位プランを値下げ 月額1万4500円の新プランも
-
5
生成AIで3Dモデルを自動作成 専門スキル不要でテキストや画像から3D化
-
6
「ポンコツ」と呼ばれたM365 Copilotの逆転劇、GPT-5が転換点 活用の秘訣は“脱・プロンプト職人”
-
7
人間 vs. 人型ロボ、より多く作業をこなせるのは? 生配信で対決した結果…… 米企業
-
8
「最新のAI創薬ラボ」なのに会議室みたい!? 製薬大手がラブコール送る“異色のAI企業”による新拠点とは
-
9
Google「Gemini」に個人向けAIエージェント 質問に答えるだけでなく「作業を代替」 まずは米国で
-
10
OpenAIの共同設立者アンドレイ・カーパシー、Anthropicにジョイン
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR