幕が上がった! シンギュラリティ「序章」

難関私大も「A判定」 受験AI「東ロボくん」の実力ロボットは東大に入れるか

» 2016年11月17日 07時00分 公開
[濱口翔太郎ITmedia]

 人工知能(AI)が東京大学を受験して合格することを目指す産学プロジェクト「ロボットは東大に入れるか」。現在の状況は東大合格には及ばないものの、難関私大なら「A判定」が出るところまで来ている。その実力はどこまで上がったのか──。

 同プロジェクトは2011年4月に開始し、国立情報学研究所、富士通研究所、サイバネットシステム、名古屋大学、東京大学などが参加。自然言語処理・画像処理技術などを入試問題の解答に応用し、AI「東ロボくん」の東京大学合格を目指している。

 2013年からは毎年、大学入試の模試に挑戦中。今年度は、マークシート形式のセンター試験模試「進研模試 総合学力マーク模試(ベネッセコーポレーション主催)」と2次試験向けの模試「東大入試プレ(代々木ゼミナール主催)」に挑戦した。

マーク模試の結果:「関関同立」「MARCH」は合格レベル 東大まであと少し

 センター試験模試では、受験した5教科8科目の合計で525点(950点満点)を獲得。受験生の全国平均455.8点を上回り、偏差値は昨年を超える57.1だった。

 この成績は、8割程度の正答率が求められる“第1志望”の東大合格ラインには一歩及ばないものの、関東・関西の難関私立大学群「関関同立」「MARCH」を含む535の大学への合格率80%以上(A判定)に相当するという。

photo 2016年度進研模試 総合学力マーク模試の結果

センター物理が大幅に向上

 昨年度のセンター模試の結果と比較して、最も成績が向上したのは物理だ。その要因は、シミュレーションの自動設定技術の向上だという。従来は、問題文を解析した後、解答するために物理現象をシミュレーションする際、人の手による補助が必要だった。今年度はシミュレーションを自動設定できる範囲が広がったほか、問題文の画像情報をもとにした解答方法の開発にも成功。学生平均点を15点以上上回る62点(100点満点、偏差値59.0)を獲得した。

photo 物理の解答技術の進歩
photo センター模試の物理の成績の伸び率

センター英語の成績向上はコスト面がネックに リスニングは大苦戦

 物理とは対照的に、英語が伸び悩んだ。今年度の取り組みでは、従来からの課題だった会話文の完成・不要文の除去など、文脈を見極める力を問う「複数文問題」の克服に取り組んだ。

 「東ロボくん」はこれまで複数文問題に解答する際、会話内の感情の流れや、問題文と選択肢の単語の類似度を数値化し、適合度の高い答えを選ぶ手法を用いていた。今回からは、より効果的に文脈の特徴を把握するため、ディープラーニングを導入。問題文と選択肢のサンプルをニューラルネットワークに投入して正誤判定を行い、正答率の向上を図った。

photo ディープラーニングを用いた複数文問題の解答技術

 しかし、サンプルデータを人の手で作成するには膨大なコストを要するため、代替策として機械的に作成したデータを使ったところ、質・量ともに不足。正しい正誤判定ができず、複数文問題はほとんど得点できない結果となった。

 リスニングについても、音声データの認識に課題を抱えており、14点(50点満点、偏差値36.2)にとどまった。

論述模試では、理系数学で偏差値76.2を記録

 論述模試では、理系数学の6問中4問を完答し、80点(120点満点、偏差値76.2)の好成績を獲得した。

 「東ロボくん」は、言語処理プログラムによって日本語で書かれた問題文を計算可能な形式へと変換した後、数式処理プログラム(ソルバ)を用いて問題を解いている。これらの2つのプログラムを改良したことが高得点につながったという。

 言語処理プログラムには、数式の理解度を向上する技術や、文と文の論理的な関係性を把握する技術を導入したほか、日本語辞書を拡充して語彙を増やし、読解力を向上させた。数式処理プログラムは、三角関数などの限量記号消去を適用できなかった数式を適用可能な形式へと変換することで解く技術を開発した。

photo 数学の解答技術の進歩
photo 数学の成績の伸び率

 以上の改良を組み合わせた結果、理系数学の論述問題においては、問題文の読解から解答までの全プロセスを自動化し、ほぼ完全な自動的求解を実現したとしている。

Copyright © ITmedia, Inc. All Rights Reserved.