「GPT-4」搭載ChatGPTに東大入試数学を解かせてみた GPT-3.5との回答の違い、点数は?(2/2 ページ)
AIチャットbot「ChatGPT」「新しいBing」に、人間には答えにくい質問や、答えのない問い、ひっかけ問題を尋ねてみたらどんな反応を見せるのか。それぞれの反応からAIの可能性、テクノロジーの奥深さ、AIが人間に与える“示唆”を感じ取ってほしい。
東大名問「円周率が3.05より大きいことを証明せよ」
質問 円周率が3.05より大きいことを証明せよ。
この問題は、直径1の円に内接する正多角形のうち、周の長さが3.05以上になるようなものを見つけられればクリアできる。シンプルだが、これが地味に大変なのだ。
GPT-3.5の解答 「3.14……なので3.05より大きい」
GPT-3.5 円周率の値は、数学的に正確に計算された定数であり、その値は無限に続く小数で表されます。ただし、3.05は有限の数であるため、円周率が3.05より大きいことは自明です。
より正確に言うと、円周率の値は3.1415926535...と続きます。この小数点以下の桁数は無限に続くため、3.05よりも大きいことが示されます。
この解答は0点を付けるのもためらわれる。要約すると「πは小数点以下の桁数が3.05より多いので大きい」だ。そんなわけない。
GPT-4の解答 「アルキメデスに倣って解きました」
GPT-4 古代ギリシャの数学者アルキメデスは、円の内外に正多角形を描くことで円周率の近似値を計算する方法を開発しました。正多角形の辺数を増やすことで、近似値は実際の円周率に限りなく近づく。
アルキメデスの方法を用いて、内接する正六角形と外接する正六角形を考えます。正六角形は、各内角が120度であり、一辺の長さが円の半径と等しいことを利用して計算を進めます。
内接正六角形の周囲の長さは、半径rの6倍になります。従って、この近似値は 6r です。
外接正六角形では、各三角形が等辺三角形であることから、一辺の長さは r√3 です。従って、この近似値は 6r√3 です。
これらの近似値を用いて、円周率πの下限と上限を計算します。
下限: 円周 = 6r 円周率の下限: π > 円周 / 直径 = (6r) / (2r) = 3
上限: 円周 = 6r√3 円周率の上限: π < 円周 / 直径 = (6r√3) / (2r) = 3√3(~5.196)
この結果から、円周率πは3と5.196の間にあり、3.05より大きいことが示されました。これは、アルキメデスの方法を用いた最も簡単な証明であり、より高次の正多角形を用いることで、さらに精度の高い近似値が得られます。実際の円周率の値は、3.14159……です。
GPT-3.5に比べると圧倒的に良い。点数をあげるのは難しいが。冒頭のアルキメデスのくだりは正しい。書いてある通りの方法で円周率の近似値を求めていたといわれている。それを解答欄に書く必要はないが。時間に余裕でもあったんだろう。
ツッコミどころは多いが、論の進め方も悪くない。問題があるのは以下のポイント。
- 外接する多角形については計算する意味がなく、時間の無駄でしかない
- 外接する多角形の周の長さが計算ミス
- 内接する多角形の周の長さが3なので、π>3.05の証明になっていない
点数はあげられないが、GPT-3.5に比べると的を外していないだけかなりの進歩に見える。
関連記事
- 「GPT-4」発表 日本語でもChatGPT英語版より高性能、司法試験で上位10%、「この画像何が面白いの?」にも回答
大規模言語モデル「GPT-4」が登場。テキストでのやり取りだけでなく、ユーザーから画像も受け取れるようになった。司法試験の模擬問題を解かせると上位10%のスコアで合格する。ChatGPTの有料版やAPI経由でこれから利用可能になる。 - GPT-4をいち早く試すなら「ChatGPT Plus」 月額2400円だが、画像入力など「お楽しみはこれから」
米OpenAIが3月14日(現地時間)に公開した、次世代大規模言語モデル「GPT-4」。これまでのGPT-3や、「ChatGPT」に搭載されたGPT-3.5よりも推論性能を向上させた他、入力された画像に対してコメントしたりなど、マルチモーダル対応を果たしている。 - 「新しいBing」のエンジン、実は「検索用にカスタマイズしたGPT-4」
Microsoftは、OpenAIによる「GPT-4」発表を受け、「新しいBing」はGPT-4を使っていると認めた。新しいBingのプレビューリリース段階から、検索用にカスタマイズしたGPT-4だった。ターン上限は15/150に増加した。 - 実は2カ月前から“GPT-4”を活用していた 英会話アプリ「スピーク」運営が明らかに SNSでも「AI講師がすごすぎる」などの声
教育支援事業を手掛ける米Speakeasy Labsは英会話アプリ「スピーク」の機能に大規模言語モデル「GPT-4」を活用していると発表した。GPT-4の公式発表の2カ月前から活用していたという。
Copyright © ITmedia, Inc. All Rights Reserved.