米OpenAIが3月14日(現地時間)に公開した、次世代の大規模自然言語モデル「GPT-4」。「ChatGPT」で利用されている「GPT-3.5」から推論性能が大幅に引き上げられており、英語では司法試験の上位10%に入るほどの実力を持ち、日本語でも英語版GPT-3.5よりも性能は上という。そんなGPT-4で一体何ができるのか。OpenAIは、GPT-4発表後にライブデモを実施した。
デモでは、記事を要約する様子やDiscordでGPT-4のbotを作成する様子を披露。GPT-4も2021年までの情報をインプットしているため、最新の情報は持っていない。そこで、最近のブログ投稿から画像表示に関する部分を引用してbotの作成を指示したところ、GPT-4としては学習していなくても、最新のコーディングを反映したソースコードを生成できた。
実行するとAPIのバージョンや開発環境などに起因するエラーが発生したが、そのエラーをGPT-4に返すと修正したコードを出力してくれる。
さらに、手書きのラフスケッチからWebサイトを構築するためのHTMLやJavaScriptを出力するデモも披露。メモ帳になぐり書きしたスケッチをiPhoneで撮影し、その画像をもとにWebサイトに必要なコードの生成を先ほど作成したDiscord用のbotに指示すると、きちんと機能するコードを生成。実際にWebサイトとしてプレビューすることができた。
最後には、「誰もやりたくないタスクを達成する方法」として、家族の税務計算を行う様子を披露。デモしたOpenAI共同創業者のGreg Brockman氏は「税理士への確認は必要」と念を押したものの、16ページものタックスコードを読み込ませた上で、2012年に結婚し、2017年に子どもが生まれたとある家族の収入、持ち家の支払い比率などから、2018年の定額控除額を求めるというお題に対してもササッと算出。ついでに出力結果を「韻で要約して」という無茶振りにも応えていた。
GPT-4はすでに一部のアプリやサービスで稼働しており、有料版の「ChatGPT Plus」では、4時間ごとに100メッセージまでの制限があるものの、課金すれば利用できるようになっている。ただし、画像の読み込みはまだ研究段階としてロックされたままであり、機能の追加はもう少し先になりそうだ。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR