- 進化した性能: GPT-4は従来のモデルよりも大幅に性能が向上し、さまざまなタスクで優れた結果を示しています。
- テキストと画像の統合: GPT-4はテキストと画像を同時に扱うことができ、より多様なアプリケーションへの応用が期待されています。
- より減少した幻覚現象: GPT-4は、前世代のモデルに比べて幻覚現象が大幅に減少しており、事実に基づいた情報を提供する能力が向上しています。
- モデルの改善: GPT-4の開発には多くの専門家が関与し、モデルの安全性や性能向上に取り組んでいます。
- 限定されたリアルタイム学習: GPT-4は2021年9月以降の出来事については知識がなく、ユーザーとの対話から学習する能力も限定的です。
- OpenAI Evals: OpenAIが開発した評価フレームワークで、GPT-4の性能を評価し、改善のためのフィードバックを提供します。
- ChatGPT Plus: 有料のGPT-4アクセスプランで、chat.openai.com上でGPT-4を利用できます。
- APIアクセス: GPT-4 APIにアクセスして、様々なアプリケーションに組み込むことができます。
- 長い文脈の処理: GPT-4は8,192トークンの文脈を扱うことができ、限定的に32,768トークンの文脈にも対応しています。
- 今後の展望: GPT-4の開発や改善にはまだ課題がありますが、コミュニティと協力して進歩を遂げることを目指しています。
(出力ここまで、原文ママ)
これはかなり分かりやすくなったのではないだろうか。画像入力についても触れている。トークンの長さも出てきている(原文を読む限りではAPI利用時の制約のはずだが)。
説明に足りないことがあれば聞けばいい。「ここでいう「幻覚」や「幻覚現象」とはなんのことですか?」にはこんな答えだ。
「「幻覚」や「幻覚現象」とは、この文脈ではGPT-4や他のGPTモデルが出力する情報が、実際には存在しないことや事実に基づかないことを指します。言い換えると、モデルが正確でない情報や誤った推論を生成することがあります。これは、モデルが訓練データに含まれる情報の正確さや信頼性を完全には判断できないために起こります」
この箇条書きを先に見ていたら記事内容や執筆速度も多少は変わったかもしれない。しかし、重要なのは「出力を信用できるか」だ。筆者の場合は先立って原文を自分で読んだために、GPT-4の出力が“それらしいか”を判断できるが、原文は読んでいない、AIのことも全然知らないという人がGPT-4をうまく操縦できるだろうか。
機械翻訳で知らない言語を日本語に翻訳させたときに、その内容が正しいかをどう確かめるか、と同じ構図だ。英語からの翻訳なら、日本人はそれなりに英語教育を受けているので読める余地があるが、全く知らない言語だとすると複数の翻訳ツールを通して意味のブレがないか確かめるくらいしかない。
その意味では、ChatGPT(GPT-4、GPT-3.5)を翻訳や要約に使うにはその分野のドメイン知識がある程度は必要ということになる。知識がある人はどんどん使いこなせるが、ない人は平凡な結果しか得られない。であれば、ChatGPTを使いこなす人と使いこなせない人の差はどんどん開いていくのかもしれない。
ちなみに、この記事自体が実は全てGPT-4で書かれている……というメタ構造にはさすがになっていない。まだ人間が書くアドバンテージは残っていそうだ。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR