OpenAIのフルパワー「o1 pro mode」に、書き仕事はどこまで任せられるか 若手記者の所感(1/2 ページ)
AI、俺の代わりに文章書いてくれ──この記事を書いている若手編集記者は最近、そんなことばかり考えている。今のAIには、記事としてそこまでクオリティーの高い文章を出す能力はないので、結局は自分でキーボードをカチカチしているが、キーをたたく時間をもっと減らせたら、取材に行く時間がもっと確保できて仕事が楽しくなるのに、と妄想する今日このごろだ。
GPT-4やClaude 3など、これまでもいろいろ試したが、正直「仕事をほぼ丸投げできるぞ!」のラインには至らず「文字起こしや構成の検討など一部を手伝ってもらう」がせいぜいだった(それはそれで大事だが)。そんな折、米OpenAIがChatGPTの新プラン「ChatGPT Pro」を発表。目玉は同社最高性能のAIモデル「OpenAI o1」の上位版「o1 pro mode」だ。
こいつなら、今までより良い文章が書けるかも──ということで、ライターとしてどこまでやれるか検証してみた。なお、ITmedia AI+/ NEWSにおける記事執筆とAI活用の指針についてこちらを参照のこと。
難点はあるが、執筆能力自体はそこそこ高い
結論から言うと、難点はあるが、執筆能力だけなら現状で一番いいと感じる。筆者はこれまで「Claude Opus 3」や「GPT-4」などを試し、それぞれ「10の労力が9とか、良くて7になるくらい」の能力と受け止めていた。しかしo1 pro modeは、分野によってはそれ以上の労力を削ってくれそうなポテンシャルを感じた。
もちろん、理想は10の労力を0にしてくれること。つまり自分の頭の中を読んで、理想そのままを出してくれることだが、それは無理だ(自分で書いているときだって、できているか定かでない)。となると、自分の考える正解に最も近いものを、なるべく少ない労力で出してもらう能力を求めることになる。その能力において、o1 pro modeは現状で最良に近い。
と、理屈を並べるより実際に見てもらった方が早いだろう。まず、以下がo1 pro modeの書いた記事だ。話題は、当媒体「ITmedia AI+」のオープンについて。発表文と画像を基に「ITmediaの記者として記事化してください」とだけオーダーした。
「国内最大級」など、事実関係が定かでないにもかかわらず元となった文章の受け売りが見られる、AI+の説明をし切ってから立ち上げ背景の説明をしてほしいができていない、書き出しは年月日でなく月日からでいいなど、指摘するポイントはあるが、抑えてほしい箇所は押さえてくれている。多少手を入れれば、読める文章になるだろう。
次に、これまで記者が記事執筆の支援で最有力と考えていたClaude 3 Opusに書かせてみた。
社名に「株式会社」をつけている、初出にもかかわらず月の表記がない、不必要に社長の名前を出している、アンケート調査を媒体立ち上げの背景として紹介していない、単に長いなど、ITmedia AI+の記事としては不適切なポイントがo1 pro modeより多い。これでもGPT-3.5や4に比べると土台としてはそこそこ使えると思うが、o1 pro modeに比べると見劣りする。
ちなみにあくまで記者の感想だが、Claude 3 Opusはリリース当初はもうちょっと優秀だった気がする。しかしハルシネーションを恐れてか、次第に参照元の文章に忠実な出力をするようになっていった感じがあり、少なくとも短いプロンプトで“ポン出し”をするには向かなくなっていった印象だ。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「Gemini 3.5」登場 軽量モデルは一部3.1 Pro超え、高性能モデルは6月公開予定
-
2
Appleが5年がかりで開発したセキュリティ対策を5日で突破 「Mythos」が見せつけた脆弱性攻撃の威力
-
3
GoogleのAIサブスク、最上位プランを値下げ 月額1万4500円の新プランも
-
4
人間 vs. 人型ロボ、より多く作業をこなせるのは? 生配信で対決した結果…… 米企業
-
5
「ポンコツ」と呼ばれたM365 Copilotの逆転劇、GPT-5が転換点 活用の秘訣は“脱・プロンプト職人”
-
6
人型ロボが働く様子を生配信中 荷物の仕分けを11時間超、Xでの表示回数は196万を突破 米企業
-
7
Google、“動画版Nano Banana”こと「Gemini Omni」公開 会話で映像を生成・編集
-
8
GPT-5.5は最高性能ではないのに、なぜエンジニアが熱狂? カギは“最後まで自走する力”
-
9
AIが長時間タスクをこなす性能、想定を超えるスピードで成長 MythosとGPT-5.5がブレークスルーか
-
10
Google「Gemini」に個人向けAIエージェント 質問に答えるだけでなく「作業を代替」 まずは米国で
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR