わざと誤答させて出力品質を上げる? 最新のプロンプトエンジニアリングとはAIビジネスのプロ 三澤博士がチェック 今週の注目論文

最新のプロンプトエンジニアリング手法「LEAP」と「RoT」について説明します。モデルの改修をしなくても最終的な出力の品質を向上させられるため、AIの活用範囲を大きく拡大させる可能性があります。

» 2024年06月26日 08時00分 公開
[三澤瑠花ITmedia]

この記事は会員限定です。会員登録すると全てご覧いただけます。

この連載について

AIやデータ分析の分野では、毎日のように新しい技術やサービスが登場している。その中にはビジネスに役立つものも、根底をひっくり返すほどのものも存在する。本連載では、ITサービス企業・日本TCSの「AIラボ」で所長を務める三澤瑠花氏が、データ分析や生成AIの分野で注目されている最新論文や企業発表をビジネス視点から紹介する。

 大規模言語モデル(LLM)の性能向上のため、プロンプトエンジニアリングのアプローチが続々提案されています。カーネギーメロン大学とDeepMindの研究チームは、あえてLLMにミスさせて最終的により良い回答を出力させる手法「Learning Principles」(LEAP)を提案しました。

 上海科技大学の研究チームは、大規模で高性能なLLMが小規模なLLMをサポートする「RoT」(Reflection on search Trees)」という手法を提案しました。いずれも、LLMの推論性能や探索効率を大幅に改善する画期的な手法として注目されています。

わざと誤答させるプロンプト 「LEAP」の実践方法は?

 LEAPでは、LLMを使うときに指示文(プロンプト)を工夫することでまずLLMに誤った回答を出力させます。

 続いてLLMにその誤答を分析させて失敗した理由を生成し、最終的な回答を求めます。

photo 従来手法との比較(参考文献の図2より引用)

 これにより、LLMは正例だけでなく負例からも学習し、質問応答や数理推論などさまざまな推論タスクで従来手法を上回る性能を示しました。

 LEAPの大きな利点は、データを追加しなくても出力の品質を向上させられる点です。誤答の生成から知見の言語化、最終推論までの全てをLLMで行うEnd-to-Endのアプローチを実現しています。

 一方で、オープンソースのLLMでは期待通りの性能が出ないことや、規則の選択基準や理論的解釈が不明確であるなどの課題も残されています。しかし、研究チームはこれらの課題は今後の研究で解決可能であると考えており、LEAPの基本的なアイデアの価値は損なわれないと主張しています。

大きいLLMが小さいLLMをサポートする「RoT」

 上海科技大学の研究チームが提案したRoTは、大規模で高性能なLLMが“サポート役”として小規模なLLMの過去のミスを分析し、より良い問題解決のための具体的な指示や戦略(ガイドライン)を生成することで探索効率と精度の改善を図るプロンプトエンジニアリング手法です。

 RoTは「探索木」という、問題解決の過程を木に例えて表現したアルゴリズムを使用します。ここでは問題解決の各段階を葉とし、段階の移動を枝と考えます。ユーザーは大規模なLLMで探索木を分析し、重要な葉(段階)を特定し、問題解決のガイドラインを生成させます。それを小規模なLLMのプロンプトに追加して問題解決に使います。

 この手法を反復的に適用することで探索性能を向上させられます。RoTは探索木ベースの手法だけでなく他の手法にも適用可能です。

 上海科技大学の研究チームはRoTの性能を古典的なベンチマークである「Blocksworld」や初歩的な数学のベンチマークである「GSM8k」などに適用して実験的に検証しました。この実験では、他の探索木ベースの手法と組み合わせることで、複数のLLM(phi-2、mistral-7b、mixtral-8x7bなど)の性能を大幅に改善できることが示されました。特に難しいタスクほど効果が顕著であることも分かりました。RoTは、LLMの推論やプランニング能力の向上において画期的な手法であり、さまざまなタスクへの応用が期待されています。

 なお、LEAPとの主な違いは、LEAPが不正解と正解の解決策を比較し、その違いからガイドラインを生成するのに対し、RoTは探索木の個々の葉(段階)に着目し、各状態における意思決定の良しあしを判断してガイドラインを生成することです。

photo (1)探索木の構築(2)重要な葉の選択(3)ガイドラインの生成(参考文献の図2(a)より引用)

三澤の目

 LEAPやPoTといった最新の手法は、プロンプトエンジニアリングによるLLMの可能性を大きく広げるものであり、ビジネスにおけるAIの活用をさらに加速する可能性を秘めています。少数の例示から効率的に学習し、高度な推論を可能にする技術は、さまざまな業務の自動化や効率化に貢献するでしょう。また、チャットbotの対話能力向上やより高品質な文書生成、精度の高い意思決定支援など、AIの活用範囲を大きく拡大させる可能性があります。

 特筆すべきは、これらの手法がプロンプトの工夫のみで利用可能であり、ファインチューニングと比較してコンピューティングリソースを抑制できる点です。企業がAIを効果的に活用するためには、このような最新の研究を常に把握し、自社のビジネス課題に最適な手法を選択することが重要です。プロンプトエンジニアリング領域の進展に注目し、新技術の効果的な導入戦略は、市場で大きな競争優位を獲得できる可能性があります。

著者紹介 三澤瑠花(日本タタ・コンサルタンシー・サービシズ)

AIセンターオブエクセレンス本部 AIラボ ヘッド

日本女子大学卒業、東京学芸大学大学院修士課程修了(天文学) フランス国立科学研究センター・トゥールーズ第3大学大学院 博士課程修了(宇宙物理学)。

2016年入社。「AIラボ」のトップとして、顧客向けにAIモデルの開発や保守、コンサルティングなどを担当している。

Copyright © ITmedia, Inc. All Rights Reserved.

あなたにおすすめの記事PR