米Amazon Web Services（AWS）は、米ラスベガスで開催中のイベント「AWS re:Invent 2024」の基調講演で、生成AIの基盤モデルをマネージドサービスで提供するAmazon Bedrockの新機能として、プロンプトのコンテキストをキャッシュする機能や、プロンプトを適切なモデルへルーティングする機能などを発表しました。

コンテキストを再利用してコストとレイテンシを低減

　プロンプトキャッシングは、Bedrock上の複数のモデルに対してよく使用されるプロンプトのコンテキストをキャッシュする機能です。キャッシュは最大5分間有効とされています。

　例えば同一のドキュメントに対して繰り返しプロンプトで質問されるケースや、プログラマがずっと同じコードに対してコードアシスタントを使用するケースなど、似たようなコンテキストが繰り返し使用されるケースでは、キャッシュされた内容を再利用できるため、最大でコストが90％、レイテンシが85％削減されると説明されています。

プロンプトに応じて適切なモデルを選択

　インテリジェントプロンプトルーティングは、プロンプトの複雑さに応じて基盤モデルのファミリーの中からコストと品質が最適なモデルを選び、そのモデルにプロンプトを送り込むことができる機能です。

　プロンプトのルーターはプロンプトに応じて、どのモデルがコストと品質の面でどのモデルが最適化を予測する能力を備えており、例えばAnthropicのClaudeモデルファミリーには、Opus、Sonnet、Haikuと呼ばれるコストと能力が異なる3つのモデルがあり、Amazon Bedrockはプロンプトの複雑さに応じてSonnetとHaikuのいずれかに対してインテリジェントにプロンプトをルーティングできます。

　ルーティングは、複雑でないプロンプトは小さくレスポンスが速くコストの安いモデルで処理し、複雑なプロンプトは能力の高いモデルで処理するように行われます。

　これによりプロンプトに対する回答の精度を犠牲にすることなく、コストを最大で30％削減できると説明されています。

　そのほかAmazon Bedrockは、構造化データの取得機能、グラフRAGへの対応、マルチモーダル対応のデータ抽出機能、エージェント作成機能など、多数の機能追加が発表されました。

AWS、生成AIアプリの開発を体験できる「Party Rock」公開　プロンプトで指示するだけ
米Amazon Web Servicesが、生成AIを活用したアプリの作成をプログラミングなしで体験できるWebサイト「Party Rock」を公開した。
AWSの生成AIサービス「Bedrock」に新機能続々　基盤モデルのファインチューニングや、安全性保つ“ガードレール”など
米Amazon Web Servicesが、生成AIサービス「Amazon Bedrock」の新機能を複数発表した。Bedrock上で一部大規模言語モデルのファインチューニングが可能になった他、生成AIによる応答の安全性を高める新サービスも登場した。
Anthropic、AIチャット「Claude 3」を3サイズで　日本語力も向上
Anthropicは、AIチャット「Claude 3」を発表した。「Opus」、「Sonnet」、「Haiku」の3サイズ（Opusが最大）で、Haiku以外は同日提供を開始した。無料版ではSonnetを利用でき、Claude Proにアップグレードすれば最大のOpusを利用できる。
Anthropic、「Claude 3」の最小で手頃価格の「Haiku」リリース　AWSなどで利用可能に
Anthropicは、AIチャット「Claude 3」の“最速かつ最も手頃な”モデルである「Haiku」をリリースした。リリース済みの「Opus」「Sonnet」に加えて、有料版claude.aiとClaude API、Amazon Bedrockで利用可能だ。
Anthropic、「Claude 3.5 Sonnet」更新と「Claude Haiku 3.5」リリースを発表
Anthropicは、「Claude 3.5 Sonnet」の更新と「Claude Haiku 3.5」のリリースを発表した。いずれも各種能力が向上した。Haikuは先代と同等の速度を維持しつつ、「あらゆるスキルセットで」改善され、「Claude 3 Opus」を多くのベンチマークで超えた。