AWS re:Invent 2024のDay2は「Amazon Bedrock」関連で11もの発表があった。マルチモーダルなAIの実務での運用を想定した機能強化が目立つ。
この記事は会員限定です。会員登録すると全てご覧いただけます。
Amazon Web Services(以下、AWS)は2024年12月2〜6日(現地時間)にかけて、米ラスベガスで年次イベント「AWS re:Invent 2024」を開催した。Day2の基調講演では、同社でAIおよびデータ担当バイスプレジデントを務めるスワミ・シヴァスブラマニアン氏が登壇し、AWSにおけるAI関連の取り組みと、18個の新サービスについて発表した。本稿は18の発表の中でももっとも情報が多かった「Amazon Bedrock」のアップデートをまとめる。
Amazon Bedrockはサーバレスで生成AIアプリを構築できる生成AIサービスだ。さまざまなAIモデルをAPIを通じて利用できる点が大きな魅力であり、シヴァスブラマニアン氏は「想像し得るほぼ全てのタスクに対応するモデルを提供している」と語った。2024年12月3日の基調講演では、AWS独自の最先端のAIモデル「Amazon Nova」がBedrockで利用可能になることが明らかにされた他、11もの新情報が更改された。以降で詳細を見ていく。
「poolside」は大企業のソフトウェアエンジニアリングを支援するAIアシスタントサービスだ。
コード生成やテスト作成、リファクタリング、ドキュメント作成などを支援する「malibu」と、低レイテンシでコード補完が可能な「point」という2つの生成AIモデルで構成されており、統合開発環境に組み込んで利用できる。
AWSは今回このpoolsideがBedrock内で利用できるようにすると発表した。
BedrockはStability AIが提供する画像生成AIモデル「Stable Diffusion」もにも対応しているが、今回新たに最新版「Stable Diffusion 3.5」が利用可能になった。
最大で80億のパラメーターを持つこのモデルは、効率的なパフォーマンスと、特定のニーズを満たすための優れたカスタマイズ性、多彩な出力が大きな強みとされている。
「Luma AI」はテキストや画像を基にして3Dモデルや動画を生成する生成AIモデルだ。
AWSはLuma AIとのパートナーシップを締結し、Bedrockから利用できるようにすると発表した。
Luma AIは最新のビデオ生成AI「Luma AI Ray 2」を近日中にリリースすると発表しており、この最新モデルもBedrockで利用できるようになる。
生成AIアプリケーションにおいては、さまざまな用途やニーズに対して基盤モデルを適切に選択することが重要になる。
このモデル選択に対する革新的なサービスとしてAWSは「Amazon Bedrock Marketplace」を発表した。これは大手プロバイダーが提供する100以上の基盤モデルにアクセス可能なマーケットプレイスで、開発者はBedrockのコンソールから任意のモデルを選択して、統合APIやナレッジベース、ガードレールといった機能と組み合わせて利用できる。
Bedrockで「プロンプトキャッシュ」が利用可能になる。
プロンプトキャッシュは、生成AIモデルに対して繰り返し使用されるプロンプトのコンテキストをキャッシュすることで送信量を削減する技術だ。プロンプトを削減できれば、AIサービスの利用コストとレイテンシを大幅に低減できる。
Bedrockのプロンプトキャッシュは最大5分間有効で、複数のモデルに対して適用できる。例えば1つのコードやドキュメントに対して繰り返して質問するような場合には、キャッシュされた内容を再利用することによって、最大で90%のコスト削減と85%のレイテンシ短縮が期待できる。
「Amazon Bedrock Intelligent Prompt Routing」は、プロンプトをさまざまな基盤モデルに自動的にルーティングする新サービスだ。
1つのアプリケーション内でも、ユースケースに応じて複数の基盤モデルを使い分けたい場合がある。そのようなときに、それぞれの基盤モデルの応答をチェックして最適なものを選択するのは、過剰なコストとレイテンシの増加につながる。
Bedrock Intelligent Prompt Routingを使えば、単一のエンドポイントに対するクエリを自動でルーティングして最適な基盤モデルにつなぐため、応答品質の最適化とコスト削減を実現できる。
ML(機械学習)を活用したインテリジェントなエンタープライズ検索エンジンである「Amazon Kendra」にも、生成AI機能が統合される。Amazon Kendraを使用することで企業が持つ非構造データをインデックス化して高速に検索できるようになる。
AWSは今回新たに生成AIに特化した「Amazon Kendra Generative AI Index」を発表した。これは生成AIのために最適化されたインデックスを付与することで、生成AIソリューションのための検索システムを強化するものだ。
Kendra Generative AI indexは「Amazon Bedrock Knowledge Bases」や「Amazon Q Business」にも組み込まれるため、アプリケーション内の検索精度が向上すると考えられる。
Amazon Bedrock Knowledge BasesはRAG(検索拡張生成)ワークフローのためのエンドツーエンドのフルマネージドサービスだ。
RAGは企業の独自のデータソースを使用してプロンプトを強化することで、より正確で関連性の高い応答を実現する手法だ。RAGを効果的に導入するには専門性の高い知識が必要だが、Bedrock Knowledge Basesはそれをフルマネージドでサポートする。
なお、AWSはBedrock Knowledge Basesで構造化データを取り扱えるようにすると発表した。このアップデートで、「Amazon Redshift」や、Day1で発表された「S3 Tables」「SageMaker Lakehouse」といった構造化されたデータソースに保存されたデータをRAGワークフローでそのまま活用できるようになる。
Amazon Bedrock Knowledge Basesのもう一つの強化ポイントが「GraphRAG」をサポートしたことにある。
GraphRAGは、ナレッジグラフと大規模言語モデル(LLM)を組み合わせることでデータの関係性をより深く理解し、関連性の高い情報を効率的に検索できるようにするモデルだ。
Bedrock Knowledge BasesがGraphRAGをサポートしたことで、開発者はナレッジグラフの作成と使用のプロセスを簡素化して、より簡単に生成AIアプリケーションに取り込める。これによって生成AIの応答精度の大幅な向上につながる。
生成AIによるデータ活用においては、ドキュメントや画像、音声、動画などの非構造化データから、いかに意味のある洞察を効率的に得るかが課題となる。
AWSはこのプロセスを強力にサポートする「Amazon Bedrock Data Automation」を発表した。これは非構造化データから自動で意味のある部分を抽出し、構造化データに変換するサービスだ。
例えば画像内にある情報を活用するケースを考えた場合、従来はまずOCRでテキストを抽出し、そのテキストを理解するためのプロンプトを設計、実行するといった処理が必要だった。Bedrock Data Automationを使えばこのプロセスを自動化して簡単にアプリケーションで非構造化データを活用できる。
Amazon Bedrock Guardrailsを使用すれば、不適切なコンテンツや個人情報を含んだコンテンツなど、危険性の高い内容を生成AIが出力しないようにフィルタリングできる。しかし、従来この機能はテキストのみを対象としていた。
「Amazon Bedrock Guardrails Multimodal toxicity detection」は、画像や動画などのマルチモーダルなコンテンツに対してもガードレール機能を適用できるようになる。これは広告などのクリエイティブなシーンで、不適切なコンテンツの出力を防止するのに極めて大きな威力を発揮することになる。
AWS、生成AIモデル「Amazon Nova」ファミリーをBedrockでリリース 動画生成モデルも
AWS、ストレージを持ち込んでデータを高速転送できる“場所”提供開始
AWSがネイティブなVMware環境を用意か Amazon EVSがまもなく登場
企業ITの「重荷」解消なるか 富士通とNRIがレガシー資産のクラウドシフトに本腰Copyright © ITmedia, Inc. All Rights Reserved.