AWSがサーバレスのベクトルデータサービスを低価格で提供 東京リージョンでも利用可能:AIニュースピックアップ
Amazon S3 Vectorsの一般提供が正式にアナウンスされた。東京リージョンからも提供される。RAG実装コストの低減、パフォーマンスの改善に寄与する機能として注目を集める。
生成AIの企業利用に注目が集まる中、RAG(検索拡張生成)を実装する上で重要なデータ基盤技術であるベクトルデータベースに注目が集まっている。既に商用/非商用のさまざまなベクトルデータベースが提供されている状況で、AWSは低価格で利用できるサービスを投入した。AWSが提供するAIサービスで利用可能な他、マルチクラウド接続を使うことで他のAIサービスのストレージエンジンとしても利用できる。
高性能ベクトルデータサービスを低コストで利用可能に
2025年12月2日(現地時間)、AWSのセバスチャン・ストルマック氏は「Amazon S3 Vectors」の一般提供開始を発表した。2025年7月のプレビュー公開時は5つのリージョンに限定されていたが、日本を含む14リージョンで利用可能になった。
S3 Vectorsはベクトルデータの保存とクエリにネイティブに対応するサーバレス型のオブジェクトストレージだ。「Amazon Bedrock Knowledge Base」「Amazon OpenSearch Service」のストレージエンジンに利用できる他、「Amazon OpenSearch Serverless」に取り込んで利用することも可能だ。「AWS CloudFormation」によるリソース管理や「AWS PrivateLink」による接続にも対応する。
ベクトルデータの保存とクエリの実行に応じて、使用した分だけ料金が発生する。AWSはベクトルデータ保存とクエリにかかる総コストを最大90%削減できるとしている。PUT料金(データ書き込みリクエスト料金)は、アップロードするベクトルの論理GB数に基づいて計算する。ストレージコストはインデックス全体の論理ストレージの合計から算出する。クエリ料金にはAPIごとの料金とインデックスサイズに基づく1TB当たりの料金を含む。
S3 Vectorsは2025年7月にプレビューを発表して以降、既に400億以上のベクトルデータを取り込んでおり、25万以上のインデックスが作成され、10億回以上クエリが実行されているという。
一般提供に当たり、単一のインデックスに最大20億個のベクトルデータを保存、検索できるように機能が強化されており、プレビュー時よりも大規模なデータセットを管理しやすくなった。1クエリで最大40件の検索結果を取得できる。頻度に応じて100ミリ秒〜1秒未満で応答する。
Amazon S3 Vectorsは米国東部(オハイオ州、バージニア州北部)、米国西部(オレゴン州)、カナダ中部、アジア太平洋(シドニー、ムンバイ、ソウル、シンガポール、東京)、欧州(フランクフルト、アイルランド、ロンドン、パリ、ストックホルム)で利用可能だ。
ストルマック氏は同日、「Amazon S3 Tables」におけるレプリケーション機能、自動階層化機能の追加についてもアナウンスしている。
Copyright © ITmedia, Inc. All Rights Reserved.
