Fastlyが「AI Accelerator」正式リリース、生成AIからのレスポンスをキャッシュし高速化とコスト削減を実現
米Fastlyは、生成AIへのAPIコールに対するレスポンスをセマンティックに基づいてインテリジェントにキャッシュすることで、高速なレスポンスとAPIコール回数の低減によるコスト削減などを実現する「Fastly AI Accelerator」の正式リリースを発表しました。
この記事は新野淳一氏のブログ「Publickey」に掲載された「Fastlyが「AI Accelerator」正式リリース、生成AIからのレスポンスをキャッシュし高速化とコスト削減を実現」(2025年1月22日掲載)を、ITmedia NEWS編集部で一部編集し、転載したものです。
米Fastlyは、生成AIへのAPIコールに対するレスポンスをセマンティックに基づいてインテリジェントにキャッシュすることで、高速なレスポンスとAPIコール回数の低減によるコスト削減などを実現する「Fastly AI Accelerator」の正式リリースを発表しました。
生成AIをAPI経由で呼び出す場合、通常のサービスの呼び出しと比較するとレスポンスまでに時間がかかることが多く、呼び出しごとにかかる料金も高額になりがちです。
Fastly AI Acceleratorは、こうした生成AIからのレスポンスをキャッシュし、似たような質問に対するレスポンスであればキャッシュの内容を高速に返すことで、生成AIのレスポンスを高速にし、また呼び出しにかかるコストを削減できると説明されています。
キャッシュは「セマンティックキャッシュ」として、呼び出しの内容をベクトルとして保持するため、似たような意味を持つ呼び出し内容であればキャッシュが利用される仕組みとなっています。
同社はFastly AI Acceleratorのベータ版の利用実績として、応答速度が平均で9倍高速になったとしています。
Fastly AI AcceleratorはOpenAI ChatGPTに加え、 Microsoft Azure AI Foundryにも対応しています。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「Amazon Bedrock」が生成AIのコストを最大90%節約できるプロンプトキャッシングなど新機能を搭載
米Amazon Web Services(AWS)は、米ラスベガスで開催中のイベント「AWS re:Invent 2024」の基調講演で、生成AIの基盤モデルをマネージドサービスで提供するAmazon Bedrockの新機能として、プロンプトのコンテキストをキャッシュする機能や、プロンプトを適切なモデルへルーティングする機能などを発表しました。
AWS、生成AIスタートアップに360億円投資 支援プログラム第2弾も
米Amazon Web Servicesが、生成AIスタートアップに2億3000万ドル(約360億円)を投資すると発表した。スタートアップに対し、AWSの支払いに使えるクレジットや教育を提供するために使う。生成AIスタートアップ支援プログラム「AWS Generative AI Accelerator」の第2期も開始した。
Cloudflare、CDNエッジで生成AIを実行できる「Workers AI」正式リリース 世界150都市のデータセンターでGPU基盤を提供
米Cloudflareは、同社のグローバルに展開するCDNのエッジで生成AIの推論処理を実行できる「Worker AI」の正式サービス化を発表しました。
Microsoft、日本の生成AI・クラウドに大型投資 AI研究所も開設 過去最大4400億円
米Microsoftは、今後2年間で29億ドル(約4400億円)を投資して日本のAIインフラとクラウドコンピューティングを増強すると、岸田首相の訪米に合わせて発表した。
OpenAIの動画生成AI「Sora」、ついに一般提供開始 「ChatGPT」課金ユーザーなら追加負担なし
米OpenAIは12月9日(現地時間)、動画生成AI「Sora」を同日から提供すると発表した。
