メディア

岩井一真

岩井一真がアイティメディアで執筆した記事一覧です。

このエントリーをはてなブックマークに追加
記事一覧

vLLM×Prometheus×Grafanaで実現:

vLLMを使ってローカルLLMサービングを行うケースが増えています。そこで求められるのが、レイテンシ、GPUキャッシュ利用率、エラー率をはじめとした推論実行状況の把握です。本記事では、vLLMにPrometheusとGrafanaを組み合わせ、LLMサービングの「見える化」ダッシュボードを作る方法を紹介します。

()