岩井一真

記事一覧

vLLM×Prometheus×Grafanaで実現：

ローカルLLMサービングを見える化　監視ダッシュボードを作ろう

vLLMを使ってローカルLLMサービングを行うケースが増えています。そこで求められるのが、レイテンシ、GPUキャッシュ利用率、エラー率をはじめとした推論実行状況の把握です。本記事では、vLLMにPrometheusとGrafanaを組み合わせ、LLMサービングの「見える化」ダッシュボードを作る方法を紹介します。

(2025年10月14日)

岩井一真がアイティメディアで執筆した記事一覧です。

ローカルLLMサービングを見える化 監視ダッシュボードを作ろう

ローカルLLMサービングを見える化　監視ダッシュボードを作ろう