ゲルシンガーCEOは、AIの最新形態の1つである「RAG(Retrieval Augmented Generation」に触れ、「RAGスタイルのAIの利用度が上がっていくと、CPUベースのサーバはそのデータベースとして運用されていき、AIモデルそのものは主にAIアクセラレータで動作するようになっていくだろう」と語る。
RAGは、LLM(大規模言語モデル)に外部情報(検索エンジンや特定分野の専門情報など)を掛け合わせることによって、生成される回答(データ)の精度を高めるための仕組みだ。
このような用途において、現在はGPUサーバを使うことが多い。それに対して、ゲルシンガーCEOは「IntelにはGaudiシリーズがある」と語り、このタイミングで第3世代AIアクセラレータ「Gaudi 3」の展開をアピールした。
Gaudi 3は、FP8(8bit浮動小数点)演算における「GEMM(General Matrix-Matrix Multiply)」の理論性能値が最大1835TFLOPSとなる。競合のNVIDIAのAIアクセラレーター「NVIDIA GH200」の同一条件における理論性能値は最大1514TFLOPSとなるため、約321TFLOPSの性能差がある。
そこでゲルシンガーCEOは「Gaudi 2やGaudi 3は、競合と比べてどのくらい安いの?」と、RAGを適用したAIチャットに質問した。そう、このAIチャットにはGaudi 2やGaudi 3、そしてNVIDIA GH200の価格情報へとアクセスできるように設定されていたのだ。
すると「(NVIDIA GH200に対して)Gaudi 2は3分の1、Gaudi 3は3分の2です」と応答していた。
Copyright © ITmedia, Inc. All Rights Reserved.