ゲルシンガーCEOは、AIの最新形態の1つである「RAG(Retrieval Augmented Generation」に触れ、「RAGスタイルのAIの利用度が上がっていくと、CPUベースのサーバはそのデータベースとして運用されていき、AIモデルそのものは主にAIアクセラレータで動作するようになっていくだろう」と語る。
RAGは、LLM(大規模言語モデル)に外部情報(検索エンジンや特定分野の専門情報など)を掛け合わせることによって、生成される回答(データ)の精度を高めるための仕組みだ。
このような用途において、現在はGPUサーバを使うことが多い。それに対して、ゲルシンガーCEOは「IntelにはGaudiシリーズがある」と語り、このタイミングで第3世代AIアクセラレータ「Gaudi 3」の展開をアピールした。
Gaudi 3は、FP8(8bit浮動小数点)演算における「GEMM(General Matrix-Matrix Multiply)」の理論性能値が最大1835TFLOPSとなる。競合のNVIDIAのAIアクセラレーター「NVIDIA GH200」の同一条件における理論性能値は最大1514TFLOPSとなるため、約321TFLOPSの性能差がある。
そこでゲルシンガーCEOは「Gaudi 2やGaudi 3は、競合と比べてどのくらい安いの?」と、RAGを適用したAIチャットに質問した。そう、このAIチャットにはGaudi 2やGaudi 3、そしてNVIDIA GH200の価格情報へとアクセスできるように設定されていたのだ。
すると「(NVIDIA GH200に対して)Gaudi 2は3分の1、Gaudi 3は3分の2です」と応答していた。
プロセスノードに加えて新技術も売り込む! Intelが半導体の「受託生産」で使う“武器”【後編】
そのあふれる自信はどこから? Intelが半導体「受託生産」の成功を確信する理由【中編】
2030年までに“世界第2位”を目指す! Intelが半導体の「受託生産」に乗り出す理由【前編】
Intelが「Xeon 6プロセッサ」の詳細を発表 コンパクトな「6700シリーズ」と大型の「6900シリーズ」の2本立て
次世代CPU「Lunar Lake」でIntelが目指す“AI PC”とは? 驚くべき進化点と見える弱点、その克服法Copyright © ITmedia, Inc. All Rights Reserved.