プロナビ

Xeon 6にLunar Lake 全方位で競合をリードする、信用のブランドがIntelだ――基調講演でパット・ゲルシンガーCEOが語ったことCOMPUTEX TAIPEI 2024(3/4 ページ)

» 2024年06月05日 17時00分 公開
[西川善司ITmedia]

最新スタイルのAIには「Gaudi 3」を

 ゲルシンガーCEOは、AIの最新形態の1つである「RAG(Retrieval Augmented Generation」に触れ、「RAGスタイルのAIの利用度が上がっていくと、CPUベースのサーバはそのデータベースとして運用されていき、AIモデルそのものは主にAIアクセラレータで動作するようになっていくだろう」と語る。

 RAGは、LLM(大規模言語モデル)に外部情報(検索エンジンや特定分野の専門情報など)を掛け合わせることによって、生成される回答(データ)の精度を高めるための仕組みだ。

RAGが使われる RAGが普及すると、CPUベースのサーバで企業データを保存しつつ、生成AIモデルそのものはAIアクセラレーター上で実行されるようになると予測される

 このような用途において、現在はGPUサーバを使うことが多い。それに対して、ゲルシンガーCEOは「IntelにはGaudiシリーズがある」と語り、このタイミングで第3世代AIアクセラレータ「Gaudi 3」の展開をアピールした。

Gaudi 3を掲げるゲルシンガー氏 Gaudi 3のモジュールを掲げるゲルシンガーCEO

 Gaudi 3は、FP8(8bit浮動小数点)演算における「GEMM(General Matrix-Matrix Multiply)」の理論性能値が最大1835TFLOPSとなる。競合のNVIDIAのAIアクセラレーター「NVIDIA GH200」の同一条件における理論性能値は最大1514TFLOPSとなるため、約321TFLOPSの性能差がある。

 そこでゲルシンガーCEOは「Gaudi 2やGaudi 3は、競合と比べてどのくらい安いの?」と、RAGを適用したAIチャットに質問した。そう、このAIチャットにはGaudi 2やGaudi 3、そしてNVIDIA GH200の価格情報へとアクセスできるように設定されていたのだ。

 すると「(NVIDIA GH200に対して)Gaudi 2は3分の1、Gaudi 3は3分の2です」と応答していた。

質問 AIチャットに対して「Gaudi 2やGaudi 3は、競合と比べてどのくらい安いの?」と質問
回答 このAIチャットのエンジンは価格に関する情報に参照できるようになっており、それを反映して「(NVIDIA GH200に対して)Gaudi 2は3分の1、Gaudi 3は3分の2です」と回答してきた
Gaudi 3の特徴 Gaudi 3の特徴

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2025年07月11日 更新
最新トピックスPR

過去記事カレンダー