AIで競争力を高めたい企業が「インテル Gaudi 3 AI アクセラレーター」の導入を検討すべき理由とは?(3/4 ページ)

» 2024年06月21日 10時00分 公開
[PR/ITmedia]
PR

パフォーマンスだけでなく電力効率でも競合をリード

 Gaudi 3のパフォーマンスは、どのくらいなのだろうか。

 インテルによると、Gaudi 3は競合であるA社の製品Xに対して学習処理で平均1.5倍、推論処理で平均1.5倍のパフォーマンスがあり、また、同社の製品Yに対しても、同製品が得意とする推論性能で平均1.3倍のパフォーマンスを発揮しているという。

 そしてGaudi 3は、特に学習におけるアドバンテージが大きいという。インテルはOAMモジュールを8基連結した状態で「LLAMA(70億パラメーター)」、16基連結した状態で「LLAMA-13B(130億パラメーター)」、そして8192基連結した状態で「GPT3(150億パラメーター)」と。規模の異なるデータを示しているが、いずれもGaudi 3が競合製品と比べて優位だったという。

 この優位性は電力効率も同様だとインテルは主張する。推論処理での比較では、競合製品Xと比べると平均1.4倍の電力効率を発揮できるという。推論の電力効率は運用時のランニングコストに大きく関わってくるだけに、見逃せない要素だろう。

学習 学習処理における競合製品とのパフォーマンス比較。どの規模でもインテル Gaudi 3 AIアクセラレーターが優位に立っている
推論 推論性能はすべてOAM×8基での比較で、Falcon(130億パラメーター)ではトークン生成量が増えるほど、その優位性が高まっていない
Yとの比較 こちらは、競合の製品Yとの推論性能比較。入出力が大きなFalcon(1800億パラメーター)では、製品Yに対しても優位性がある
電力効率 電力効率でもやはり入出力が大きいほど有利な傾向だ

超大規模システムまで想定した高いスケーラビリティー

 繰り返しだが、Gaudi 3は、最初からAIアクセラレーターという役割に特化して開発されている。そのため、拡張のしやすさスケーラビリティーにも配慮が行き届いている。

 プロセッサパッケージには、24ポートもの200GbEコントローラーが統合されている。そのうち21基はスケールアップ、3基はスケールアウト用に利用可能だ。シングルノードのサーバーシステムから1024ノードの超大規模システムまで、ニーズに応じて規模を拡張可能だ

 ポイントは、大規模なクラスターを構成する際に業界標準のEthernet(イーサネット)スイッチを利用できることにある。汎用(はんよう)性のある規格であるため、利用できるスイッチの選択肢も多く、ベンダーやコストなど条件にあったものを使える。

1ノード8基接続時のアーキテクチャー 1ノード8基接続時のアーキテクチャー
16ノード リーフスイッチを利用した16ノードのサブクラスター構成
512ノード スパインスイッチを利用した512ノードのクラスター構成。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:インテル株式会社
アイティメディア営業企画/制作:ITmedia PC USER 編集部/掲載内容有効期限:2024年6月27日