ニュース

企業のAI投資拡大にコスパとエコシステムで応えるインテル

Gaudi 3

 インテルは25日、エンタープライズ製品に関する記者説明会を開催。グローバルで24日に正式発表された「Xeon 6プロセッサー(P-core採用)」および「Gaudi 3 AIアクセラレーター」に関する解説を行なった。

 説明会では、同社執行役員 技術本部長 町田奈穂氏、技術本部 シニア・アプリケーション・エンジニアの小林弘樹氏、技術本部 技術部長の渡邉恭助氏が登壇した。

町田奈穂氏
小林弘樹氏
渡邉恭助氏

 Xeon 6(P-core採用)は、AIやHPCなど演算負荷の高いワークロードに向けたデータセンター向けCPU。今回正式発表されたのは「Xeon 6 6900P」シリーズ(Pコア採用で最大TDP 500Wの高性能モデル)となる。

 最大128コア、504MB L3キャッシュ、最大96レーンのPCIe 5.0/CXL 2.0などを搭載。サーバー向けCPUとして市場初を謳うMRDIMMメモリのサポートも果たした。競合製品と比べ、AI推論で最大5.5倍、HPC演算で最大2.1倍の性能を実現したとする。

新たに発表されたXeon 6 6900Pシリーズ
競合製品と比べ、AI推論で最大5.5倍、HPC演算で最大2.1倍の性能を謳う
2025年第1四半期にはさらなる製品が追加される予定

 Xeon 6シリーズの詳細については既報をご覧いただきたい。本稿では、記者説明会の模様うち、Gaudi 3に関する内容を中心にお届けする。

拡張カードタイプも登場するGaudi 3

 Gaudi 3は、Xeon 6 6900Pシリーズとあわせて同社が発表したAIアクセラレータ。AIモデルの学習やファインチューニングもサポートしているが、最先端モデルや特定領域に特化したモデル、オープンソースのエンタープライズ向けモデルなどにおいて、より効率よく推論することに注力した製品だと位置付けている。

Gaudiは推論の部分に注力

 フォームファクタは、OAM仕様準拠のメザニンカード「HL-325L」、これを8枚搭載できるベースボード「HLB-325」、CEM仕様のPCIe拡張カード「HL-338」の3種類を展開。用途や要望に応じた選択肢を用意したとする。

 このうち、HL-338はGaudi 3から新たに加わるフォームファクタで、基本仕様は継承しつつ、拡張カードの形態で提供するとともに、TDPを900Wから600Wへと抑えるなど、より導入しやすい製品とした。小規模モデルの学習や推論、ファインチューニングなどに好適としている。

 加えて、トップボード(HLTB-304)を用いて4枚のHL-338を接続し、スケールアップすることも可能。さらに、各カードにはスケールアウト用のQSFP-DDコネクタも2つ備え、拡張カードタイプであっても拡張が可能な設計となっている。

フォームファクタは3種類
新たに拡張カードタイプの製品も加わった
複数枚のカードを使ったスケールアップなども可能

 Gaudi 3では、行列演算を担う8基のMMEや、ベクトル演算を担う64基のTPC、大容量の128GB HBM2eメモリなどを搭載。BF16およびFP8行列演算において1,835TFLOPSの性能を実現する。

 MMEは256×256行の大規模行列演算を1度に行なえるほか、TPCは4つの独立パイプラインスロットによる並列実行が可能。また、グラフ・コンパイラーによって、パイプラインを介してMMEとTPCを並列実行できる仕組みを用意することで、演算効率を引き上げているという。

Gaudi 3のブロック図
性能向上に寄与しているMMEとTPC
MMEとTPCをパイプライン方式で英列実行し、演算効率を向上

 競合となるNVIDIA H100と比較すると、Llama-3 8Bの推論スループットで約1.09倍、1ドルあたりのパフォーマンスで1.8倍を実現。より大きなLlama-2 70Bにおいては、それぞれ1.19倍、約2倍を達成したとしており、コストパフォーマンスの優位性があると説明している。

 そのほか、幅広いAIモデルやフレームワーク、ツールなどをサポートしている点もGaudiプラットフォームの利点であるとする。

NVIDIA H100との比較。スループット、1ドルあたりのパフォーマンスの両面で優れているとする

 Gaudi 3搭載システムは、Dell、Supermicroから、2024年第4四半期に一般提供が開始される予定。Intelの提供するTiberデベロッパークラウドでも、2025年には一般提供が始まる見込みだとしている。

会場にはSupermicroから登場予定のGaudi 3搭載システムも展示されていた

【9月27日訂正】初出時、Gaudi 3搭載システムは、Dell、HPE、Supermicroから提供予定としておりましたが、メーカーより変更のアナウンスがあり、正しくはDell、Supermicroから提供予定となりました。これにともない記事内容を修正しました。

さらなる拡大が見込まれるAI投資。Intelの強みは優れたコスパとエコシステム

AIへの投資が今後さらに拡大が見込まれる

 Intelでは、AIは現状まだ初期段階にあり、一部の企業などが投資を行なっている状態だと考えているという。IDCの調査によれば、企業によるAI投資の予測は、2024年で2,350億ドル(日本円で約33兆円)だが、4年後の2028年には6,300億ドル(約89兆円)まで拡大すると予測されており、これは国家予算に匹敵するほどの規模だという。

 生成AIやエンタープライズのAI市場の成長がけん引し、投資規模の拡大が見込まれる一方で、それを支えるAIインフラストラクチャの構築においては、コストや拡張性、導入速度、電力効率、セキュリティなど、さまざまな課題があるという。

 こういった状況に対して同社では、TCOにおける優位性を生かしたAIシステムの構築、電力効率に優れた製品の投入、AIアプリケーションの迅速な展開を可能にするオープンエコシステムの3点に注力。そのような課題と戦略を踏まえた、多様な企業のニーズに応えられる製品ラインナップを展開していくとした。

3つの戦略的な分野に注力していくという
多様な企業のニーズに応える製品を用意

 そのほか説明会では、Gaudiを実際に導入してきたエフサステクノロジーズ 取締役常務の坂井賢一氏、および日本アイ・ビー・エム 理事 クラウド・プラットフォーム事業担当の佐藤隆子氏が登壇。Gaudi 3採用に向けた取り組みや期待などを語った。

坂井賢一氏
佐藤隆子氏