ニュース
企業のAI投資拡大にコスパとエコシステムで応えるインテル
2024年9月25日 19:22
インテルは25日、エンタープライズ製品に関する記者説明会を開催。グローバルで24日に正式発表された「Xeon 6プロセッサー(P-core採用)」および「Gaudi 3 AIアクセラレーター」に関する解説を行なった。
説明会では、同社執行役員 技術本部長 町田奈穂氏、技術本部 シニア・アプリケーション・エンジニアの小林弘樹氏、技術本部 技術部長の渡邉恭助氏が登壇した。
Xeon 6(P-core採用)は、AIやHPCなど演算負荷の高いワークロードに向けたデータセンター向けCPU。今回正式発表されたのは「Xeon 6 6900P」シリーズ(Pコア採用で最大TDP 500Wの高性能モデル)となる。
最大128コア、504MB L3キャッシュ、最大96レーンのPCIe 5.0/CXL 2.0などを搭載。サーバー向けCPUとして市場初を謳うMRDIMMメモリのサポートも果たした。競合製品と比べ、AI推論で最大5.5倍、HPC演算で最大2.1倍の性能を実現したとする。
Xeon 6シリーズの詳細については既報をご覧いただきたい。本稿では、記者説明会の模様うち、Gaudi 3に関する内容を中心にお届けする。
拡張カードタイプも登場するGaudi 3
Gaudi 3は、Xeon 6 6900Pシリーズとあわせて同社が発表したAIアクセラレータ。AIモデルの学習やファインチューニングもサポートしているが、最先端モデルや特定領域に特化したモデル、オープンソースのエンタープライズ向けモデルなどにおいて、より効率よく推論することに注力した製品だと位置付けている。
フォームファクタは、OAM仕様準拠のメザニンカード「HL-325L」、これを8枚搭載できるベースボード「HLB-325」、CEM仕様のPCIe拡張カード「HL-338」の3種類を展開。用途や要望に応じた選択肢を用意したとする。
このうち、HL-338はGaudi 3から新たに加わるフォームファクタで、基本仕様は継承しつつ、拡張カードの形態で提供するとともに、TDPを900Wから600Wへと抑えるなど、より導入しやすい製品とした。小規模モデルの学習や推論、ファインチューニングなどに好適としている。
加えて、トップボード(HLTB-304)を用いて4枚のHL-338を接続し、スケールアップすることも可能。さらに、各カードにはスケールアウト用のQSFP-DDコネクタも2つ備え、拡張カードタイプであっても拡張が可能な設計となっている。
Gaudi 3では、行列演算を担う8基のMMEや、ベクトル演算を担う64基のTPC、大容量の128GB HBM2eメモリなどを搭載。BF16およびFP8行列演算において1,835TFLOPSの性能を実現する。
MMEは256×256行の大規模行列演算を1度に行なえるほか、TPCは4つの独立パイプラインスロットによる並列実行が可能。また、グラフ・コンパイラーによって、パイプラインを介してMMEとTPCを並列実行できる仕組みを用意することで、演算効率を引き上げているという。
競合となるNVIDIA H100と比較すると、Llama-3 8Bの推論スループットで約1.09倍、1ドルあたりのパフォーマンスで1.8倍を実現。より大きなLlama-2 70Bにおいては、それぞれ1.19倍、約2倍を達成したとしており、コストパフォーマンスの優位性があると説明している。
そのほか、幅広いAIモデルやフレームワーク、ツールなどをサポートしている点もGaudiプラットフォームの利点であるとする。
Gaudi 3搭載システムは、Dell、Supermicroから、2024年第4四半期に一般提供が開始される予定。Intelの提供するTiberデベロッパークラウドでも、2025年には一般提供が始まる見込みだとしている。
【9月27日訂正】初出時、Gaudi 3搭載システムは、Dell、HPE、Supermicroから提供予定としておりましたが、メーカーより変更のアナウンスがあり、正しくはDell、Supermicroから提供予定となりました。これにともない記事内容を修正しました。
さらなる拡大が見込まれるAI投資。Intelの強みは優れたコスパとエコシステム
Intelでは、AIは現状まだ初期段階にあり、一部の企業などが投資を行なっている状態だと考えているという。IDCの調査によれば、企業によるAI投資の予測は、2024年で2,350億ドル(日本円で約33兆円)だが、4年後の2028年には6,300億ドル(約89兆円)まで拡大すると予測されており、これは国家予算に匹敵するほどの規模だという。
生成AIやエンタープライズのAI市場の成長がけん引し、投資規模の拡大が見込まれる一方で、それを支えるAIインフラストラクチャの構築においては、コストや拡張性、導入速度、電力効率、セキュリティなど、さまざまな課題があるという。
こういった状況に対して同社では、TCOにおける優位性を生かしたAIシステムの構築、電力効率に優れた製品の投入、AIアプリケーションの迅速な展開を可能にするオープンエコシステムの3点に注力。そのような課題と戦略を踏まえた、多様な企業のニーズに応えられる製品ラインナップを展開していくとした。
そのほか説明会では、Gaudiを実際に導入してきたエフサステクノロジーズ 取締役常務の坂井賢一氏、および日本アイ・ビー・エム 理事 クラウド・プラットフォーム事業担当の佐藤隆子氏が登壇。Gaudi 3採用に向けた取り組みや期待などを語った。