後藤弘茂のWeekly海外ニュース

AMDがサーバー向けCPU「EPYC 7000」ファミリを正式発表

~ベールを剥いだモンスターの姿

EPYCでサーバー市場へ再参入するAMD

 AMDは、米オースティンで、サーバー向けCPU「EPYC 7000」ファミリを発表した。最高32コア/64スレッドで、8チャネルDDR4と128レーンPCI Expressを備えた高パフォーマンスCPUだ。CPUコアは最新の「ZEN」マイクロアーキテクチャで、高いシングルスレッド性能とマルチスレッド機能を備える。コードネームは「Naples」と呼ばれていた。

EPYC 7000シリーズの特徴
2ソケットのEPYCサーバー
1ソケットのEPYCサーバー

 AMDはEPYCファミリを、シングルソケットとデュアルソケットのボリュームサーバー市場に投入する。AMDがEPYCで特に武器とするのは、ソケットあたりで、広い帯域と容量のメモリ、高いI/O性能、多いスレッド数だ。また、AMDのGPUコンピュート製品「Radeon Instinct」との組み合わせによるヘテロジニアス(Heterogeneous:異種混合)コンピューティングも強く押し出す。

 サーバー向けCPU市場は、過去数年間事実上Intel Xeonの独占状態だった。かつてOpteronでサーバー市場を席巻したAMDは、対抗製品を持たず存在感を失っていた。AMDは、満を持したEPYCで、サーバー市場へと再参入すると宣言する。

 EPYCは、実際には4個のCPUダイをパッケージ内に封止したMCM(Multi-Chip Module)製品だ。各ダイは、それぞれ8個のZEN CPUコア、2チャネルDDR4、32レーンPCI Expressを備える。パッケージ上で、4個のコアを、32レーンのファブリックで相互接続している。ダイ自体は、8 ZEN CPUコアのRyzenのダイと同一だ。Ryzenでは無効にされていたファブリックを使って32コアの製品を作り出している。ちなみに、デスクトップで16コアの「Ryzen Thread Ripper」は、2ダイの製品だ。AMDは全てのEPYC製品を、7月中に揃える予定だ。

4個のダイを統合したEPYC
ダイ数によってさまざまなコンフィギュレーションがあるZEN CPUファミリ
PDF版はこちら

8コアから32コアまでの幅広いラインナップ

 EPYC 7000ファミリは、8コアから32コアまでの幅広いコンフィギュレーションで提供される。しかし、いずれの製品も、8チャネルのDDR4メモリと128レーンのPCI Expressなど、同一のフィーチャを備える。すべて4ダイの製品で、違いは有効になっているCPUコア数と動作周波数だけだ。TDP(Thermal Design Power:熱設計消費電力)レンジは、最高が180W、8コアが120W。

デュアルソケット対応のEPYC 7000シリーズ
シングルソケット用のEPYC 7000

 EPYCでは、ソケットあたり128レーンのPCI Expressを持つことが大きな強味だ。シングルソケットでもデュアルソケットでも、8x16のPCI Expressリンク構成が可能となる。PCI Expressだけで帯域は256GB/sとなる。

強力なPCI Expressレーン

 EPYCでは、128レーンのPCI Expressを使って最大6枚のGPUカードと他のI/Oデバイスを直結。1ノードで高密度なGPUコンピュートノードを構築することができる。従来のIntelベースのソリューションでは、PCI Expressスイッチを使わないと、広帯域での多数のGPU直結はできなかった。そのため、AMDはEPYCをRadeon InstinctによるGPUコンピュートのプラットフォームとしても最適とする。

デュアルソケットでのI/O構成とRadeon Instinct
シングルソケットでのI/O構成とRadeon Instinct
Intelの現行ソリューションでの比較
AMDは、I/Oやメモリの必要性から2ソケットを選択していたユーザーは、1ソケットで済むとしている

 EPYC 7000は、オンパッケージにハイスピードI/OのPCI Expressを持つだけでなく、低速なI/Oも備える。そのため、I/Oブリッジチップが不要で単体パッケージでI/O回りをすべて備えるサーバーSoC(System on a Chip)となっている。プラットフォームとしては、I/Oハブがないシンプルなものとなっている。

I/Oコントローラチップの機能も取りこんでいるEPYC

EPYCアーキテクチャのカギとなるInfinity Fabric

 EPYCは、オンダイ、オンパッケージ、パッケージ間のすべての接続を、新しいファブリック「Infinity Fabric」で行なっている。Infinity Fabricでは、上位のプロトコル層に、AMDのCoherent HyperTransportを拡張したプロトコルを使っている。しかし、下位の物理実装は、各層に合わせたものとなっている。

Infinity Fabricで結ぶEPYCのダイ内部

 まず、ダイの内部ではCPUクラスタとメモリコントローラ、I/Oコントローラの接続をInfinity Fabricで行なっている。オンダイでは256-bit幅の広いインターフェイスを使っている。EPYCは4個のダイを連結しているが、その接続は、32-bit幅の低レイテンシのパラレル接続となっている。オンパッケージで配線が短いため、ソースシンクロナスクロッキングのシングルエンデッド信号を使っている。帯域は各リンクが双方向で42.6GB/sで、2pj/bitと極めて低エナジーとなっている。このI/Oは、Ryzen製品では無効となっている。

ダイ同士の接続
EPYCの接続形態
PDF版はこちら

 パッケージ同士の接続は、ディファレンシャル信号のシリアルインターフェイス接続となっている。EPYCのダイは、ユニバーサルのシリアルPHYを搭載しており、同じPHYをPCI ExpressにもInfinity Fabricにも他のI/Oにも使うことができる。各ダイにつき16レーンをソケット間接続のリンクに使っている。各リンク当たりの帯域は38GB/sとなっている。4リンクで合計152GB/sの帯域だ。こちらは9pj/bitのエナジーとなっている。

EPYCのパッケージ間接続

 メモリインターフェイスは、ソケットあたり合計8チャネルのDDR4。転送レートは最高で2667Mtpsをサポートし、チャネルあたり21.3GB/sの帯域、ソケット合計で171GB/sのメモリ帯域となる。各チャネル2DIMMで、16DIMM構成で最大2TBメモリとなる。メモリサポートはRDIMM/LRDIMM/NVDIMM-N/3DS DIMM。RDIMMの分だけ、Ryzen系よりメモリの量とスピードの利点がある。

ソケットあたりのメモリ量も強味
EPYCのI/O帯域のサマリー

セキュリティプロセッサを搭載

 EPYCはセキュリティハードウェアを搭載している点も特徴だ。ARMのCortex-A5をセキュリティエンジンとして搭載しており、OSインディペンデントなセキュリティを提供する。

AMDのサーバーCPUとしては初めてセキュリティプロセッサが搭載された
セキュアメモリエンクリプションハードウェアがサポートされた
セキュアバーチャライゼーションの概要

 AMDは、現行のIntel Xeonに対して、同価格レンジでEYPCが大幅な性能優位を持つと主張する。コンパイラの最適化なしで、整数演算なら47%、浮動小数点演算で75%、メモリ帯域なら2.5倍の優位と説明する。

整数演算のコンペティティブベンチマーク
浮動小数点演算のコンペティティブベンチマーク
メモリ帯域のコンペティティブベンチマーク
2ソケット構成で現行のXeonと価格帯毎に比較したチャート
1ソケット構成で現行のXeonと価格帯毎に比較したチャート
ZEN CPUコアのマイクロアーキテクチャ
PDF版はこちら
AMDのオースティンサイト
EPYCの優位性を語るAMDのMark Papermaster氏(SVP & CTO, AMD)