ニュース

Intel、2ダイ構成で最大64コアになった「第5世代Xeon」

第5世代Xeonの発表

 Intelは14日(米国時間)、従来の第4世代Xeonと互換性を保ちながら、L3キャッシュ容量の増加やダイ構成の見直しで性能を向上させ、最大64コアになった「第5世代Xeon」を発表した。

 第5世代Xeonは、従来の第4世代Xeon(コードネーム:Sapphire Rapids)とドロップイン互換性(従来システムはそのままにCPUだけ交換可能)を保ちながら、L3キャッシュ容量が3倍で最大320MBになるなど、アーキテクチャで多くの改善を施すことで性能向上が図られているのが特徴。

 従来からアップグレードすることで、平均性能が21%が改善するほか、AI推論処理なら最大42%、HPCにおける処理は最大40%、スループットが重視されるネットワーク/ストレージ分野では70%向上するという。

Xeonのロードマップ
第4世代Xeonと互換性を保ちながら性能/機能強化
第4世代Xeonからアップグレードすることで平均21%程度性能が向上する
幅広いワークロードにおける性能向上
各命令アクセラレーションにより電力性能比が向上する

ダイの構成やCXLサポートの改善

 これを実現した技術のうちの1つが、ダイ構成の見直しだ。第4世代は1つのパッケージに4つのダイを格納した「XCC」(最大60コア)と、1つのダイだけだった「MCC」(最大32コア)の2種類のパッケージだった。これが第5世代では、最大64コアのXCC、最大32コアのMCC、最大20コアのEE LCCの3種類になった。

Xeonのダイパッケージの比較

 ここで課題となるのはXCCの方で、ダイ間の通信がパッケージ経由となるため、XCCでは遅延が大きい。加えて、メモリコントローラも4つのダイそれぞれが2チャネル受け持つ構造のため、たとえばダイAのコア1が処理に必要なデータが、ダイBが司るメモリ上にある……という可能性も増え、レイテンシ増加の要因となっていた。

第4世代Xeonと第5世代Xeonの比較

 第5世代Xeonでは同じようにXCCとMCCの2バリエーションがあるものの、XCCは2ダイの設計となったことで、より多くのコアが、処理に必要なデータが同じダイ上のメモリコントローラが司る空間にあるチャンスが増え、レイテンシが低減する。

 加えて、第4世代XeonのXCCでは、出荷時のクラスタリングモードが「QUAD」という、4つのダイが1つのNUMAノード(つまり全てのメモリがローカルアクセス扱い)として見えるものとなっていた。4つのダイを別のNUMAノードとして認識させる「SNC4」や、2つひとまとめにする「SNC2」もあるのだが、それはユーザーが変更する必要があった。

 一方で第5世代Xeonでは標準で2つのダイを別のNUMAノードとして認識させる「SNC2」が選択されるようになったことで、ローカルクラスタヒット時のレイテンシが低減。それぞれのダイも4chメモリコントローラとなり、L3キャッシュ容量も増加。さらにメモリ速度も4,800MT/sから5,600MT/sに向上したことで、レイテンシ低減などが図られている。

第5世代Xeonではダイが減ったためレイテンシが削減されるほか、デフォルトでSNC2で出荷される

 また、PCI Express物理層を介してメモリを拡張するCXL(Compute Express Link 1.1)の対応も強化し、CXL Type 3のサポートが公式で謳われた(第4世代は公式ではType 1/2のみ)。これによりインメモリデータベースなどの性能向上が図れるとしている。

CXL Type 3の対応

電力消費も削減やクロック向上のための仕組み

 第5世代Xeonでは、TDPこそ最大350Wと第4世代Xeonと全く同様だが、製品を購入した直後でも、50%程度以下の軽負荷時なら、消費電力の削減が実現されている。これにより多くのワークロードで電力効率改善が見込まれる。

 さらに、「Optimized Power Mode」を利用すれば、30%負荷時でさらに110W、40%負荷時で66Wの消費電力削減が実現できると言い、電力ならびに冷却コストを削減できるとしている。

電力効率の改善
第4世代Xeonから軽負荷時の消費電力が削減された
各分野における電力効率の向上
第3世代Xeonから乗り換えることでTCOが削減するという
AIに特化した要素

 またユニークな点として、Turbo周波数のレベルをこれまでの4つ(命令クラス0~3)から5つ(命令クラス0~4))に増やしたのが特徴。

 拡張命令集によって利用されるトランジスタが異なるため、それに応じて発熱や消費電力レベルも変化する。そのため、各々の命令集に応じてTDPを超えないよう、CPU周波数を調節する必要があるのだが、その段階が増やされ、より性能が最適化された。

 第4世代/第5世代Xeonでは、「SSE」、「AVX2」、「AVX512」、「AMX」という4つの命令集ごとに最適な周波数をCPUが判断し、それに応じた周波数で動作させている。電力消費/発熱量的にはSSE→AMXの順に増えていくため、特にAVX512/AMX高負荷時は周波数を抑える必要がある。

 第4世代Xeonにおいて、AVX512に関しては「Ultra-Light」、「Light」、「Moderate」、「512 Heavy」の4段階が用意されていたが、AMXについてはUltra-Lightを除いた3段階のみで、AMX Heavyと512 Heavyは同じ動作周波数だった。

第5世代Xeonのターボ周波数。命令クラスが1つ増え、AVX512/AMX利用時のペナルティを軽減した

 第5世代Xeonでは新たにAMX Ultra-Lightを定義し、AVX512 Light相当で動作させるように揃え、AMX Heavyを新設した命令クラス4に細分化。これによりAVX512/AMX命令利用時のターボ周波数のペナルティを軽減し、命令セットのユーザビリティを向上させた。512 Heavyより軽い負荷の時の動作クロックが引き上げられ、たとえば4スレッドまたは8スレッド程度のLINPACK AVX512負荷では従来から9%ほど性能が向上するという。

 このほか第5世代Xeonでは新たにVMを分離することでセキュリティ性を向上させる「Intel TDX」をサポート。TDXをオンにしてセキュリティを向上させたとしても、性能低下は抑えられ、第4世代Xeonよりも高速としている。

第4世代Xeonと比較してAI処理性能が向上
第3世代Xeonと比較するとエッジにおけるAI処理性能は5倍に達する
VMごと分離してセキュリティ性を向上させるIntel TDX
Intel TDXを使えばVMのセキュリティ性を向上させつつ性能低下を抑えられる

 SKUだが、2ソケット高性能/汎用向け、2ソケットメインストリーム向け、液冷向けで性能をさらに向上させたモデル、シングルソケット用途、5G/ネットワーク用途、クラウド用途、ストレージ用途、IoT向けなど、豊富なラインナップを取り揃える。

第5世代XeonのSKU