Hothotレビュー

異次元の性能が新たな境地を切り開く。56コアのXeon w9-3495Xを試す

Xeon w9-3495X

 Intelから、Sapphire RapidsことXeon W-3400およびXeon W-2400シリーズが正式発表となった。店頭ではXeon W-2400が既に販売されているのだが、上位のXeon W-3400についても並ぶまで時間の問題だろう。

 今回、Supermicroの協力により、最上位となる「Xeon w9-3495X」をいち早くテストする機会が得られたので、紹介していこう。なお、組み合わせるマザーボードはSupermicroより提供された「X13SWA-TF」と、「X13SRA-TF」の2種類(主に紹介するのはX13SWA-TF)で、実売価格は前者が20万円強、後者が16万円強だ。

Pコア×56個の性能をその目で見届けろ!Sapphire Rapidsこと「Xeon w9-3495X」をライブ解説【4月14日(金)21時より】

 56個ものPコアを搭載したSapphire Rapidsこと「Xeon w9-3495X」をSupermicroの対応マザーボード「X13SWA-TF」、「X13SRA-TF」とともにライブ配信でたっぷり解説いたします!CPU、マザーボードともルックスだけでも圧倒される威容ですが、さらに圧巻の実動デモとベンチマーク結果解説を交えてお届けする予定です。解説はPC Watchデスクの劉 尭。MCはPADプロデューサーの佐々木修司です。

同じSapphire Rapidsなのに2種類あるXeonを整理する

 ソケットLGA4677を採用するSapphire RapidsベースのXeonだが、設計が異なるXeon W-3400とW-2400の2つに分かれているのが最大の特徴だ。

 具体的には、Xeon W-3400シリーズでは、最大15コアのCPUを1つのダイに集約し、このダイを4基パッケージ上に載せることで最大56コア(うち4コアは歩留まりのため無効)を実現している。ダイ間の接続はIntel版チップレットとなるEMIBを採用。ダイが多い分、メモリチャネル数は8、PCI Express 5.0レーンも112基ある。

 Xeon W-3400はコア数が多く処理性能が強力、PCI Expressのレーン数が多いぶん、消費電力も高い。たとえば最下位の「Xeon w5-3425」ではコア数が12基だが、それでもベースパワー270W/Turboパワー324W。今回レビューするXeon w9-3495Xではそれぞれ350W/420Wに達する。

Xeon W-3400のブロックダイアグラム

 一方Xeon W-2400では、モノリシックダイに32コアを集積し、(歩留まりと差別化のためか)最大24コアに制限している。こちらはメモリチャネル数は4、PCI Express 5.0レーンは64基となっている。なお、コア数は最下位の「Xeon w3-2423」で6基と、かなり絞られている。

Xeon W-2400のブロックダイアグラム

 しかしコア数が少ない分消費電力は控えめで、上位モデルでもベースパワー225W/Turboパワー270Wと、コンシューマ向け最上位のCore i9-13900Kが125W~253Wであることを考えれば“常識的な範囲”に収まっている。またモノリシックダイは、コア間通信のレイテンシがチップレット採用モデルと比較して有利だと思われる。

 ちなみに現時点で日本国内でも販売されているのは後者のみで、下位の12コア/24スレッドのXeon w5-2455Xで18万円強。入手が難しいDDR5 RDIMMが必須であることや、そもそもマザーボードが高価であることを考えると、個人がオフィスやゲームといった日常用に購入するのはやや非現実的だが、Xeon W-3400/W-2400には、絶対的なコア数に限定されない魅力がある。

AVX-512をサポート

 第11世代Core(Ice Lakeの第10世代Coreでは対応)でサポートされたものの、第12世代/第13世代Coreで切り捨てられた機能の1つとしてAVX-512がある。第12世代CoreではPコアとEコアのハイブリッドアーキテクチャを採用しているため、Pコア側はAVX-512をサポートしているものの、Eコア側が非対応のため、Pコア側も対応命令を揃えるためオフにせざる得なかった(一部マザーボードは、Intel非公式ながらEコアをオフにすればAVX-512を使えるようにするBIOSオプションがある)。

 これは、電力効率を追求するためのEコアにAVX-512を実装するのは非現実的だったという判断からだろう。実際にコンシューマ用途でAVX-512命令が使われることはほとんどなく、あったとしてもかなり限定的のため、切り捨てられるのは無理もない。

 しかし科学的シミュレーション、財務分析、Aiやディープラーニング、3Dモデリング、分析、画像/オーディオ/ビデオ処理、暗号化、データ圧縮といったワークロードでは有用であり、実際に大学で研究を行なっている筆者の友人もAVX-512命令のサポートが必須要件になっているほど。こういった用途ではXeon W-3400/W-2400シリーズのほうが威力を発揮する。

圧倒的なPCI Expressレーン

 コンシューマ向けの第12世代/第13世代Coreでは、CPUから出ているPCI Express 5.0が16レーンに限定されており、このレーンと共有するM.2スロットにSSDを装備すると、ビデオカードの接続が8レーンに限定されてしまう。

 一方Xeonは下位のW-2400でも64レーンあり、ビデオカードを3枚装着しても、PCI Express対応SSDを4基搭載できるほどのお釣りがくる。上位のXeon W-3400シリーズではレーン数が112もあるため、さらに余裕がある。

 ちなみに、今回レビューで使用するSupermicroのマザーボードは、この豊富にあるPCI Expressレーンを活用できるよう、拡張スロットがふんだんに用意されている。

X13SWA-TFのPCI Expressスロット
X13SRA-TFのPCI Expressスロット

オーバークロックに対応

 これまでXeonといえば「超安定志向」のプロセッサであることに異議を唱える人はいないだろう。ワークステーションは業務に利用されるため、動作安定性が最優先されるからだ。しかしXeon W-3400とW-2400シリーズでは、“不安定になる要素”とも言えるオーバークロック対応が果たされている。

 というのも、Xeon W-3400/W-2400は、これまでLGA2066シリーズのCore Xシリーズが担ってきたエンスージアスト向けのプラットフォームも“兼任”するからだ。Skylake-X世代では、同じLGA2066ソケットでありながらUDIMMをサポートするCore Xシリーズと、RDIMMをサポートするXeon Wシリーズで2分化されてきた。これがSapphire Rapids世代ではXeon Wに統一された(将来的にCore Xが復活する可能性もなきにしろあらずだが、可能性は低そう)。

 オーバークロックはBIOSでの設定はもちろんのこと、コンシューマで使い慣れているであろうIntel Extreme Tuning Utility(Intel XTU)が利用できる。コアごとの倍率設定、電圧設定など、エンスージアストが求める通り、多数の項目を自由に設定できるのだ。

Intel XTUを介してオーバークロックができる

DDR5 RDIMMが必須だが、オーバークロックに対応

 その一方で先述の通り、メモリはDDR5のRDIMM(Registered DIMM)しか対応していない。この点は安定性や大容量化の上ではメリットがあるのだが、そもそもDDR5のRDIMMは市場流通が非常に少なく、今回もテストにあたってサンプルを用意できるメーカーが皆無だったため、レアなこのモジュールを買わざるを得なかったので、デメリットとも言える(結果的に買ったのはMicronの16GB RDIMMを4枚)。

 とは言え、そのRDIMMも、XMP3.0対応のものであればオーバークロックが可能とされている。今回Supermicroの製品はメモリのオーバークロックまでは謳われていないほか、お借りできるメーカーもなかったため、今後機会があればテストし直す予定だ。

 ちなみに、競合となるRyzen Threadripper PRO 5000シリーズと比較しても、オーバークロックができるという特徴を持っている。“非PRO”ではできたが、Ryzen Threadripper 5000シリーズは登場していないので、現時点では独壇場だ。その一方でメモリはRDIMM必須という点、最大でも56コアに留まる点(競合は64コア)がビハインドになるだろう。

SupermicroのX13SWA-TFとX13SRA-TFを改めてチェック

 続いてSupermicroのX13SWA-TFとX13SRA-TFを改めてチェックしていく。こちらは以前のレビューで写真とともにレビューをお届けしていたが、ブロックダイアグラムなどの情報がまだ公開されていなかったため詳細をお伝えできなかった。現在、マニュアルが公開されていて、詳細が明らかとなっている。

 まずはExtended ATXに対応し、メモリスロットが16基、拡張スロットが6基と大変充実しているX13SWA-TFだが、PCI Express拡張スロットおよびM.2スロットのすべてがCPU直結になっているのが特徴である。Marvellの10GbEコントローラにあたる「AQC113C」、IntelのGigabit Ethernetコントローラ「I210」、そしてU.2ポートなどは、すべてIntel W790チップセット側に接続されている。

X13SWA-TF
X13SWA-TFのブロックダイアグラム(説明書より)。PCI Express拡張スロット/M.2スロットはすべてCPU直結

 一方SSI-CEBフォームファクタで、メモリスロットは半分の8基、PCI Express x16スロットも3基と少ないX13SRA-TFだが、残ったCPU側のPCI Expressレーンのうちx2をAQC113接続にしているため、10Gigabit EthernetがCPU直結である。加えて、未実装のUSB4コントローラASM4242がCPU直結とされている。最下段にPCI Express x4スロットがあるが、こちらはチップセットに接続されていて、PCI Express 4.0対応だ。

X13SRA-TF
X13SRA-TFのブロックダイアグラム(説明書より)。AQC113CとASM4242(未実装)がCPU直結だ

 いずれのモデルも、Intel W790とCPU間はx8のDMI 4.0接続となっており、転送速度は16GT/sである。Intel W790チップセット配下にあるデバイスは、この速度に制限されることになる。

 つまり、X13SWA-TFはどちらかと言えばXeon W-3400シリーズ向け、X13SRA-TFはどちらかと言えばXeon W-2400向けという意味合いが強い。ただ、Xeon W-3400を選んでも、当初より大量のメモリや拡張カードを搭載する予定がないのであればX13SRA-TFも十分選択肢に入るし、逆に最初はXeon W-2400を使い、後々Xeon W-3400シリーズにアップグレードする予定があるのであれば、X13SWA-TFを選ぶことも可能だ。

 両モデルともにCPUの電源周りは8フェーズ。Sapphire RapidsではボルテージレギュレータがCPUに内蔵されており、外部の電源入力は1系統のみで済むため、電源周りの設計は大変コンパクトにまとまっている。メモリの電源回路もまとめてMonolithic Power Systems(MPS)製のチップで固められているわけだが、MPSのサイトで記載の型番で検索しても製品情報がまったく出てこないで、深追いはしないこととする。

X13SWA-TFのCPUソケット周り
X13SRA-TFのCPUソケット周り

 ただ、MPS製の電源ICはRyzen Threadripper PRO向けマザーボード「M12SWA-TF」で採用実績があるほか、筆者がX13SWA-TFでオーバークロックのテストをしたところ、1,000Wを超えるような驚異的な消費電力の負荷でも、Cinebench R23を1パス安定して実行できるぐらいには優秀だったことを付記しておく。

一風変わったCPU装着方法。メモリスロットを埋める順番も要チェック

 Xeon W-3400/W-2400はサーバー向けのSapphire Rapidsと共通のLGA4677を採用しているが、そのCPUの装着方法もやや独特だ。メインストリームLGA1700やSocket AM5では、まずリテンションのレバーを緩めて開け、プロセッサをソケットのランドの上に乗せてリテンションを戻す方法だが、LGA4677はプロセッサを押さえるリテンションがないのである。

 LGA4677では、CPU側にキャリアフレームと呼ばれる部品が付属しており、まずこのキャリアフレームをCPUの周りに装着する(ツメで固定)。そしてCPUクーラーを逆さまにして、CPUとキャリアフレームごとツメでベース部に留める。さらにCPUクーラーを持ってCPUごとソケットの上に載せ、トルクスネジの上にあるレバーを倒してから、マザーボード側のリテンションフレームにネジ留め、といった具合だ。

 言葉で説明すると長くてややこしいのだが、要はCPUをCPUクーラーに取り付けてから、それをソケットに装着してネジ留めするイメージである。このあたりはX13SWA-TF/X13SRA-TFの説明書の図解が大変分かりやすいので、実際に組む際は迷うことはないだろう。

 一方、CPUを取り外す時は当然ネジを緩めてからCPUクーラーを持ち上げるわけだが、いわゆる「スッポン」した状態=CPUがCPUクーラーにくっついた状態)で外すことになる。その際はグリスの粘着でCPUがCPUクーラー外れにくくなっていると思うので、キャリアフレーム上にあるレバーで隙間を作って“こじ開け”、CPUとCPUクーラーを分離させることになる。

CPUにキャリアフレームを装着
キャリアフレームとCPUをCPUクーラーに装着する
ちなみにLGA4677対応CPUクーラーはベース部が巨大だ
リテンションにある三角形と、キャリアフレームの三角形を合わせる
最後に細い金属レバーのようなものを倒して、トルクスドライバでネジ留めする

 当初、キャリアフレームを採用するメリットはあまりないのでは? と思ったのだが、外した後にレバーでこじ開ける方式の方が、CPUソケットについたままCPUクーラーだけを外す作業よりも難易度が低いと感じた。特にLGA4677のようにヒートスプレッダとヒートシンクベース部の面積が大きい場合、グリスの粘着度合いも高いはずで、従来の方法ではいささか苦労するだろうと想像される。

 また、この方式ではレバーを省くことで、CPUソケット-メモリスロット間のクリアランスを厳しくすることができ、高密度実装にも貢献する目的もあるのだろう。

キャリアフレーム側に金属レバーがあるが、これを引き上げるとCPUとCPUクーラーのベース部がテコの原理で分離する

 なお、X13SWA-TFに関してはメモリスロットの“埋め方”に注意する必要がある。全部埋めるなら何も考えなくてもいいが、“2枚で構成する場合は左右非対称の装着で2パターン”、“12枚の場合は左右対称の2パターン”といった指定がある。また、Xeon W-2400利用時では外側のスロットが使えないといった制限もある。組み立ての際は腰を据えてじっくりマニュアルを参照しながら正しく装着しよう。

X13SWA-TFではメモリの装着方法に注意

メニーコアとAVX-512サポートによる圧倒的な性能

 続いてXeon w9-3495Xの性能を見ていきたい。今回、ベンチマークスイートとして「SiSoftware Sandra」、「Cinebench R23」、「Blender Benchmark」、「V-Ray 5」、「PCMark 10」、「3DMark」を用いた。

 なおBIOSに関して、サンプルが送られてきた際はバージョンが「1.0」であったが、今回テストにあたり、後日リリースされた「1.1」を適用した。この新BIOSではResizable BARをサポートしており、今回は有効にした状態とした。

 今回、Supermicroの機材協力はもちろんのこと、Noctuaの協力にも感謝したい。筆者はテストにあたりLGA4677に対応したCPUクーラーが必要になったわけだが、「手持ちのSP3対応のCPUクーラーNH-U14S TR4-SP3をLGA4677に変換するようなリテンションを作ってたりしませんか」と尋ねたところ、リテンションだけでなく、開発中のLGA4677対応CPUクーラーを4製品すべて送って頂けたのだ。

NoctuaのLGA4677対応のCPUクーラーの全製品が届いた。左からNH-U9 DX-4677、NH-U14S DX-4677、NH-D9 DX-4677 4U、そしてNH-U12S DX-4677。ビルドクオリティが大変高く美しい。そしてNoctua独特の茶色のファンは、エンスージアストからするともはや見るだけでホッと安心できる色である

 3D関連のベンチマークを除く、CPU性能比較用に、自作のCore i9-12900K搭載PC環境を用意した。詳細については下表の通り。ビデオカードが大きく異なるため、3Dベンチマークの結果は比較しないこととする。

【表】テスト環境
CPUXeon w9-3495XCore i9-12900K
マザーボードSupermicro X13SWA-TFASUS ProArt Z690 Creator Wi-Fi
チップセットIntel W790Intel Z690
メモリMicron MTC10F1084S1RC48BA1R×4G.Skill F5-5200U4040A16G×2
SSDSamsung PM981 512GBSamsung 980 PRO 1TB
GPUPalit GeForce RTX 3080 Ti GameRock OCPalit GeForce RTX 4090 GameRock OC
OSWindows 11 Pro 22H2
CPUクーラーNoctua NH-U14S DX-4677be quiet! SILENT LOOP 2 360mm
電源プラン最適なパフォーマンス

純粋なCPU性能を計測できるSiSoftware Sandra

 いつもならCinebench R23からスタートしたいところだが、Cinebench R23ではXeon W-3400/W-2400シリーズが持つAVX-512命令を活用できないため、この命令集を最大限に活用できるSiSoftware Sandra 2021の結果から紹介する。

 Sandraでは「プロセッサの性能」の項目こそ素の演算性能なのだが、「マルチメディア処理」、「暗号処理」、「科学的解析」、「プロセッサニューラルネットワーク」のベンチマークでAVX-512が活用されており、非対応のCore i9-12900Kと大きく差をつけられる。たとえば、マルチメディア処理の「集計マルチメディアクアッド整数」では実に5.6倍も高速といった具合だ。

SiSoftware Sandra プロセッサの性能
SiSoftware Sandra マルチメディア処理
SiSoftware Sandra 科学的解析
SiSoftware Sandra ニューラルネットワーク
SiSoftware Sandra 暗号処理

 つまり、実際のアプリケーションでAVX-512を活用できれば、これぐらいの差が生まれるわけで、プロフェッショナル用途向けCPUであるXeonと、コンシューマ向けCPUであるCoreを大きく隔てる理由になるわけだ。

 メモリのバンド幅についても大差がついており、Core i9-12900Kが約57GB/s程度に留まるのに対し、Xeon w9-3495Xでは90GB/s近くに達する。もっとも、今回は4枚しかメモリを用意できなかった点は注意したい。メモリが8枚あれば帯域幅はさらに向上するわけで、実際のメモリ帯域はさらに2倍近く(180GB/s超え)なるだろう。

 もっとも、Xeon w9-3495Xは56コアあるため、1コアあたりのメモリ帯域で考えると、むしろCore i9-12900Kに対して不利である。さらに言えば、PCI Express 5.0ではx16レーンだけで64GB/sの帯域となり、Xeon w9-3495X全体で112レーン=448GB/s提供できることを考えると、8チャネルのメモリを積んだとしても、全PCI Expressに対し同時にメモリから十分な量のデータをフィードできるわけではない。実際にPCI Expressレーンをフル活用するなら、CXLメモリと併用するのが現実的だろう(Xeon W-3400/W-2400で対応できるかどうかは不明だが)。

SiSoftware Sandra メモリー帯域

 もう1つ興味深い結果として「メモリーのレイテンシ」をチェックしておきたい。このベンチマークはテストデータのブロック容量を変えながら遅延を計測するものだ。L1キャッシュに収まる32KB~48KBまでの範囲では、動作クロックの差からCore i9-12900Kの方が有利だが、2MB範囲だとPコアのL2キャッシュが多いXeon w9-3495Xの方が有利になってくる。そしてより大きい32MB/64MB範囲でも、L3キャッシュの多さからXeon w9-3495Xの方が有利だということが分かる。

SiSoftware Sandra メモリーのレイテンシ

実アプリベースのCPUベンチマーク

 続けて、CPUの演算性能を計測するCinebench R23だが、Core i9-12900Kがマルチスレッドで26254、シングルスレッド1870のところ、Xeon w9-3495Xではそれぞれ61777、1670という数値だった。

Cinebench R23の結果

 マルチスレッドの数値は、「全部Pコアで56コア/112スレッドある」という事実を踏まえると、16コア/24スレッドのCore i9-12900Kからの向上幅としてはややインパクトに欠けるかもしれない(スレッド数は4.67倍だがスコアは約2.35倍)が、これはXeon w9-3495Xがテスト中、全コアが2.6~2.7GHzのクロックに留まっていることによる影響が大きい。とは言え、Core i9-12900Kでは到底実現し得ないスコアであり、Xeon w9-3495Xならではの圧倒的なパワーである。

 一方のシングルスレッドは、Turbo Boost時の最大動作クロックが4.8GHzとCore i9-12900Kの5.2GHzに迫る数値ではあるものの、実スコアではやや引き離されている(約8%のクロック差で約12%のスコア差)。しかし、Zen 3アーキテクチャのRyzen 9 5950Xを超える性能を実現しているのも確かであり、シングルスレッドを重視する一般的なアプリケーションでも十分実用的な性能を備えている。

 そのほか、Blender Benchmarkでは、「monster」で約2.7倍、「junkshop」では約2.9倍、「classrom」で約2.7倍と、Cinebench R23よりもCore i9-12900Kを引き離して高い優位性を見せつけた。V-Ray 5.0.20でも2.75倍の差をつけており、こういったクリエイティブアプリケーションにおいて、メインストリームと格の違いを感じることができる。

Blender Benchmark
V-Ray 5.0.20

総合ベンチマーク

 実アプリケーションを利用する環境に近いPCMark 10のスコアは「7442」という結果。このベンチマークはSSDの性能やビデオカードの性能にも左右されるため、環境が異なるCore i9-12900Kとは直接比較はしないが、絶対値的にはハイエンドのスコアそのものだ。

 項目別に見ると、特にDigital Content Creationの結果が思わしくないが、そもそもこのテストはXeonの特性をフルに活かしきっていない。マルチコアやAVX-512命令を活用できるアプリであれば、真逆の結果になるだろう。

PCMark 10の結果

3Dベンチマーク

 ゲームを中心とした3D関連のベンチマークについては、3DMarkのメニーコアCPUへの最適化が進んでいないことに加え、今回用意したCore i9-12900K環境とはそもそもビデオカードが異なるため、スコアはあくまでも参考とされたい。

 3DMarkに関して言えば、設計がやや古めの「Time Spy」(2016年)と「Fire Strike」(2013年)のテストが全くと言っていいほどメニーコアに最適化されていないため低いスコアに留まっているが、比較的新しい「Wild Life」(2022年)および「Speed Way」(2022年)はハイエンドプラットフォームにおけるGeForce RTX 3080 Tiのスコアで標準的な指標となっており、このCPUはGPUの性能を問題なく引き出せることを示している。

Speed Wayの結果
Wild Lifeの結果
Time Spyの結果
Fire Strikeの結果

 実際に、「ファイナルファンタジーXIV 暁月のフィナーレ ベンチマーク」でも24057というスコアを残しており、仮にこのプラットフォームでゲームをプレイしたとしても、CPUが大きく足を引っ張るということはないと思われる。よって、ゲームプレイと配信を1つのPC上で行なうような用途においても問題なくこなせるだろう。

ファイナルファンタジーXIV 暁月のフィナーレ ベンチマークの結果

消費電力は高めのため、「常に負荷がかかる」方がお得

 システム全体の消費電力だが、アイドル時で概ね230W前後、Cinebench R23実行時で460W前後だった(ちなみにデフォルト設定では、1秒だけPL2ステートに推移するので500Wに達する)。

 アイドル時の消費電力が高いのは、Windowsの電源プランで「最適なパフォーマンス」を選択しているため。「バランス」に設定すれば140W前後まで落ちるものの、パッケージ全体がC6ステートに遷移する時間が長くなるためか、Windowsの操作全般が緩慢になってしまった(ので、今回のベンチマークも最適なパフォーマンスを選択している)。

 一方、負荷時のシステム消費電力460Wだが、(構成が全く異なるとは言え)Core i9-13900Kとて420Wを超えていることを踏まえると、逆に56コアの割には大人しいという印象だ。ベンチマーク中の全コアが2.6~2.7GHzで遷移していたので、このクロックの低さが効率に効いたのだろう。

 この“メニーコアの割に大人しい”消費電力は、冷却にもプラスに働く。今回試用にあたって、Noctuaの「NH-U14S DX-4677」を使用したのだが、負荷時の温度は“たったの”62℃前後に留まった(室温23℃環境)。これはひとえにダイサイズ、そしてヒートスプレッダ/CPUクーラーのベース部のサイズが大きく、熱密度が低いためだろう。360mmの超巨大簡易水冷を用いてもゆうに90℃台に達するCore i9-13900Kなどに比べれば、遥かに扱いやすい。ちなみに負荷時のNH-U14S DX-4677のファン回転数も700rpm台に収まっており、大変静かであった。

Cinebench R23動作中の温度は62℃に留まった

 このことから、Xeon W-3495Xは「何もしないで220Wを消費し続けるより、常に負荷をかけて440Wで回した方がお得」ということになる。もちろん、そもそもXeon Wシリーズはその用途を想定して作られているわけなので、当たり前と言えば当たり前なのだが(とはいえ、メインストリーム向けのデスクトップCPUも、ノートなどと比較すれば決してアイドル時の電力は低くないが)。

軽くオーバークロックしてみる

 Xeon W-3400およびW-2400シリーズでは、末尾に「X」が付加されるモデルに関しては倍率ロックフリーとなっており、Intel標準のオーバークロックツール「Intel Extreme Tuning Utility(XTU)」を介してオーバークロックをすることができる。コアごとの倍率や電圧を細かく調節できるようになっているなど、まさにエンスージアスト向け仕様だ。

 とは言え、Xeonならではのメニーコアの性能をフルに活かしたいのであれば、数コアをオーバークロックするのではなく、全コアのTurbo Boostクロックを引き上げた方が良い。たとえばXeon w9-3495Xの全コアTurbo Boostクロックは2.9GHzなわけだが、これを引き上げたほうがパフォーマンスアップが得られる。

Intel XTUでの設定。各コアの設定もできるが、コア数に応じたクロックをまとめて変更したほうが性能の底上げになる

 ただ、それには相応の“覚悟”も必要だ。今回試しに、Intel XTUで電流制限値を最大の「1,023.88A」まで引き上げ、「Turbo Boost Short Power Max」および「Turbo Boost Powe Max」を「Unlimited」に設定。その上で56コアフル負荷時でも3.5GHzまで引き上げられるよう設定したところ、Cinebench R23を回しただけで1,000W超の消費電力を記録してしまった。

 X13SWA-TFには、ESP12Vの8ピンコネクタが3個装備されているし、ATX電源のほとんどは10A程度の電流に耐えるAWG18ケーブルが採用されているので、計算上は大丈夫なはずだが、X13SWA-TFのVRMヒートシンクが過度なオーバークロックに耐える設計ではないうえ、今回試用したNoctuaのハイエンドCPUクーラー「NH-U14S DX-4677」とて1,000W級の排熱を常時処理できるわけではないのは明らかだ(短時間とは言え抑え込めたのはすごいとしか言いようがない)。

CPU負荷だけで1,000Wを超えた。これを支えられるX13SWA-TFの電源設計も、NH-U14S DX-4677の冷却性能もすごい

 今回は、オーバークロックした状態でCinebench R23ベンチマークを回したが、「86849」という驚異的なスコアを残せた。VRM周りの冷却を強化して液体窒素を駆使するプロのオーバークロッカーであれば、世界記録を狙えそうだ。

全コア3.5GHz動作に引き上げたところ、Cinebench R23で86849を記録した

異次元の性能と安定性、扱いやすさ、そして究極の可能性を秘めたSapphire Rapids

 本来は2022年内に投入する予定だったSapphire Rapidsだが、今回のベンチマークを通してここまでの性能や安定性、意外なほどの扱いやすさ、そしてオーバークロックによる可能性を見せつけられると、正直待った甲斐があった! と言える。サーバー向けだけではなく、ワークステーション/エンスージアスト向けに投入し、“個人でも(金さえあれば)入手できる”夢のある環境を提供していることについて、これまで失われつつあったHEDT市場を取り戻そうとしているIntelの情熱や本気の姿勢が伝わってくる。

 そもそもCore i9-13900Kも性能的には十分素晴らしいのだが、エンスージアストにとって、AVX-512が非サポートになった“退化感”、PCI Express 5.0バスの“不足感”は拭いきれなかった。Xeon W-3400/W-2400はこの部分をきっちりキャッチアップしていると言える。あとは、Xeon w9-3495Xがいつ買えるようになるのかがクリアになり、入手性がやや悪いDDR5 RDIMMメモリの問題さえ解決すればよい。期待していた人にとって、喉から手が出るほど欲しいプラットフォームだ。

 ちなみにこのレビューはCPUが主体となったが、当然それを支えるSupermicroの「X13SWA-TF」と「X13SRA-TF」も素晴らしいマザーボードだと感じた。瞬間的にとは言え、1,000Wを難なくCPUに供給しCinebench R23のテストを終えることができたからだ。これもサーバー向けマザーボードを数多く設計したSupermicroならではの“安定性”のDNAが入ってこそ実現したのだろう。

 Xeon W-2400シリーズは既に販売中であり、X13SWA-TFもX13SRA-TFも既に販売中だ。Sapphire Rapidsを必要/必須としているプロフェッショナルにとってみれば、そもそもこれは「不可能」を「可能」にするプラットフォームであるため、“買う”以外の選択肢はない。

 しかし、一般の自作PCユーザーでも、PCを組む予定があって、予算も潤沢にあるのなら、ぜひこのプラットフォームを検討してもらいたい。それまでのPCではできなかった新たな使い方を、きっと見い出すことができ、新たな境地にたどり着くことができるだろうからだ。