Hothotレビュー

Ryzen Threadripper PROによる最強の自作PCを可能にする「Supermicro M12SWA-TF」

Supermicro M12SWA-TFとRyzen Threadripper PRO 3975WX

 Supermicroは、AMDプロフェッショナル向けのハイエンドCPU「Ryzen Threadripper PRO」に対応したマザーボード「M12SWA-TF」を、同プロセッサの国内単品販売と同じ3月26日に発売する。価格はオープンプライスだ。今回、Supermicroの協力により、本製品とRyzen Threadripper PRO 3975WXを入手できたので、その性能を検証していきたい。

Ryzen Threadripperの似て非なる“PRO”

 Ryzen Threadripper PROはその名前からわかるとおり、Ryzen Threadripperとほぼ同じ性格の製品だ。ただ、“PRO”とついているからにはそれなりの差別化がなされている。おもな違いをまとめると以下のようになる。

  • 同じコア数のものの比較ではクロックがやや低い
  • メモリチャネルが4から8に倍増
  • Registered DIMMも対応(Unbuffered DIMMもサポート)
  • PCI Expressレーンが72から128に増加
  • メモリの完全暗号化
  • リモート管理機能
  • Ryzen Master非対応

 また、Ryzen Threadripperでは最小コア構成が16/32スタートとなっているが、Ryzen Threadripper PROでは12コア/24スレッドとなっている。CPUコア数はそこまで必要ないが、大量のPCI Expressレーンが必要なGPGPU処理や、メモリバンド幅を大量に消費するデータ転送/処理アプリケーションに応えた仕様だと言っていいだろう。

【表】製品の比較
CPU3990XPRO 3995WX3970XPRO 3975WX3960XPRO 3955WXPRO 3945WX
コア/スレッド数64/12832/6424/4816/3212/24
ベースクロック2.9GHz2.7GHz3.7GHz3.5GHz3.8GHz3.9GHz4GHz
最大ブーストクロック4.3GHz4.2GHz4.5GHz4.2GHz4.5GHz4.3GHz
合計L1キャッシュ4MB2MB1.5MB1MB768KB
合計L2キャッシュ32MB16MB12MB8MB6MB
合計L3キャッシュ256MB128MB128MB64MB
パッケージsTRX4sWRX8sTRX4sWRX8sTRX4sWRX8
メモリチャネル484848
PCI Express721287212872128

 Ryzen Threadripperと比べるとI/O周りが強化されている一方で、CPU演算性能の低下はごくわずか。一方でサーバー向けのEPYCと比較すると動作クロックが明らかに高く(EPYCは最大でも3.9GHz)、CPUとしての演算性能は高い。よってRyzen Threadripper PROは、Ryzen ThreadripperとEPYCそれぞれの利点をバランス良く併せ持った製品だと言えるだろう。

 メモリチャネル数とPCI Expressレーンの増加、およびRegistered DIMMの対応などにより、従来のsTRX4マザーボードでは使用できず、新たにsWRX8というプラットフォームが必要になる。

Ryzen Threadripper PRO 3975X

 じつはsWRX8プラットフォームは2020年7月に発表されていて、これを搭載した「ThinkStation P620」というLenovoワークステーションが同年10月より日本でも販売開始となっていた。このたび“一般消費者もCPUとマザーボード単品として入手できるようになり、自作可能になった”というのが、来たる3月26日のトピックである。

 この発売にあわせるかたちで投入されるマザーボードが、Supermicroの「M12SWA-TF」というわけだ。M12SWA-TFを使えば、ユーザーはRyzen Threadripper PROがもたらすハイエンドプラットフォームの性能を享受できる。詳しく見ていこう。

圧巻のI/Oで最強の自由度を備えるM12SWA-TF

 M12SWA-TFは、Ryzen Threadripper PROが持つ128レーンのPCI Expressを存分に活かすために、Exteneded ATXフォームファクタを採用。余裕あるレイアウトで、6つのPCI Express 4.0 x16に加え、M.2を4基正々堂々と正面に備えている。これらのインターフェイスはすべてCPUのPCI Expressに直結されていて、112レーン使われているわけだ。

M12SWA-TF

 残るレーンのうち、4レーンはMarvellの10Gigabit Ethernet「AQC113C」、4レーンはASMediaのUSB 3.2コントローラ「ASM3242」、1レーンはIntelのI210-AT、1レーンはASpeedのBMC「AST2600」で利用。つまり、CPU直結のPCI Expressのほとんどが活かされている。加えて、スイッチなどを介していないため、排他関係や、デバイス増によるレーン削減は一切ない。まったく妥協のない実装だ。

圧巻の6基のPCI Express 4.0 x16スロット。全スロット一切の排他関係がなく、つねにフルレーンで動作
これに加えて2260/2280/22110対応のM.2スロットも4基搭載(写真は下部の3基)。こちらも排他関係が一切ない
ASpeed最新のBMC(Baseboard Management Controller)「AST2600」。Cortex A7×2コアを内蔵し、ボード全体の状態をつねに把握。IPMI管理のさいに使われる
ASMediaの「ASM3242」によるUSB 3.2(Gen2x2)のType-Cポートも1基備える。なお、このUSB Type-Cともう1基のUSB 3.1ポートを除き、背面はすべてリドライバによって信号が強化されている
IntelのI210-ATを搭載。IPMI管理のさいもこれと共有する。一方、10Gigabit EthernetコントローラはMarvellの「AQC113C」という最新モデル
RealtekのUSB 2.0オーディオチップALC4050HとI2SオーディオコーデックALC1220の組み合わせ
NuvotonのSuper I/Oチップ「NCT6796D-E」

 2基のU.2および4基のSATA 6Gbps、背面のUSB 3.0ポートのうち4基、そしてUSB 2.0を介したRealtekのオーディオコントローラ「ALC4050H」とI2Sのオーディオコーデック「ALC1220」のみが、PCHに接続されている(余談だがALC4050Hの搭載はRyzen Threadripperのマザーボードでもメジャーな構成のようだ)。

U.2×2とSATA 6Gbps×4も搭載。こちらはPCHに接続している
背面インターフェイスも、USB 3.1(10Gbps)×5、USB 3.2(Gen2x2、20Gbps、Type-C)、USB 3.0×2、Gigabit Ethernet、10Gigabit Ethernet、シリアルポート、ミニD-Sub15ピン、音声入出力と非常に豊富

 PCI Expressのスロットは上3基と下3基のあいだが、1スロット分を開けたかたちで実装されている。これなら、GeForce RTX 3090のような3スロット占有ビデオカードでも余裕を持って2本搭載でき、2スロット占有カードなら4本、1スロット占有カードなら6本搭載できる。用途に合わせて柔軟に拡張カードを実装できるのは、本製品における最大のポイントだ。

 たとえば、いっそGPUですべてのスロットを埋めて演算処理に振る構成にしまってもいいし、上にGeForce RTX 3090を1枚搭載し、下にPCI Express x4×4のM.2 SSDをx16に変換するカードを3基搭載するといったストレージ速度重視構成にもできる。当然、SASカードや10GbE超のNICカードといった、普段のPCでは搭載が難しいカードを増設するのも自由。そして何よりこれらの性能を余すことなく引き出せることが魅力だ。

 メモリスロットは8本。先述のとおりRyzen Threadripper PROは8チャネルメモリとなっているので、これらすべてを埋めてはじめて最大限に性能を引き出せる。メモリはサーバーで一般的なRegistered DIMM(ECCも対応、RDIMM)に加え、ワークステーションで一般的なECC Unbuffered DIMM(ECC UDIMM)、PCで一般的なUnbuffered DIMM(UDIMM)のすべてをサポートしている。

 つまり、ユーザーは自作するさいに、とにかくメモリ容量が必要なら、Registered DIMMを使えば最大2TBまで拡張できる。一方でそこまで容量を必要としない場合は、信頼性が必要ならECCつき、そうでないならECCなしを選べばいい。拡張カード同様、こちらも自由度や柔軟性がかなり高い。これもRyzen Threadripper PROのメリットである。

メモリは8本搭載可能。メモリスロット間隔は狭いので、厚みのあるメモリがクリアランスが厳しいかもしれない

シンプルなボードレイアウト

 豊富なインターフェイス周りとは対象的に、ボード自体の実装部品もシンプルだ。PCI Expressスイッチが一切ないため当然といえば当然だが、余計なものがないだけにエネルギー効率も良いと断言していいだろう。

 特徴なのはCPU電源周りで、アルミ電解コンデンサは一切使われておらず、すべてタンタルコンデンサで背面実装。VRMは12+3フェーズだが、狭幅のDrMOSチップ(MP86966)とコイルを採用しており、驚くほどコンパクトにまとまっている。

 電源周りはMPS製のチップで固められている。コントローラの「MP2852」とDrMOSである「MP86966」についてのデータシートはないのだが、前者はAMD SVI2に準拠した「MP2853」の姉妹品であると推測され、後者XilinxのFPGA向けのリファレンスデザインで採用されている。また、メモリ周りの電源もMPS製で、サイトにスペックシートが載っていない特別な部品が多い。

 CPU周りのDrMOSについているヒートシンクも小型。一見頼りないのだが、負荷時でも大きな熱が発生するようなことはなく、かなり高効率であることが想像される。エアフローが確保されているような一般的なPCケースで問題になることはないだろう。

電源回路はほぼMPS製のICで固められている
CPUのVRM電源のコンデンサは裏面に実装されている
マザーボード裏面

 チップセットのヒートシンクが小型で、小さなファンがついている。常時フル回転のため、そこそこ甲高い音を発生させている。ただ、先述のとおりデバイスのほとんどがCPU直結であることを考えると、チップセットが発熱する機会はそう多くなさそうだ。気になるなら、標準ファンのコネクタを抜いてしまい、代わりに大口径ファンを近くに置くことで十分対処できると思われる(もちろん保証外だが)。

 基板はかなり厚みがあり、一般コンシューマ向けのものとは一線を画し、さすがはワークステーション向けといった雰囲気。また、配線もなるべく最短になるよう工夫されており、このあたりもSupermicroならではのDNAが見え隠れする。実装はシンプルだが、手にするとコンシューマ向けハイエンドとはまた違う優越感に浸ることができる。

Supermicroのマザーといえば最短配線なのだが、本機でもそこそこ楽しめる
あちらこちらにファンコネクタが散りばめられており、冷却ファンの接続に困ることはまずない
チップセットには小型のファンがついており、そこそこの騒音を発する。気になるユーザーはまずここをカスタマイズするだろう
基板は厚みがあり、ヒートシンクをそれほど備えていないのに重量がある
至るところにジャンパーがあり、オーディオやUSB、LAN機能をハードウェア的にオン/オフできる
付属品はシンプル

組むさいの注意点と、一新したIPMI

 M12SWA-TFは一般のコンシューマ向けマザーとは異なり、組むさいにいくつか注意点がある。1つはメモリスロットの間隔がかなり狭いこと。一応、G.SKILLの「Trident Z RGB」のようなある程度厚みがあるヒートシンク付きのメモリでも問題なく装着できるのだが、クリアランスがかなりシビアだ。

 この点、Ryzen Threadripperのマザーボードでも共通だと思うが、とくにCPUに近いスロットはCPUソケットにかなり近接している。このため、高さが低いメモリや、ヒートスプレッダ非装着メモリのほうが無難だろう(もちろんRDIMMのほとんどはそうだと思うが)。加えて、オーバークロック向けのXMPには非対応なので、JEDECに準拠したDDR4-3200プロファイルがSPDに書き込まれているメモリを利用したほうがいい。今回は台湾v-color製の3,200MHz対応品「TC48G32S822K」を4セット利用した。

 もう1つ注意したいのは、本製品はリモートアクセスで使われることが前提となっているため、内蔵のAST2600によるビデオ出力がデフォルトでオンになっていて、それがプライマリとして選択されている点。このため、ビデオカードを装着しても画面がそこから出力されず、背面のミニD-Sub15ピンからの出力となってしまうのだ。

 これを回避するにはBIOS上でプライマリの画面出力を「Offboard」に選択すればいいのだが、そもそも標準ではBIOS画面もミニD-Sub15ピンから出力しているので、ミニD-Sub15ピン接続のディスプレイがないと設定ができない、ということになる。そこで出番となるのがリモート管理のIPMIだ。

 本製品は2系統の有線LANポートを備えており、このうち1基はIntel I210-ATが担当していて、IPMIによる管理が可能な兼用ポートとなっている。これをネットワークに接続すれば、一切のユーティリティを用いることなく、WebブラウザからIPアドレスを叩くだけで、さまざまな管理が可能なのだ(余談だが、IPアドレスはDHCPから配られるので、ルーターの設定画面を参照するか、同社が提供しているIPMIViewのアプリで検索する)。このなかにはKVMの機能も含まれていて、起動直後の画面から操作可能。これを利用して、BIOSに入って設定を変更すれば良いわけだ。

IPアドレスを叩けば、本機が電源オフの状態でもIPMIに接続できる(電源ケーブルは接続しておく必要がある。また、Chromeでは安全ではないとして警告されるが、問題はない)
IPMIでさまざまな状況を監視できる
BIOSの更新もIPMIから適用可能
リモートコントロール機能で直接操作できる
IPMIではリモートからBIOSに入れる
プライマリのディスプレイ出力をOnboardからOffboardに変更

 筆者としては久々にIPMI機能にお世話になったのだが、Webブラウザから直接アクセスできてしまう進化には、さすがに驚いた。別途ユーティリティなどを利用しなくても、スマートフォンのブラウザからアクセスできるのは、さすがに便利すぎる。BIOSのデフォルトビデオ出力設定をOnboardのままにしておき、Windows 10のインストーラなどが入ったUSBメモリを挿しておけば、OSのインストールの作業なども、スマートフォンなど適当なデバイスで行なえるからだ。

 ちなみにBIOSはテキストベースの質素なもので、目をみはるほど派手なものではないが、そもそもワークステーションではBIOSにお世話になるのは稀だろう。オーバークロックなどの設定は当然皆無だが、電圧固定や、CPUの機能のオン/オフは設定できる。

圧倒的な性能。アプリによっては性能を発揮できないが、工夫次第で解決可能

 最後に簡単に本製品とRyzen Threadripper PRO 3975WXの組み合わせによる性能を見ていきたい。用意したテスト環境は下記のとおり。比較用に、CPUをCore i9-10900K(PL2=250W、PL1=125W、Tau=56秒)、メモリ32GB(Tirdent Z RGB DDR4-3200)、マザーボードにC9Z490-PGW、SSDにPlextorのPX-512M5Pなどを搭載したほぼ同等の環境のスコアを参考として併記する。

  • CPU:Ryzen Threadripper PRO 3975WX
  • メモリ:v-color TC48G32S822K×4(DDR4-3200ネイティブ、8GB×8)
  • ストレージ:Crucial M4 256GB
  • ビデオカード:Colorful iGame GeForce RTX 3090 Vulcan OC
  • CPUクーラー:ASUS Ryujin 360
  • 電源:ASUS ROG-THOR-1200P
  • 電源プラン:Ryzen Balanced

 まずはRyzenシリーズが得意とするCinebench R23だが、堂々と4万超えのスコアとなった。Cinebench R23では最低10分間負荷をかけ続け、その後にスコアを計測しているため、短時間のみブーストクロックになるCPUでは不利なのだが、そのテストでも4万の大台に乗り、メインストリームとは一線を画すパフォーマンスを示した。

 今回のテストでは、先述のとおりCore i9-10900Kの設定はPL1=125Wに制限しているため、10分負荷をかけ続けたあとのテスト数値は、当然この制限下のものとなっている。それと比べると、Ryzen Threadripper PRO 3975WXは2.24倍の消費電力で3.17倍の性能を叩き出しているわけで、電力効率は約42%も高い。やはり7nmプロセスのパワーは圧倒的だと思い知らされる。

 また、Single CoreのスコアもCore i9-10900Kに肉薄するスコアを示しており、マルチスレッドだけがRyzen Threadripper PROの取り柄ではないことがわかる。

Cinebench R23の結果

 SiSoftware SandraのCPUテストでもひじょうに優秀なスコアを記録し、強さを見せつけた。加えて、メモリ帯域幅のテストでも121GB/sという圧倒的な値を示し、以前レビューしたRyzen Threadripper 3970Xの約2倍の帯域を達成した。大量のメモリ転送が伴う処理や、1コアあたりのメモリ転送速度が重視されるようなアプリケーションでは、Ryzen Threadripperよりも高い性能を発揮できるのは容易に想像つく。

SiSoftware Sandra CPUテスト
SiSoftware Sandraメモリ帯域幅
SiSoftware Sandraメモリとキャッシュ

 PCMark 10は、メインストリームと大差なかった。当然、高速なCPUとGPUで、Digital Contents Creation項目は高い値を示しているが、CPUクロック重視の一般的なEssentialsやOffice Productivity項目はそこまで高い性能を発揮できるわけではない。とはいえ、ハイエンドPCとしても一線級の性能を持っていて、日常利用が十分可能な性能であることは、おわかりいただけると思う。

PCMark 10の結果

 一方で3DMarkは、Core i9-10900Kとはかなりの差があった。Ryzen Threadripper PROはゲーマー向けのCPUではないので、当たり前といえば当たり前である。しかし、極限までフレームレートにこだわらないのであれば、実用上困らない程度の性能でプレイできるというのは、念頭に置いておきたい。プロゲーマーのような職業ならともかく、ゲームプレイの動画を実況配信したり、撮ったゲームプレイ動画を後からいろいろ編集してから動画共有サイトでアップロードするといったユーザーにとって、ゲームにおける絶対的なフレームレートより、圧倒的なCPU処理能力の余裕のほうが魅力的に映えると思う。

 ちなみにTime SpyのテストだけGraphicsのスコアが振るわなかった。しかし、これにはちゃんとした理由がある。Ryzen 3000シリーズのZen 2アーキテクチャでは、CPUの最小単位である「CCX」(Core Complex)が4コア/16MB L3キャッシュであり、CCXをまたぐさいの処理にボトルネックが発生。2つのCCXが1つのダイになっているCCD(CPU Complex Die)をまたぐ処理では、さらに遅延が発生するからだ。Time Spyのテストスイートにおいて、CCXもCCDも関係なく処理を分散させていて、これによって遅延がかさむ。加えて、軽い処理を負荷分散させてしまうと、各コアが完全にブーストクロックに達する前に処理を終えてしまうのだ。

 これを回避するためには、プログラムが処理するCPUアフィニティを固定してしまえばよい。具体的には、タスクマネージャーなどで動作中のプロセスを選択し、右クリック→関係の設定で、処理するCPUを1-7というように限定すれば良い(Ryzen Threadripper PROは1つのコアで2つの仮想スレッドが動作しているので、CPUが2つあるように見える)。

 ただ、3DMarkはフルスクリーンで実行されるうえに、ショートカットではなく3DMark本体からベンチマークの実行ファイルが呼び出されて実行されるので、ベンチマーク中に依存関係の変更を行なうことができない。そこで今回は、フリーソフトの「LimitCPU」を用いて、実行ファイルの起動を監視し、自動的にCPUアフィニティを設定する機能を用いて、3DMarkのベンチマーク実行ファイルをCPU 0-7(4コア8スレッド1CCX)、およびCPU 0-15(8コア16スレッド1CCD)に限定し、追加のベンチマークを行なっている。

LimitCPUというフリーソフトで、指定したプログラムが実行されたことを監視し、自動でCPUアフィニティを設定した
3DMarkの結果

 結果からわかるとおり、CPUスコアは半減したが、Graphics Scoreは2倍となった。現存のほとんどのゲームは4コア/8スレッドまでの最適化となっているので、この手法は有効だと言っていいだろう。もしRyzen Threadripper PROで思うようにゲーム性能が出ないと感じた場合、ぜひ同じ手法で試してみてもらいたい。

 ちなみに以前、筆者はHPCシステムズのEPYCマシンでいろいろなベンチマークを実施したことがあるのだが、やはりサーバー向けCPUということもあり、一般用途においてはあっと驚くような性能が出ておらず(GPU非搭載という環境のせいもあるのだが)、部屋に置いて毎日利用するマシンのCPUとしては不適切だと感じた。

 一方、Ryzen Threadripper PRO+M12SWA-TFの組み合わせは、少なくとも一般個人が多く利用するであろうシングルスレッド処理でも十分な性能が得られているうえに、CPU全体のマルチコア性能としても圧倒的な性能を発揮。それでいてモンスターとも呼べる豊富なI/Oを備えているのだから、個人が手にして使える最高の環境だと断言していい。

 これらのメインのベンチマークとは別に、PCI Expressや10Gigabit Ethernetの性能を計測するいくつか追加のテストもしてみたが、いずれも期待どおりの性能が得られた。CPUの絶対性能だけでなく、I/O周りの性能の高さも、Ryzen Threadripper PROとM12SWA-TFならではの特権だ。

10GbEを備えたTerraMasterのNAS「F2-422」と接続し、SMBファイル共有でドライブとして割当て、CrystalDiskMarkを実行してみた。当然だが、十分な性能が得られている
HPEのSAS 6Gbps対応アダプタ「Smart Array P420」(1GBキャッシュ搭載)と、15,000rpmのHDDをつなげてみた。P420のキャッシュ内に収まる容量なら、このとおり最新SSD顔負けの性能を叩き出す
Samsungの最高峰のPCI Express 4.0 SSD「980 PRO」をテストしてみた(プロファイルはNVMe SSD)。ご覧のとおりほぼスペックどおりの性能を叩き出していて、性能を余すことなくしゃぶれる

 今回のテスト環境では、アイドル時で約160W、Cinebench R23負荷時で約410Wの電力を消費していた(ROG THOR備え付けの電力モニターによる)。アイドル時が高止まりしている原因は、今回のテスト環境ではRGBケースファンを3基追加していて、水冷やビデオカードにモニタリング用ディスプレイがついているためだろう。実際の消費電力はRyzen Threadripper環境と大差ない。むしろ負荷時で以前テストしたRyzen Threadripper 3970Xとあまり変わらないということは、M12SWA-TFの電源周りの設計の良さかもしれない。

 CPU温度は負荷時82℃前後で推移し、これはRyzen Threadripper 3970Xと同じような傾向。最新の7nmプロセスは消費電力が高くても発熱が意外に少ない印象で、電力効率はかなりいい。

待望のSupermicro+AMDハイエンドプラットフォーム

 Supermicroのサイトを見ればわかるとおり、同社はこれまでワークステーション向けマザーボードはIntelが中心だった。今回のM12SWA-TFは、SupermicroとしてははじめてAMDワークステーション向けでデビューを飾るもので、なおかつ一般ユーザーも手できる身近な製品だ。

 本機はAMDデビュー作あるにもかかわらず、試用中も不安な挙動を示すことは一切なく、圧倒的なベンチマーク数値をひたすら見せつけられた。飾りっ気のないシンプルさ、そして安定性を求めているユーザーにとって、Supermicro+AMDという選択肢が登場したのは、まさに待望そのものだ。何を隠そう、筆者もかねてよりSupermicroからRyzen対応マザーボードの登場を熱望していた一人である。

 M12SWA-TFは、まさにユーザーの熱意に応え、満を持して登場した製品。高性能ワークステーションが欲しいプロユーザーはもとより、「われこそは最高のPCを自作したい」というエンスージアストに、胸を張っておすすめできる1枚だ。

2017年のCOMPUTEXでSupermicroに紹介されたEPYC搭載サーバー「AS-1123US-TR10RT」。このときから筆者は個人向けSupermicro+AMDマザーボードの登場に期待していた