レビュー

24コアの「Ryzen Threadripper 2970WX」と12コアの「2920X」を試す

~新たに実装されたDynamic Local Modeの効果も確かめる

24コア/48スレッドCPUのRyzen Threadripper 2970WX

 発表済みの第2世代Ryzen Threadripperの4モデルのうち、未発売となっていた「Ryzen Threadripper 2970WX」と「Ryzen Threadripper 2920X」が10月30日に発売される。

 今回、発売に先立って両CPUをテストする機会が得られた。ベンチマークテストを用いて両CPUの実力を確認するとともに、CPUの発売に合わせて「Ryzen Master」に追加されるRyzen Threadripper WX向け新機能「Dynamic Local Mode」の効果も確認してみた。

24コアの2970WX、12コアの2920X

 第2世代Ryzen Threadripperは、Zen+アーキテクチャに基づいて12nmプロセスで製造されたハイエンドCPU。4つのダイで24コアと32コアを実現する「WXシリーズ」と、2ダイで12コアと16コアを実現する「Xシリーズ」の2系統の製品シリーズが存在している。

 今回テストするCPUのうち、24コア/48スレッドCPUの「Ryzen Threadripper 2970WX(以下2970WX)」はWXシリーズ、12コア/24スレッドCPUの「Ryzen Threadripper 2920X(以下2920X)」はXシリーズに属している。

 両CPUを含む第2世代Ryzen Threadripperのおもな仕様は以下のとおり。

【表1】第2世代Ryzen Threadripperのおもなスペック
モデルナンバー2990WX2970WX2950X2920X
製造プロセス12nm
CPUアーキテクチャZen+
コア数32241612
スレッド数64483224
ベースクロック3.0GHz3.0GHz3.5GHz3.5GHz
ブーストクロック4.2GHz4.2GHz4.4GHz4.3GHz
L2キャッシュ(合計)16 MB12 MB8 MB6 MB
L3キャッシュ(合計)64 MB32 MB
対応メモリDDR4-2933(4ch)
TDP250 W180 W
対応ソケットSocket TR4
価格(税別)214,800円159,800円107,800円79,800円
2970WXのCPU-Zの実行画面
12コア24スレッドCPUのRyzen Threadripper 2920X
2920XのCPU-Zの実行画面

Ryzen Threadripper WX向けの新機能「Dynamic Local Mode」

 10月30日のCPU発売に合わせて、AMD純正のユーティリティ「Ryzen Master」がバージョン1.5にアップデートされ、Ryzen Threadripper WX向けの新機能「Dynamic Local Mode」が追加される。

 Ryzen Threadripper WXが備える4基のCPUダイのうち、メモリに直接アクセスできるのは2基のみとなっており、残る2基のダイがメモリにアクセスするためには、ダイ間を接続するInfinity Fabricを経由しなければならなかった。

Ryzen Threadripper WXの構成。メモリと接続されているダイは2基のみで、残りのダイはInfinity Fabricを経由してメモリにアクセスする

 Ryzen Masterで新機能のDynamic Local Modeを有効にすると、バックグラウンドで動作する「AMD Dynamic Local Mode Service」が起動する。これは実行中のプロセスを監視し、メモリアクセスの多いアプリケーションに対して、メモリに直接アクセスできるCPUコアに処理を割り振るもので、これによりメモリレイテンシを低減する。

 Dynamic Local Modeによるメモリレイテンシの低減は、Ryzen Threadripper WXのゲームにおける性能を向上させるとされている。Ryzen Threadripper Xにも同様のメモリ動作モードとして「Local Mode」が用意されているが、モード切替にシステムの再起動が必要なLocal Modeに対し、Dynamic Local Modeは再起動なしでモードの切り替えが可能となっている。

 今回のテストでは、レビュアー向けに先行配布されていた「Ryzen Master 1.5」のベータ版を使い、2970WXでDynamic Local Modeの効果をテストする。なお、ベータ版のRyzen Master 1.5はWindowsの表示言語を日本語にしていると起動しなかったため、今回のテストでは表示言語を英語に変更している。

2970WXで起動したベータ版Ryzen Master 1.5。Additional Controlの項目に新機能「Dynamic Local Mode」が追加された。Dynamic Local Modeは標準でオンになっている
Dynamic Local Modeをオンにすると起動する「AMD Dynamic Local Mode Service」
バックグラウンドで動作中のAMD Dynamic Local Mode Service。Dynamic Local Modeをオンに設定すれば、以降はRyzen Masterを起動しなくても自動で起動する

テスト機材

 今回のテストでは、2970WXと2920Xの比較用CPUとして、メインストリーム向けの「Ryzen 7 2700X」を用意した。また、Ryzen Threadripperの2製品については、メモリ動作モードごとにテストを実行することで、メモリ動作モードが性能におよぼす影響を確認する。

 メモリ動作モードについては、全CPUコアでメモリ帯域を共有するのが「デフォルト(2970WX)」と「Distributed Mode(2920X)」、CPUに近いメモリにアクセスしてレイテンシを低減するのが「Dynamic Local Mode(2970WX)」と「Local Mode(2920X)」だ。

 Ryzen Threadripper用のマザーボードには、AMD X399チップセットを搭載する「ASUS ROG ZENITH EXTREME」を利用。CPUクーラーには同じくASUSのオールインワン水冷クーラー「ROG RYUJIN 240」を使用した。

AMD X399チップセット搭載マザーボード「ASUS ROG ZENITH EXTREME」
オールインワン水冷クーラー「ROG RYUJIN 240」。Ryzen Threadripperに付属するリテンションキットを用いることで、Socket TR4に取り付けることができる
【表2】テスト機材一覧
CPU2970WX2920XRyzen 7 2700X
マザーボードASUS ROG ZENITH EXTREME(UEFI: 1501)ASUS PRIME X470-PRO (UEFI: 4024)
メモリDDR4-2933 8GB×4(4ch、16-18-18-36、1.35V)DDR4-2933 8GB×2(2ch、16-18-18-36、1.35V)
GPUGeForce RTX 2080 Ti 11GB Founders Edition
システム用ストレージSamsung SSD 950 PRO(256GB SSD/M.2-PCIe 3.0 x4)
アプリケーション用ストレージSanDisk Ultra 3D SSD(1TB SSD/6Gbps SATA)
電源ANTEC HCP-1200(1,200W 80PLUS GOLD)
CPUクーラーASUS ROG RYUJIN 240
OSWindows 10 Pro 64bit(Ver 1803/Build 17134.345)
メモリ動作モード(帯域共有)デフォルトDistributed Mode
メモリ動作モード(レイテンシ優先)Dynamic Local ModeLocal Mode
グラフィックスドライバGeForce Game Ready Driver 416.34
電源プロファイル高パフォーマンス
室温約28℃
GeForce RTX 2080 Ti Founders Edition
GPU-Z実行画面
8コア16スレッドCPUの「Ryzen 7 2700X」
AMD X470チップセット搭載マザーボード「ASUS PRIME X470-PRO」

ベンチマーク結果

 ベンチマークテストの結果を確認していこう。今回実施したのは、「CINEBENCH R15(グラフ1)」、「HandBrake 1.1.2(グラフ2)」、「TMPGEnc Video Mastering Works 6(グラフ3)」、「PCMark 10(グラフ4)」、「SiSoftware Sandra(グラフ5~11)」、「3DMark(グラフ12~15)」、「VRMark(グラフ16~17)」、「ファイナルファンタジーXIV: 紅蓮のリベレーター ベンチマーク(グラフ18)」、「FINAL FANTASY XV WINDOWS EDITION ベンチマーク(グラフ19)」、「オーバーウォッチ(グラフ20)」、「ゴーストリコン ワイルドランズ(グラフ21)」、「アサシン クリード オデッセイ(グラフ22)」、「シャドウ オブ ザ トゥームレイダー(グラフ23)」。

 3DCGのレンダリング性能を測定するCINEBENCH R15では、1コア性能を測定するSingle Coreにおいて、2970Xが170~174、2920Xが176~178を記録。どちらもメモリレイテンシ重視のメモリ動作モードのほうがわずかに高いスコアを記録している。

 マルチスレッド性能の測定結果であるAll Coreでは、2970Xは4,368~4,375、2820Xは2,609~2,612を記録。Ryzen 7 2700Xとの性能差は、2920Xで約1.5倍、2970WXでは約2.4倍に達している。

【グラフ01】CINEBENCH R15

 HandBrake 1.1.2での動画エンコードでは、H.264形式へのエンコードで25~27秒を記録した2920Xが、28秒だった2970WXを上回っている。これは2970WXが持つ24コア/48スレッドをフル活用できていないためで、エンコード実行中の2970WXのCPU使用率は50%前後だった。

 H.265形式へのエンコードでは2970WXのCPU使用率が多少改善しており、全体ベストとなる50秒でエンコードを完了している。2920Xは59~63秒を記録しており、全CPUコアでメモリ帯域を共有するDistributed Modeのほうが高速な結果となっている。

【グラフ02】HandBrake v1.1.2

 TMPGEnc Video Mastering Works 6での動画エンコードでも、通常のエンコードでは2970WXのCPU使用率は50%を下回っており、H.264とH.265のどちらの形式でも、最速は2920XのDistributed Modeとなっている。

 興味深いのは、H.265形式への通常エンコードで、CPU使用率が50%を大きく超える2920Xではメモリ帯域を共有するDistributed Modeが高速な一方で、CPU使用率は50%を下回る2970WXではレイテンシ重視のDynamic Local Modeのほうが高速という、真逆の結果になっている点だ。

 一方、4本の動画を同時にエンコードするバッチエンコードでは、2970WXを含めてすべてのCPUがピーク時にCPU使用率が100%に達しており、24コア/48スレッドをフル活用した2970Xが2920Xを大きく引き離して全体ベストのタイムを記録している。

 バッチエンコードでは、2920Xと2970WXはどちらもメモリ帯域を共有する動作モードのほうが高速になっている。1つの処理に対してメモリに直結されたダイ以上のCPUコアを使える状況であれば、メモリ帯域を共有する動作モードのほうが有利なようだ。

【グラフ03】TMPGEnc Video Mastering Works 6(v6.2.9.36)
Dynamic Local Mode有効時のH.265バッチエンコード進捗画面。エンコードの進捗に偏りが生じている
Dynamic Local Modeを無効にした場合。すべてのCPUコアがメモリに平等にアクセスできるため、Dynamic Local Mode有効時ほど大きな偏りは生じていない

 PCMark 10のExtendedで全体ベストのスコアを記録したのはRyzen 7 2700Xで、以下2920X、2970WXの順で続いている。マルチコアよりシングルスレッド性能を問うテストが多く、メモリレイテンシも重要であることが、メインストリーム向けCPUがトップに立った理由の1つだ。

【グラフ04】PCMark 10 Extended v1.1.1739

 CPUの演算性能測定するSandraのProcessor Arithmeticでは、コア数で勝る2970WXが2920Xに1.7倍以上、Ryzen 7 2700Xには2.6倍以上の差をつけて圧倒している。ここではメモリ動作モードの違いはスコアに現われていない。

 Processor Multi-Mediaでも、ほかのCPUにProcessor Arithmeticと同程度の差をつけて2970WXが突出したスコアを記録している。ここでも、メモリ動作モードの違いによるスコア差は小さいものにとどまっている。

 暗号処理性能を測るProcessor Cryptographyでは、メモリ帯域が反映されやすい「Encryption/Decryption Bandwidth」において、レイテンシ重視のLocal Modeに設定した2920Xがトップに立っている。2970WXはメモリ動作モードを問わず26.3GB/s前後となっていた。「Hasing Bandwidth」では、コア数のアドバンテージを活かして2970WXがトップに立っており、2920Xに約1.7倍、Ryzen 7 2700Xには約2.6倍の差をつけている。

【グラフ05】SiSoftware Sandra v28.28 「Processor Arithmetic」
【グラフ06】SiSoftware Sandra v28.28 「Processor Multi-Media」
【グラフ07】SiSoftware Sandra v28.28 「Processor Cryptography」

 メモリ帯域を測る「Memory Bandwidth」の結果は、約71GB/sを記録した2920XのLocal Modeがトップで、約63GB/sの2920X Distributed Modeが2番手、3番手は60GB/s前後を記録した2970WXとなっている。

 2920Xの結果から、メモリ帯域自体は各ダイに直結されたメモリにのみアクセスするLocal Modeのほうが高速である一方、全CPUコアからメモリにアクセスするこの状況において、処理を行なうスレッドの割り振ることでメモリアクセスを最適化する2970WXのDynamic Local Modeは大きな効果を発揮しなかったようだ。

【グラフ08】SiSoftware Sandra v28.28 「Memory Bandwidth」

 「Cache Bandwidth」では、コア数の多い2970WXがもっとも高速なのは想定どおりだが、メモリ動作モードの違いによる差がついていない2920Xに対し、2970WXはメモリ動作モードによって異なるグラフ形状を形成している。

 メモリアクセスの多寡に応じて処理を割り振るというDynamic Local Modeの挙動がキャッシュ帯域のテストにも影響をおよぼしていることがわかる結果で、どちらがいいのかはテストサイズによって異なるものの、L3キャッシュ領域をテストする64MBでは、デフォルトが Distributed Modeを1.6倍以上上回っている。

【グラフ09】SiSoftware Sandra v28.28「Cache Bandwidth」

 キャッシュとメモリのレイテンシを測定する「Cache & Memory Latency」では、2920XのLocal Modeが8MB以上のテストサイズにおいて、Distributed Modeの72%程度にまでレイテンシを低減しており、Ryzen 7 2700Xと同程度のメモリレイテンシとなっている。

 2970WXのDynamic Local Modeは2920XのLocal Modeほどではないものの、16MB以上のテストサイズではデフォルトの78%程度までレイテンシを低減している。

【グラフ10】SiSoftware Sandra v28.28 「Cache & Memory Latency(nsec)」
【グラフ11】SiSoftware Sandra v28.28 「Cache & Memory Latency(Clock)」

 3DMarkでは、「Time Spy」、「Fire Strike」、「Sky Diver」、「Night Raid」の4つのテストを実行した。

 2970WXは、Dynamic Local Modeの利用でスコアを大きく伸ばしたSky Diverの結果を除いて2920Xを明確に下回り、2920XもベストなスコアでRyzen 7 2700Xをやや上回る程度で、Fire StrikeではRyzen 7 2700Xが全体ベストのスコアを記録している。

 メモリ動作モードの違いはテストによって明暗が分かれており、DirectX 11の軽負荷テストであるSky DiverではLocal Mode系が有利な一方、DirectX 12テストのTime SpyとNight Raidではメモリ帯域を共有する動作モードのほうが高いスコアを記録している。

【グラフ12】3DMark v2.6.6174「Time Spy」
【グラフ13】3DMark v2.6.6174「Fire Strike」
【グラフ14】3DMark v2.6.6174「Sky Diver」
【グラフ15】3DMark v2.6.6174「Night Raid」

 VRMarkのOrange Roomでは、2970WXと2920XのDistributed Modeが208fps前後でほぼ横並びとなる一方、2920XのLocal Modeは約228fpsにまでフレームレートを伸ばし、Ryzen 7 2700Xを上回る全体ベストの結果を記録した。

 DirectX 12テストのCyan Roomでも、2920XはLocal Modeの利用で約3%フレームレートが向上しているものの、約244fpsを記録したRyzen 7 2700X比で85%程度となっている。2970WXもDynamic Local Modeに利用で約15%フレームレートが向上してはいるものの、平均フレームレートは約111fpsであり、Ryzen 7 2700Xの半分以下という奮わない結果だった。

 もっとも描画負荷の高いBlue Roomでは、CPUや動作モードの違いに関わらず、97fps前後のフレームレートで頭打ちだった。

【グラフ16】VRMark v1.3.2020「スコア」
【グラフ17】VRMark v1.3.2020「平均フレームレート」

 実際のゲームをベースにしたベンチマークテストの結果をみてみると、2970WXはどのタイトルにおいてもDynamic Local Modeの利用で性能が改善しており、とくにGPU負荷が低く高フレームレートになりがちなフルHD解像度で、Dynamic Local Modeを利用した場合のアドバンテージが大きくなっている。

 2920XのLocal Modeの効果は2970WXのDynamic Local Modeほど顕著なものではなく、タイトルによってDistributed Modeと優劣が分かれる結果となった。

 もっとも、フレームレート自体は2920Xがほとんどのタイトルで2970WXと同等か上回る結果を残しており、2970WXはDynamic Local Modeを利用することで、2920XやRyzen 7 2700Xから大きく劣る性能を改善しているという格好だ。

 アサシン クリード オデッセイのフルHD解像度など、2970WXのDynamic Local Modeが全体ベストの結果を出しているテストが存在しないわけではないが、全体的にはRyzen 7 2700Xが2970WXを上回るテストのほうが多い。

【グラフ18】ファイナルファンタジーXIV: 紅蓮のリベレーター ベンチマーク
【グラフ19】FINAL FANTASY XV WINDOWS EDITION ベンチマーク
【グラフ20】オーバーウォッチ v1.29.0.1
【グラフ21】ゴーストリコン ワイルドランズ v3246313
【グラフ22】アサシン クリード オデッセイ v1.0.5
【グラフ23】 シャドウ オブ ザ トゥームレイダー(v1.0/build 235.5)

 ベンチマーク中のピーク消費電力と、アイドル時消費電力を測定した結果が以下のグラフだ。

 アイドル時の消費電力に関しては、103Wを記録した2970WXがもっとも高く、2920Xはそこから23W低い80Wを記録してる。Ryzen 7 2700Xは2920Xより21W低い59Wを記録しているが、2970WXや2920Xとはマザーボードや搭載メモリ枚数が異なるため、CPU以外の要因による消費電力差も影響している。

 ベンチマーク中のピーク消費電力では、CINEBENCH R15のAll CoreやTMPGEnc Video Mastering Works 6のバッチエンコードなど、CPU使用率が100%に達する場面で2970WXが400Wを超える消費電力を記録し、282~344Wを記録した2920Xより100W以上高い消費電力となっている。

 ただ、CPU系のテストでこれほど高い消費電力を記録していながら、GPUの消費電力も加わる3DMarkで測定したピーク消費電力は、2970WXでも500Wを超えていない。ゲーミングシーンでは2970WXが備えるCPUコアをフル活用していないということが消費電力からもうかがえる結果だ。

【グラフ24】システムの消費電力

 アイドル時とベンチマーク実行中の消費電力を測定した結果が以下のグラフだ。測定時、2970WXはデフォルト、2920XはDistributed Modeでベンチマークを実行している。

 Ryzen Threadripperは、CPUの温度センサーの測定値(Tdie)に27℃のオフセットを加えた値をファンコントロール用温度(Tctl)としており、この上限値が95℃とされている。これを踏まえて各CPUの測定結果を見てみると、両CPUともTMPGEnc Video Mastering Works 6のバッチエンコード中にこの温度上限に達していることが見て取れる。

【グラフ25】「Ryzen Threadripper 2970WX」のCPUコア温度(HWiNFO v5.90)
【グラフ26】「Ryzen Threadripper 2920X」のCPUコア温度(HWiNFO v5.90)

 多くのCPUでは、CPU温度が上限に達すればサーマルスロットリングによる保護が働いて動作クロックや電圧を引き下げるものだが、Tctlが95℃付近に達している状態であっても、定格3.0GHzの2970WXは3.5GHz前後、定格3.5GHzの2920Xは3.8GHz前後で動作しており、サーマルスロットリングが作動するどころかブースト状態のまま動作している。

 この結果は、第2世代Ryzen Threadripperのブースト動作が上限温度に対してかなりアグレッシブな制御を行なっていることを示唆するものだ。実際、バッチエンコードに要した時間を比較してみたところ、わずかながらファンスピード50%時のほうがやや遅い結果となっていた。

【グラフ27】ファンスピードの違いによるエンコード時間の差

 ASUS RYUJIN 240は、ファンスピード50%でも2970WXや2920Xのブースト動作をつねに維持できており、冷却性能が不足しているわけではない。

 Tctl温度が上限に達しているのは、第2世代Ryzen Threadripperのブースト動作がCPU温度の許すかぎり高いクロックを維持しようとした結果ということだ。高性能なCPUクーラーを使う甲斐のあるCPUであると言えよう。

Dynamic Local Modeで汎用性が高まる2970WX。9万円を切る2920Xはコスパが魅力

 24コア/48スレッドCPUの2970WXは、Ryzen 7 2700Xの2.6倍以上のマルチスレッド性能を備えており、Dynamic Local Modeを使うことで、ゲームなどCPUコアをフル活用しない場面での性能も改善する。CGレンダリングや動画エンコードでCPUパワーを求めるユーザー向けのCPUであることには変わりないが、Dynamic Local Modeによる汎用性の向上は個人ユーザーにとってうれしい改善だ。

 2920XはRyzen 7 2700X比で約1.7倍のマルチスレッド性能を持ち、ゲームでの性能もDynamic Local Modeを使用したWXシリーズよりクセが少なく使いやすい。これで国内価格は税別79,800円であり、消費税を入れても9万円以下で購入できる。10コア以上のCPUを求めるユーザーにとって、コストパフォーマンスに優れた選択肢となるだろう。