特集

ビデオカードはPCI Express x16接続が必須かどうかを検証してみた

 昨今、ライザーカードや外付けGPUボックスが登場し、ビデオカードとPCの接続方法は多様性を増しているが、これらのデバイスを経由するとビデオカードが利用できるPCI Expressのレーン数はx16レーンよりも少なくなっていることが多い。

 一体、PCI Express 3.0は何レーンあれば、ビデオカードの性能を十分に発揮できるのだろうか。

 この疑問を確認すべく、今回はPCI Expressの接続レーン数の違いによるゲームでの性能差を確認してみた。また、Thunderbolt 3を用いた外付けGPUボックスを利用した場合のテストも行なった。

PCI Express x1/x4/x8/x16レーンとThunderbolt 3接続のGPUボックスをテスト

 PCI Expressレーン数とゲームにおけるビデオカードの性能の関係をチェックするにあたって、今回はマザーボードが備える拡張スロットとライザーカードを利用する。

 ASUSの「PRIME X299-DELUXE」にCore i9を搭載した場合、PCI Express 3.0 x4/x8/x16でそれぞれ利用できるx16形状のスロットが揃うことになる。これにマイニング用途で人気の「PCI Express x1→x16」仕様のライザーカードを用いたテストを追加することで、PCI Express 3.0 x1/x4/x8/x16の4パターンでのテストを可能とした。

ASUS PRIME X299-DELUXE。4本のPCI Express x16スロットを備えており、各スロットのレーン数は搭載CPUによって変化する
Core i9を搭載した場合、PCI Express x16形状の拡張スロットはこのようなレーン数で利用できる
「PCI Express x1→x16」仕様のライザーカード。ビデオカードを延長して配置できるため、マイニング用途で人気の製品だ
ライザーカード使用時のGPU-Z実行結果。インターフェイスがPCI Express 3.0 x1になっていることが確認できる

 さらに今回は、Thunderbolt 3(40Gbps)接続の外付けGPUボックス「PowerColor DEVIL BOX」を使った場合の性能についてもチェックする。

 外付けGPUボックス利用時は、ボックス内に搭載したビデオカードの画面出力端子から直接ディスプレイに接続している。また、外付けGPUボックスとの接続確立までの画面表示用として、マザーボード側にもビデオカードを搭載しているが、外付けGPUボックス接続完了後は画面出力を停止している。

 Thunderbolt 3での接続にあたっては、ASUS PRIME X299-DELUXE付属のThunderbolt 3拡張カードのファームウェアが外付けGPUボックスをサポートしていなかったため、ASRock製のThunderbolt 3拡張カードである「Thunderbolt 3 AIC」を利用した。本来ASRock製マザーボード向けの製品だが、今回利用したASUS PRIME X299-DELUXEも同カードの利用に必要なTB-Headerを基板上に備えていたため利用できた。ただし、動作が保証された組みあわせではない点に注意してほしい。

PowerColor DEVIL BOX。40GbpsのThunderbolt 3を用いた外付けGPUボックスだ
PowerColor DEVIL BOX搭載時のGPU-Z実行結果。インターフェイスがPCI Express 3.0 x4になっている
ASRockのThunderbolt 3拡張カード「Thunderbolt 3 AIC」
40GbpsのThunderbolt 3をサポートしている場合でも、ファームウェアが外付けGPUボックスをサポートしていない場合があるので注意が必要だ

 今回テストするPCI Express 3.0とThunderbolt 3の規格上の帯域幅は以下のとおり。

【表1】各インターフェイスの転送レートと帯域
インターフェイス転送レート帯域
PCI Express 3.0 x18Gbps1GB/s
PCI Express 3.0 x432Gbps4GB/s
PCI Express 3.0 x864Gbps8GB/s
PCI Express 3.0 x16128Gbps16GB/s
Thunderbolt 340Gbps5GB/s

テスト機材 ~ 3種のGPUを搭載したビデオカードを用意

 今回のテストでは、「GeForce GTX 1080 Ti」、「GeForce GTX 1050」、「Radeon RX 580」、以上3種のGPUを搭載したビデオカードをそれぞれ用意した。テスト実行中は各ビデオカードともファンの回転数を引き上げて、GPU温度上昇による性能低下を回避している。

GeForce GTX 1080 TiのリファレンスモデルであるFounders Edition
GeForce GTX 1080 TiのGPU-Z実行画面
GeForce GTX 1050搭載の「ASUS PH-GTX1050-2G」
GeForce GTX 1050のGPU-Z実行画面
Radeon RX 580搭載の「PowerColor AXRX 580 8GBD5-3DHDV2/OC」
Radeon RX 580のGPU-Z実行画面

 そのほか、検証に用いた機材は以下のとおり。

【表2】テスト機材一覧
GPUGeForce GTX 1080 TiGeForce GTX 1050Radeon RX 580
CPUCore i9-7900X
マザーボードASUS PRIME X299-DELUXE (UEFI: 0802)
メモリDDR4-2666 4GB×4 (4ch、19-19-19-43、1.2V)
システム用ストレージPlextor PX-128M8PeG (128GB SSD/M.2-PCIe 3.0 x4)
アプリケーション用ストレージOCZ VTR180-25SAT3-480G (480GB SSD/SATA 6Gbps)
電源玄人志向 KRPW-TI700W/94+ (700W 80PLUS Titanium)
グラフィックスドライバGEFORCE GAME READY DRIVER 385.41Radeon Software Crimson ReLive Edition 17.7.2 (22.19.662.4)
OSWindows 10 Pro 64bit (Ver 1703 / build 15063.608)
外付けGPUボックスPowerColor DEVIL BOX
Thunderbolt 3 カードASRock Thunderbolt 3 AIC
電源設定高パフォーマンス

テスト結果 ~ 実行するゲーム次第では顕著な性能低下も

 まずは定番ベンチマークソフト「3DMark」から、DirectX 12テストである「Time Spy」を実行した。

 各GPUのスコアを見てみると、PCIe 3.0 x1とThunderbolt 3でスコアの低下が見られるものの、PCIe 3.0 x16を基準とした場合のスコア低下は最大でも1割弱と、それほど極端な性能低下があるわけではない。GeForce GTX 1050クラスのGPUであればPCIe 3.0 x1接続でも十分と思える程度の結果だ。

3DMark「Time Spy」:ベンチマークスコア
3DMark「Time Spy」:「PCIe 3.0x 16」の結果を100%とした場合

 続いて実行したのはアクションシューティングゲームの「オーバーウォッチ」。画面解像度は1,920×1,080ドットで、グラフィック設定は「エピック」を選択し、フレームレートを測定した。

 最大でも1割程度の差しかついていなかった3DMarkの結果とは打って変わって、PCIe 3.0 x1とThunderbolt 3接続での性能低下が顕著なものとなっている。とくに、ハイエンドGPUであるGeForce GTX 1080 TiのフレームレートはPCIe 3.0 x16時の7割程度にまで低下している。

 また、印象的なのはThunderbolt 3接続での性能だ。規格上はPCIe 3.0 x4以上の帯域を持つThunderbolt 3だが、実際の性能はPCIe 3.0 x1と同等かそれ以下にまで低下している。高速なThunderbolt 3を用いた外付けGPUボックスであっても、必ずしもPCIe 3.0 x4に直結したさいに相当する性能を得られるわけではないということだ。

オーバーウォッチ (v1.15.0.2):フレームレート測定結果
オーバーウォッチ (v1.15.0.2):「PCIe 3.0x 16」の結果を100%とした場合

 最後に検証するのはオープンワールドのシューティングゲーム「ゴーストリコン ワイルドランズ」。画面解像度1,920×1,080ドット、グラフィックプリセットは「ウルトラ」を選択し、ベンチマークモードを実行した。

 オーバーウォッチでも顕著だったPCIe 3.0 x1とThunderbolt 3接続での性能低下はより顕著なものとなっており、GeForce GTX 1080 Tiでは6割前後までフレームレートが低下した。また、同GPUではPCIe 3.0 x8でも約95%、PCIe 3.0 x4では約89%までフレームレートが低下している。

 ゴーストリコンではほかのテストでは比較的性能の低下が緩やかだったGeForce GTX 1050がもっとも極端な性能低下を起こしている。これは2GBのVRAMしか持たないGeForce GTX 1050で、約4.7GBのVRAMを要求するテストを実行した結果、VRAMからあふれてメインメモリに置かれたデータとのアクセスに帯域を必要としているためだ。

 ビデオカードのVRAM容量を超過するような設定では、プレイに耐えうるフレームレートを確保できないため、現実的にGeForce GTX 1050で発生したような性能低下に遭遇することは考えにくい。ただ、Radeon RX Vegaが採用したHBCCのようにメインメモリをGPUが活用しようとすれば、ビデオカードを接続したインターフェイスの帯域が重要になるであろうことが想像できる結果ではある。

ゴーストリコン ワイルドランズ (v2415526):ベンチマーク結果 (平均フレームレート)
ゴーストリコン ワイルドランズ (v2415526):「PCIe 3.0x 16」の結果を100%とした場合

ゲーム用途ではできるだけ高速な接続を利用すべき

 今回の結果を踏まえると、ゲームに用いるビデオカードを接続するのであれば、できるかぎりPCI Express 3.0 x16を利用するべきであると言える。とくに、GeForce GTX 1080 TiクラスのハイエンドGPUでは、1割以上も性能が低下することのあるPCI Express 3.0 x4以下の接続は避けたいところだ。

 Thunderbolt 3接続のGPUボックスに関しては、40Gbpsで接続するタイプであってもGPUの性能は6割程度まで低下することがあるため、規格上の帯域が近いPCI Express 3.0 x4と同程度の性能が得られると考えるべきではない。もっとも、外付けGPUボックスはビデオカードを搭載できない環境で利用することが前提の製品なので、PCI Express 3.0 x16接続との差が大きいからと言って価値を失うものではない。

 最近流行りのマイニングのように、インターフェイスの速度がビデオカードの性能にほとんど影響しない用途も存在しているわけだが、ゲームでは利用できる最速のインターフェイスにビデオカードを接続するのが正解ということだ。