Hothotレビュー

これがGeForce RTX 5090の実力だ!旧世代を圧倒するレイトレ性能を体感せよ

 今回は、先日開封の様子を紹介したGeForce RTX 5090 Founders Editionのベンチマークレビューをお届けする。

 従来のウルトラハイエンドGPUであるGeForce RTX 4090との比較を通して、Blackwell世代の最上位GPUがどれだけ進化したのか確かめてみよう。

Blackwell世代のウルトラハイエンド「GeForce RTX 5090」

 GeForce RTX 5090は、新設計のBlackwellアーキテクチャを採用するGeForce RTX 50シリーズの最上位モデル。TSMC 4Nプロセスで製造されたGPUコア「GB202」を採用しており、21,760基のCUDAコアのほか、680基の第5世代Tensorコア、170基の第4世代RTコアなどが有効化されている。

 VRAMとして28Gbps動作のGDDR7メモリを32GB搭載しており、GPUと512bitのメモリインターフェイスで接続することにより1,792GB/sのメモリ帯域幅を実現した。電力指標のTotal Graphics Power(TGP)は575Wで、バスインターフェイスはPCIe 5.0 x16。

【表1】GeForce RTX 5090の主な仕様
GPUGeForce RTX 5090GeForce RTX 4090
アーキテクチャBlackwell (GB202)Ada Lovelace (AD102)
製造プロセスTSMC 4NTSMC 4N
SM170基128基
CUDAコア21,760基16,384基
RTコア170基 (第4世代)128基 (第3世代)
Tensorコア680基 (第5世代)512基 (第4世代)
テクスチャユニット680基512基
ROPユニット176基176基
ブーストクロック2,407MHz2,520MHz
メモリ容量32GB GDDR724GB GDDR6X
メモリスピード28Gbps21Gbps
メモリインターフェイス512bit384bit
メモリ帯域幅1,792GB/s1,008GB/s
NVENC第9世代NVENC×3基第8世代NVENC×2基
NVDEC第6世代NVDEC×2基第5世代NVDEC×1基
PCI ExpressPCIe 5.0 x16PCIe 4.0 x16
消費電力 (TGP)575W450W

GeForce RTX 5090 Founders Edition

 今回のテストに用いるのは、先日開封の様子を紹介したGeForce RTX 5090 Founders Editionだ。

 2基の大口径ファンを備える大型GPUクーラーを搭載しており、575Wの大消費電力を支える補助電源コネクタはPCIe 16ピン(600W対応)が担っている。映像出力端子はDisplayPort 2.1b(3基)とHDMI 2.1b。

GeForce RTX 5090 Founders Edition。大口径ファンを2基備える大型GPUクーラーを搭載
裏面。黒い部分はヒートシンクで、表面側から冷却ファンの風が抜ける設計となっている
カードの占有スロット数は約2.1スロット
補助電源コネクタはPCIe 16ピン(600W対応)
ブラケット部。映像出力端子はDisplayPort 2.1b(3基)とHDMI 2.1b
GeForce RTX 5090のGPU-Z実行画面

比較用GPUとテスト環境

 GeForce RTX 5090の比較用には、GeForce RTX 40シリーズ最上位GPUを搭載する「GeForce RTX 4090 Founders Edition」を用意した。

GeForce RTX 4090 Founders Edition
GeForce RTX 4090 Founders EditionのGPU-Z実行画面
【表2】各ビデオカードの動作仕様
GPUGeForce RTX 5090GeForce RTX 4090
ビデオカードベンダーNVIDIANVIDIA
製品型番Founders EditionFounders Edition
ベースクロック2,017MHz2,235MHz
ブーストクロック2,407MHz2,520MHz
メモリ容量32GB GDDR724GB GDDR6X
メモリスピード28Gbps21Gbps
メモリインターフェイス512bit384bit
メモリ帯域幅1,792GB/s1,008GB/s
PCI ExpressPCIe 5.0 x16PCIe 4.0 x16
Power Limit575W450W
温度リミット不明83℃
Resizable BAR有効有効
GPUドライバGRD 571.86 (32.0.15.7186)GRD 566.36 (32.0.15.6636)

 両ビデオカードを搭載するテスト環境には、最高峰のゲーミングCPUである「Ryzen 7 9800X3D」と、AMD X870チップセットを搭載するASUSの「ROG STRIX X870-F GAMING WIFI」を用意した。そのほかの機材や条件については以下の通り。

3D V-Cacheを搭載する8コア/16スレッドCPU「Ryzen 7 9800X3D」
AMD X870チップセット搭載マザーボード「ASUS ROG STRIX X870-F GAMING WIFI」
【表3】テスト機材
CPURyzen 7 9800X3D (8コア/16スレッド)
CPUリミット設定PPT=162W、TDC=120A、EDC=180A、TjMax=95℃
CPUアンコア設定MCLK=UCLK=2,800MHz、FCLK=2,000MHz
マザーボードASUS ROG STRIX X870-F GAMING WIFI [BIOS=1001]
メモリDDR5-5600 16GB×2 (2ch、46-45-45-90、1.1V)
システム用SSDSamsung 970 EVO Plus (NVMe SSD/PCIe 3.0 x4)
ゲーム用SSDCFD CSSD-M2B2TPG3VNF 2TB (NVMe SSD/USB 10Gbps)
CPUクーラーASUS TUF GAMING LC 240 ARGB (ファンスピード=100%)
電源玄人志向 KRPW-PA1200W/92+ (1,200W/80PLUS Platinum)
ディスプレイ3,840×2,160ドット、60Hz
OSWindows 11 Pro 24H2 (build 26100.2894、VBS有効)
電源プランバランス
計測HWiNFO64 Pro v8.20、ラトックシステム RS-BTWATTCH2
室温約24℃

ベンチマーク結果

 ここからは、ベンチマークテストの結果を確認していく。今回実施したベンチマークテストは以下の通り。

  • 3DMark
  • ファイナルファンタジーXIV: 黄金のレガシー ベンチマーク
  • STREET FIGHTER 6 ベンチマークツール
  • サイバーパンク2077
  • ホグワーツ・レガシー
  • フォートナイト
  • オーバーウォッチ 2
  • ARMORED CORE VI FIRES OF RUBICON
  • エルデンリング
  • Forza Horizon 5
  • F1 24
  • Microsoft Flight Simulator 2024
  • UL Procyon
  • Blender Benchmark
  • Adobe Camera Raw

3DMark「Speed Way」

 3DMarkのDirectX 12 Ultimateテスト「Speed Way」でGeForce RTX 5090が記録したスコアは「14,226」で、GeForce RTX 4090の「10,195」を約40%上回った。

3DMark「Speed Way」

3DMark「Steel Nomad」

 3DMarkのDirectX 12テスト「Steel Nomad」では、GPU負荷の高い通常版Steel Nomadと、より軽量なSteel Nomad Lightを実行した。

 高負荷テストのSteel NomadでGeForce RTX 5090が記録したスコアは「14,060」で、GeForce RTX 4090の「9,301」を約51%上回った。

 負荷の軽いSteel Nomad LightでGeForce RTX 5090が記録したスコアは「53,822」で、GeForce RTX 4090の「26,193」を約24%上回った。

3DMark「Steel Nomad」
3DMark「Steel Nomad Light」

3DMark「Port Royal」

 3DMarkのDXR(DirectX Raytracing)テスト「Port Royal」でGeForce RTX 5090が記録したスコアは「36,296」で、GeForce RTX 4090の「26,193」を約39%上回った。

3DMark「Port Royal」

3DMark「Solar Bay」

 3DMarkの比較的軽量なレイトレーシングテスト「Solar Bay」でGeForce RTX 5090が記録したスコアは「209,082」で、GeForce RTX 4090の「188,370」を約11%上回った。

3DMark「Solar Bay」

3DMark「Wild Life」

 3DMarkのVulanテスト「Wild Life」では、通常のWild Lifeと、より高負荷なWild Life Extremeを実行した。

 GPU負荷の軽い通常版はスコアが155,000前後で頭打ちとなっており、GeForce RTX 5090とGeForce RTX 4090が横並びとなっている。他方、高負荷版では「102,018」を記録したGeForce RTX 5090が、GeForce RTX 4090の「86,674」を約18%上回った。

3DMark「Wild Life」

3DMark「NVIDIA DLSS feature test」

 NVIDIAから提供されたDLSS 4対応版3DMarkで、DLSS性能を計測する「NVIDIA DLSS feature test」 を実行した結果が以下の通り。なお、テストの画面解像度は4K/2160p(3,840×2,160ドット)で、DLSS超解像の設定は「Performance」となっている。

 従来モデルのGeForce RTX 4090でもDLSS 4の超解像と1枚の生成フレームを挿入する「2X」は実行できており、DLSS無効時の60fps弱から3倍程度までフレームレートが向上している。

 DLSS 4フル対応のGeForce RTX 5090では、新機能であるマルチフレーム生成によって生成フレームを2枚挿入する「3X」と3枚挿入する「4X」が実行可能となっており、3Xでは80.46fpsから351.57fps、4Xでは81.00fpsから435.53fpsへと大幅なフレームレート向上を達成した。

 新旧GPUが対応している「2X」では、両GPUともDLSS無効時から3倍前後のフレーレートとなっているが、無効時の時点で4割ほどGeForce RTX 5090が高いフレームレートとなっているため、DLSS適用時もGeForce RTX 5090がGeForce RTX 4090を36~37%上回っている。

3DMark「NVIDIA DLSS feature test」 (DLSSオフ/DLSSオン)

ファイナルファンタジーXIV: 黄金のレガシー ベンチマーク

 ファイナルファンタジーXIV: 黄金のレガシー ベンチマークでは、描画設定を「最高品質」に設定して、フルHD/1080p~4K/2160pまでの画面解像度をテストした。

 GeForce RTX 5090のスコアはGeForce RTX 4090を2~28%上回った。WQHD/1440p以下ではCPUがボトルネックとなり両GPUのスコア差が縮小しているが、GPU負荷の高い4KではGPU性能の差がスコアに反映された格好だ。

ファイナルファンタジーXIV: 黄金のレガシー ベンチマーク「スコア」
ファイナルファンタジーXIV: 黄金のレガシー ベンチマーク「平均フレームレート」

STREET FIGHTER 6 ベンチマークツール

 STREET FIGHTER 6 ベンチマークツールでは、グラフィックプリセットを最高の「HIGHEST」に設定して、フルHD/1080p~4K/2160pまでの画面解像度をテストした。

 結果として、GeForce RTX 5090とGeForce RTX 4090は全ての条件で上限フレームレートに達しており、両GPUのパフォーマンス差は生じなかった。

STREET FIGHTER 6 ベンチマークツール「フルHD/1080p」
STREET FIGHTER 6 ベンチマークツール「WQHD/1440p」
STREET FIGHTER 6 ベンチマークツール「4K/2160p」

サイバーパンク2077

 サイバーパンク2077では、DLSS 4に先行対応したバージョンv2.2-Devを使用して、フルHD/1080p~4K/2160pまでの画面解像度でDLSSフレーム生成の設定を変更しながらベンチマークモードを実行した。なお、DLSS超解像についてはDLSS 4で導入されたTransformerモデルを使用している。

 GeForce RTX 5090は、同条件でテストを実行したGeForce RTX 4090をフルHD/1080pで9~20%、WQHD/1440pで18~27%、4K/2160pでは28~32%上回った。

 GeForce RTX 5090におけるDLSS 4のマルチフレーム生成による効果に注目すると、従来のフレーム生成である「2X」の効果がフレーム生成無効時比で171~183%であったのに対し、「3X」は242~261%、「4X」では306~327%となっている。実際の画質や操作性、超高フレームレートの意義など考えるべき点は少なくないが、フレームレートを増やす効果に関しては絶大だ。

サイバーパンク2077「フルHD/1080p」
サイバーパンク2077「WQHD/1440p」
サイバーパンク2077「4K/2160p」

ホグワーツ・レガシー

 ホグワーツ・レガシーでは、DLSS 4に先行対応したテストバージョンを使用して、フルHD/1080p~4K/2160pまでの画面解像度でDLSSフレーム生成の設定を変更しながら平均フレームレートを計測したなお、フレームレートの計測はCPUボトルネックが生じにくい飼育場で実施している。

 GeForce RTX 5090は、同条件でテストを実行したGeForce RTX 4090をフルHD/1080pで16~23%、WQHD/1440pで18~26%、4K/2160pでは21~31%上回った。

 GeForce RTX 5090におけるDLSS 4のマルチフレーム生成による効果に注目すると、「2X」がフレーム生成無効時比で170~172%であったのに対し、「3X」は237~245%、「4X」では281~304%となっている。

ホグワーツ・レガシー「フルHD/1080p」
ホグワーツ・レガシー「WQHD/1440p」
ホグワーツ・レガシー「4K/2160p」

フォートナイト

 フォートナイトでは、グラフィックプリセット「最高」をベースに、超解像とNaniteおよびLumenを無効化したアンチエイリアス「TAA」設定と、NaniteとLumen(ハードウェアレイトレーシング)を有効化してDLSS超解像を行なう設定でフレームレートを計測した。

 Nanite/Lumen無効時のGeForce RTX 5090は、GeForce RTX 4090を8~22%上回った。他方、Naniteを有効化してLumenを最高品質に設定した条件下でもGeForce RTX 4090を9~15%上回っている。

フォートナイト│Nanite/Lumen「無効」
フォートナイト│Nanite/Lumen「有効」

オーバーウォッチ 2

 オーバーウォッチ 2では、グラフィックプリセットを最高の「エピック」に設定し、フルHD/1080p~4K/2160pまでの画面解像度で平均フレームレートを計測した。テスト時の上限フレームレートは600fps。

 GeForce RTX 5090は、GeForce RTX 4090をフルHD/1080pで9%、WQHD/1440pで23%、4K/2160pで37%上回った。フルHD/1080pでの差が小さくなっているのはGPU負荷が低めであることに加え、GeForce RTX 5090が上限フレームレートの600fpsに達していることの影響が大きい。

オーバーウォッチ 2

ARMORED CORE VI FIRES OF RUBICON

 ARMORED CORE VI FIRES OF RUBICONでは、グラフィックプリセットを「最高」に設定し、フルHD/1080p~4K/2160pまでの画面解像度で平均フレームレートを計測した。テスト時の上限フレームレートは120fps。

 結果として、GeForce RTX 5090とGeForce RTX 4090は全ての画面解像度で上限フレームレートの120fpsに達しており、パフォーマンスの差は計測できなかった。

ARMORED CORE VI FIRES OF RUBICON

エルデンリング

 エルデンリングでは、グラフィックプリセットを「最高」に設定し、レイトレーシングを「無効」または「最高」に設定した場合の平均フレームレートを、フルHD/1080p~4K/2160pまでの画面解像度で計測した。テスト時の上限フレームレートは60fps。

 レイトレーシングを「最高」で有効にした条件において両GPUの差が生じたのは4K/2160pで、56.2fpsを記録したGeForce RTX 5090がGeForce RTX 4090を約6%上回った。他方、レイトレーシング無効時は両GPUとも上限フレームレートに達しているためパフォーマンスの差は計測されていない。

エルデンリング│レイトレーシング有効
エルデンリング│レイトレーシング無効

Forza Horizon 5

 Forza Horizon 5では、グラフィックプリセットを最高の「エクストリーム」に設定し、フルHD/1080p~4K/2160pまでの画面解像度でベンチマークモードを実行した。

 GeForce RTX 5090が記録した平均フレームレートは、GeForce RTX 4090のそれを22~23%上回った。

Forza Horizon 5

F1 24

 F1 24では、グラフィックプリセットを最高の「超高」、DLSS超解像とフレーム生成を有効に設定し、フルHD/1080p~4K/2160pまでの画面解像度でベンチマークモードを実行した。

 GeForce RTX 5090が記録した平均フレームレートは、GeForce RTX 4090のそれを24~26%上回った。

F1 24

Microsoft Flight Simulator 2024

 Microsoft Flight Simulator 2024では、グラフィックプリセットを「ウルトラ」、アンチエイリアスを「DLSS(DLAA)」、フレーム生成を有効に設定し、フルHD/1080p~4K/2160pまでの画面解像度で計測した。

 GeForce RTX 5090は、GeForce RTX 4090をフルHD/1080pで12%、WQHD/1440pで29%、4K/2160pで48%上回った。

 フルHD/1080pやWQHD/1440pでの差は4K/2160pより小さくなっているが、GeForce RTX 5090はWQHD/1440p以下においてCPUボトルネックによるものと思われるフレームレートの頭打ちが発生していることが原因だ。

Microsoft Flight Simulator 2024

UL Procyon「AI Computer Vision Benchmark」

 UL Procyonの「AI Computer Vision Benchmark」では、Windows MLとTensorRTを使用した場合のパフォーマンスを計測しようと試みたが、GeForce RTX 5090はTensorRTでのテストを実行できなかった。これは、UL ProcyonのTensorRTがGeForce RTX 5090の未対応のバージョンであることが原因で、今後のアップデートでの更新が検討されているようだ。

 ともあれ、Windows MLにおけるGeForce RTX 5090はGeForce RTX 4090を23%上回っている。TensorRT利用時のGeForce RTX 4090はWindows ML利用時より32%高いスコアとなっているので、GeForce RTX 5090もTensorRTが利用できればさらに高いスコアを記録できるだろう。

UL Procyon「AI Computer Vision Benchmark」

UL Procyon「AI Image Generation Benchmark (Stable Diffusion)」

 UL Procyon「AI Image Generation Benchmark」は、画像生成AIでのパフォーマンスを計測するテスト。ここでは「Stable Diffusion 1.5 (FP16)」と「Stable Diffusion XL (FP16)」をONNX RuntimeとTensorRTで実行した。なお、GeForce RTX 5090はテスト側のTensorRTバージョンが古い影響でスコアを計測できていない。

 512×512サイズの画像を生成する「Stable Diffusion 1.5 (FP16)」では、GeForce RTX 5090がONNX Runtime利用時のGeForce RTX 4090を33%上回った。なお、GeForce RTX 4090はTensorRTの利用によってONNX Runtime利用時より約36%高いスコアを記録している。

 1,024×1,024サイズの画像を生成する「Stable Diffusion XL (FP16)」では、GeForce RTX 5090がONNX Runtime利用時のGeForce RTX 4090を29%上回った。こちらも、GeForce RTX 4090はTensorRTの利用によってONNX Runtime利用時より約27%高いスコアを記録している。

UL Procyon「AI Image Generation Benchmark」│Stable Diffusion 1.5 (FP16)
UL Procyon「AI Image Generation Benchmark」│Stable Diffusion XL (FP16)

UL Procyon「AI Image Generation Benchmark (FLUX.1)」

 今回のレビューに際してNVIDIAより提供されたのが、画像生成AI「FLUX.1」を使用して実行するUL ProcyonのAI Image Generation Benchmarkだ。テストはGeForce RTX 5090に対応したTensorRTで実行され、FP8またはFP4でのパフォーマンスを計測できる。

 FP8でテストを実行した場合、GeForce RTX 5090が1枚の画像を生成するのに要した時間は6.617秒で、9.463秒を要したGeForce RTX 4090の生成速度を約43%上回った。

 一方、FP4でのテストではGeForce RTX 5090が1枚当たり3.985秒で生成できたのに対し、GeForce RTX 4090は17.247秒を要した。結果として生成速度はGeForce RTX 5090が4.3倍ほど速いわけだが、これはGeForce RTX 5090が新たにFP4をサポートしたことが要因だ。

UL Procyon「AI Image Generation Benchmark」│FLUX.1

UL Procyon「AI Text Generation Benchmark」

 UL Procyonの「AI Text Generation Benchmark」は、LLMを用いたテキスト生成のパフォーマンスを計測するテスト。現時点ではTensorRT非対応であるため、ONNX Runtimeでテストを実行した。

 GeForce RTX 5090は、GeForce RTX 4090のスコアをPHI 3.5で約19%、MISTRAL 7Bで約29%、LLAMA 3.1で約32%、LLAMA 2で約35%上回った。

UL Procyon「AI Text Generation Benchmark」│ONNX Runtime

Blender Benchmark

 3DCGソフト「Blender」の公式ベンチマークソフトであるBlender Benchmarkでは、3つのシーンのレンダリング速度を計測した。テストに使用したBlenderのバージョンはv4.3.0。

 GeForce RTX 5090は、GeForce RTX 4090のレンダリング速度をmonsterで約33%、junkshopで約45%、classroomで約31%上回った。

Blender Benchmark

Adobe Camera Raw「AIノイズ除去」

 Adobe Camera Rawで、2,400万画素のRAWファイル20枚にAIノイズ除去を実行したさいの処理速度を比較した結果が以下のグラフ。

 GeForce RTX 5090の1分あたりの処理枚数は「29.34枚」で、GeForce RTX 4090の「22.37枚」を約31%上回った。

Adobe Camera Raw「AIノイズ除去」

システム消費電力と電力効率

 ワットチェッカーを使ってシステムの消費電力を測定し、アイドル時の最小消費電力と、ベンチマーク実行中の平均消費電力および最大消費電力をグラフ化した。

 アイドル時の最小消費電力はGeForce RTX 5090が90.8Wで、83.5WのGeForce RTX 4090より7W強高い数値となっている。

 ベンチマークテスト実行中にGeForce RTX 5090が記録した平均消費電力は490.6~733.9Wで、380.0~576.3WだったGeForce RTX 4090より73~170Wほど高い平均消費電力となっている。

ベンチマーク実行中とアイドル時のシステムの消費電力 (平均/最大)

 システムの平均消費電力でベンチマークスコアを割ることによって求めたワットパフォーマンスを、GeForce RTX 4090を基準に指数化したものが以下のグラフ。

 平均消費電力が大きく増加していたGeForce RTX 5090だが、明確にGeForce RTX 4090のワットパフォーマンスを下回ったのはCPUボトルネックで性能を発揮しきれなかったフルHD/1080p設定のファイナルファンタジーXIVくらいで、多くのテストではGeForce RTX 4090と同程度のワットパフォーマンスを発揮し、3DMarkのSpeed WayとSteel NomadではGeForce RTX 4090を明確に上回った。

ワットパフォーマンス (GeForce RTX 4090比)

負荷テスト実行中のモニタリングデータ

 モニタリングソフトのHWiNFO64 Proを使用して、3DMarkのSteel Nomad Stress Test実行中のモニタリングデータを取得した結果が以下のグラフ。

 テスト中のGeForce RTX 5090は、電力リミットの575Wに張り付くほどの大電力を消費しながら動作し続けており、この時のGPU温度は平均76.2℃(最大77.9℃)、VRAM温度は平均88.5℃(最大90.0℃)、GPUクロックは平均2,501MHz(最大2,632MHz)、VRAMクロックは平均2,330MHz(最大2,334MHz)だった。

 GeForce RTX 5090 Founders EditionのGPUクーラーは大型とはいえ2.1スロットサイズの薄型であり、575Wの大消費電力に伴う発熱を捌けるのか不安もあったのだが、終始リミットを一杯の電力を消費し続けている様子からサーマルスロットリングが生じていないことが確認できた。また、ファンスピードも最大1,674rpmでそこまでの騒音が生じていないことも好印象だ。

GPU/VRAM温度 (平均/最大)│3DMark「Steel Nomad Stress Test」
消費電力 (平均/最大)│3DMark「Steel Nomad Stress Test」
動作クロック (平均/最大)│3DMark「Steel Nomad Stress Test」
GeForce RTX 5090 (32GB)のモニタリングデータ│3DMark「Steel Nomad Stress Test」
GeForce RTX 4090 (24GB)のモニタリングデータ│3DMark「Steel Nomad Stress Test」

最強のゲーミング性能を実現する新世代のウルトラハイエンドGPU

 Blackwell世代の最上位GeForceだけあって、GeForce RTX 5090は従来モデルを明確に上回る素晴らしいパフォーマンスを実現していた。

 DLSS 4のマルチフレーム生成の有用性については実際のゲームで広く検証すべきだが、DLSS 4抜きでも最強のゲーミングGPUであることは間違いない。生成AIや3DCGレンダリングなど、ゲーム以外でのパフォーマンスもGeForce RTX 4090を凌駕しており、性能を追求するユーザーにとっては最上級の選択肢だ。

 GeForce RTX 5090の国内想定価格は39万3,800円からとされている。昨今の円安も影響して一般消費者向けのPCパーツとしてはきわめて高価ではあるが、相応の価値を見出すユーザーは少なくないだろう。買い時を逃して後悔したくないのであれば、少なくとも1月30日とされる発売日までには覚悟を決めておきたいところだ。