特集
GeForce RTX 5080と4080を比較してみたらトランジスタ数が減っててビビった
2025年1月30日 06:19
本記事では、GeForce RTX 5080と旧モデルのGeForce RTX 4080とスペックの比較をしよう。
GeForce RTX 5080対4080では、CUDAコア数の増加は10%程度、(表で掲載していないが)4080 SUPERと比較するわずか5%に過ぎない。40シリーズと50シリーズはともに製造プロセスとして「TSMC 4nm 4N NVIDIAカスタム」を採用しているため、トランジスタ数の大幅な増加はコスト増や電力増に直結する。
実際、トップエンドの5090では4090よりCUDAコア数を32%増やせたが、発売時の販売価格の目安で比較すると10万円高くなってしまったし、消費電力も大幅に増加した。プロユースも考慮した5090と比較すると、5080はどちらかといえばハイエンドゲーマー向けの製品であり、コストや電力などの制約などからこうした仕様になったのだろう。
それどころか、NVIDIAのホワイトペーパーによれば、5080は4080はトランジスタ数が減って、さらにダイサイズもごくわずかに縮小しているのだ。4080は歩留まりのためダイの一部が無効化されていて、フルスペックは後継の4080 SUPER。そのフルスペックの4080 SUPERよりもコンパクトだというのだから驚きだ。発売時の販売価格で見ると、新しいGDDR7メモリの採用や円安が影響しているのにも関わらず(価格の目安が)安くなっているのは、製造プロセスが成熟したことに加え、こうしたダイサイズの若干の縮小も影響しているのかもしれない。
そのため、今回NVIDIAはさまざまなソフトウェア的なアプローチでRTコアの性能向上に注力し、複雑なジオメトリを利用する現代的なアプリでリアルタイムレイトレーシング性能を引き上げた。また、Tensorコアは精度を抑えたFP4対応となり、これを活用したマルチフレーム生成のDLSS 4で、ゲーム性能を引き上げる手法を採った。
GeForce RTX 5080の動画デコーダ(NVDEC)は従来の1基から2基に増え、なおかつ4:2:2のデコードを新たにサポートしたのもトピックだと言えるだろう。一方、動画エンコーダのNVENCの数は2基で従来通りだが、世代が進化して画質が向上したと謳われている。
【表】GeForce RTX 5080と4080を比較 | ||
---|---|---|
GPU | GeForce RTX 5080 | GeForce RTX 4080 |
CUDAコア数 | 10,752基 | 9,728基 |
RTコア | 第4世代 84基 170.6TFLOPS | 第3世代 76基 112.7TFLOPS |
Tensorコア | 第5世代 336基 1,801AI TOPS | 第4世代 304基 780AI TOPS |
SM数 | 84 | 76 |
TPC数 | 42 | 38 |
GPC数 | 7 | 7 |
ROP数 | 112 | 112 |
ピクセルフィルレート(Gigapixels/s) | 293.1 | 280.6 |
テクスチャユニット | 336 | 304 |
テクスチャフィルレート(Gigatexels/s) | 879.30 | 761.50 |
L1データキャッシュ/共有メモリ | 10,752KB | 9,728KB |
L2キャッシュ | 66,536KB | 66,536KB |
レジスタファイルサイズ | 21,504KB | 19,456KB |
ブーストクロック | 2.617GHz | 2.505GHz |
ベースクロック | 2.3GHz | 2.205GHz |
ピークFP32/FP16/BF16性能(non-Tensor) | 56.3TFLOPS | 48.7TFLOPS |
ピークINT32性能(non-Tensor) | 56.3TOPS | 24.4TOPS |
ピークFP4 Tensor TFLOPS with FP32 Accumulate | 900.4/1,801 | - |
ピークFP8 Tensor TFLOPS with FP16 Accumulate | 450.2/900.4 | 389.9/799.8 |
ピークFP8 Tensor TFLOPS with FP32 Accumulate | 225.1/450.2 | 194.9/389.8 |
ピークFP16 Tensor TFLOPS with FP16 Accumulate | 225.1/450.2 | 194.9/389.8 |
ピークFP16 Tensor TFLOPS with FP32 Accumulate | 112.6/225.1 | 97.5/195 |
ピークBF16 Tensor TFLOPS with FP32 Accumulate | 112.6/225.1 | 97.5/195 |
ピークTF32 Tensor TFLOPS | 56.3/112.6 | 48.7/97.4 |
ピークINT8 Tensor TOPS | 450.2/900.4 | 389.9/779.82 |
メモリ | GDDR7 | GDDR6X |
メモリ容量 | 16GB | 16GB |
メモリ速度 | 30Gbps | 22.4Gbps |
帯域幅 | 960GB/s | 716.8GB/s |
バス幅 | 256bit | 256bit |
NVENC | 第9世代×2 | 第8世代×2 |
NVDEC | 第6世代×2 | 第5世代×1 |
トランジスタ数 | 456億 | 459億 |
ダイサイズ | 378平方mm | 378.6平方mm |
製造プロセス | TSMC 4nm 4N NVIDIAカスタム | TSMC 4nm 4N NVIDIAカスタム |
最大GPU温度 | 88℃ | 90℃ |
TGP | 360W | 320W |
システム要件電力 | 850W | 750W |
販売価格目安(発売時) | 19万8,800円 | 21万9,800円 |