特集

GeForce RTX 5080と4080を比較してみたらトランジスタ数が減っててビビった

 本記事では、GeForce RTX 5080と旧モデルのGeForce RTX 4080とスペックの比較をしよう。

 GeForce RTX 5080対4080では、CUDAコア数の増加は10%程度、(表で掲載していないが)4080 SUPERと比較するわずか5%に過ぎない。40シリーズと50シリーズはともに製造プロセスとして「TSMC 4nm 4N NVIDIAカスタム」を採用しているため、トランジスタ数の大幅な増加はコスト増や電力増に直結する。

 実際、トップエンドの5090では4090よりCUDAコア数を32%増やせたが、発売時の販売価格の目安で比較すると10万円高くなってしまったし、消費電力も大幅に増加した。プロユースも考慮した5090と比較すると、5080はどちらかといえばハイエンドゲーマー向けの製品であり、コストや電力などの制約などからこうした仕様になったのだろう。

 それどころか、NVIDIAのホワイトペーパーによれば、5080は4080はトランジスタ数が減って、さらにダイサイズもごくわずかに縮小しているのだ。4080は歩留まりのためダイの一部が無効化されていて、フルスペックは後継の4080 SUPER。そのフルスペックの4080 SUPERよりもコンパクトだというのだから驚きだ。発売時の販売価格で見ると、新しいGDDR7メモリの採用や円安が影響しているのにも関わらず(価格の目安が)安くなっているのは、製造プロセスが成熟したことに加え、こうしたダイサイズの若干の縮小も影響しているのかもしれない。

 そのため、今回NVIDIAはさまざまなソフトウェア的なアプローチでRTコアの性能向上に注力し、複雑なジオメトリを利用する現代的なアプリでリアルタイムレイトレーシング性能を引き上げた。また、Tensorコアは精度を抑えたFP4対応となり、これを活用したマルチフレーム生成のDLSS 4で、ゲーム性能を引き上げる手法を採った。

 GeForce RTX 5080の動画デコーダ(NVDEC)は従来の1基から2基に増え、なおかつ4:2:2のデコードを新たにサポートしたのもトピックだと言えるだろう。一方、動画エンコーダのNVENCの数は2基で従来通りだが、世代が進化して画質が向上したと謳われている。

【表】GeForce RTX 5080と4080を比較
GPUGeForce RTX 5080GeForce RTX 4080
CUDAコア数10,752基9,728基
RTコア第4世代 84基 170.6TFLOPS第3世代 76基 112.7TFLOPS
Tensorコア第5世代 336基 1,801AI TOPS第4世代 304基 780AI TOPS
SM数8476
TPC数4238
GPC数77
ROP数112112
ピクセルフィルレート(Gigapixels/s)293.1280.6
テクスチャユニット336304
テクスチャフィルレート(Gigatexels/s)879.30761.50
L1データキャッシュ/共有メモリ10,752KB9,728KB
L2キャッシュ66,536KB66,536KB
レジスタファイルサイズ21,504KB19,456KB
ブーストクロック2.617GHz2.505GHz
ベースクロック2.3GHz2.205GHz
ピークFP32/FP16/BF16性能(non-Tensor)56.3TFLOPS48.7TFLOPS
ピークINT32性能(non-Tensor)56.3TOPS24.4TOPS
ピークFP4 Tensor TFLOPS with FP32 Accumulate900.4/1,801-
ピークFP8 Tensor TFLOPS with FP16 Accumulate450.2/900.4389.9/799.8
ピークFP8 Tensor TFLOPS with FP32 Accumulate225.1/450.2194.9/389.8
ピークFP16 Tensor TFLOPS with FP16 Accumulate225.1/450.2194.9/389.8
ピークFP16 Tensor TFLOPS with FP32 Accumulate112.6/225.197.5/195
ピークBF16 Tensor TFLOPS with FP32 Accumulate112.6/225.197.5/195
ピークTF32 Tensor TFLOPS56.3/112.648.7/97.4
ピークINT8 Tensor TOPS450.2/900.4389.9/779.82
メモリGDDR7GDDR6X
メモリ容量16GB16GB
メモリ速度30Gbps22.4Gbps
帯域幅960GB/s716.8GB/s
バス幅256bit256bit
NVENC第9世代×2第8世代×2
NVDEC第6世代×2第5世代×1
トランジスタ数456億459億
ダイサイズ378平方mm378.6平方mm
製造プロセスTSMC 4nm 4N NVIDIAカスタムTSMC 4nm 4N NVIDIAカスタム
最大GPU温度88℃90℃
TGP360W320W
システム要件電力850W750W
販売価格目安(発売時)19万8,800円21万9,800円