特集

GeForce RTX 5080と4080を比較してみたらトランジスタ数が減っててビビった

劉尭

2025年1月30日 06:19

　本記事では、GeForce RTX 5080と旧モデルのGeForce RTX 4080とスペックの比較をしよう。

　GeForce RTX 5080対4080では、CUDAコア数の増加は10%程度、(表で掲載していないが)4080 SUPERと比較するわずか5%に過ぎない。40シリーズと50シリーズはともに製造プロセスとして「TSMC 4nm 4N NVIDIAカスタム」を採用しているため、トランジスタ数の大幅な増加はコスト増や電力増に直結する。

　実際、トップエンドの5090では4090よりCUDAコア数を32%増やせたが、発売時の販売価格の目安で比較すると10万円高くなってしまったし、消費電力も大幅に増加した。プロユースも考慮した5090と比較すると、5080はどちらかといえばハイエンドゲーマー向けの製品であり、コストや電力などの制約などからこうした仕様になったのだろう。

　それどころか、NVIDIAのホワイトペーパーによれば、5080は4080はトランジスタ数が減って、さらにダイサイズもごくわずかに縮小しているのだ。4080は歩留まりのためダイの一部が無効化されていて、フルスペックは後継の4080 SUPER。そのフルスペックの4080 SUPERよりもコンパクトだというのだから驚きだ。発売時の販売価格で見ると、新しいGDDR7メモリの採用や円安が影響しているのにも関わらず(価格の目安が)安くなっているのは、製造プロセスが成熟したことに加え、こうしたダイサイズの若干の縮小も影響しているのかもしれない。

　そのため、今回NVIDIAはさまざまなソフトウェア的なアプローチでRTコアの性能向上に注力し、複雑なジオメトリを利用する現代的なアプリでリアルタイムレイトレーシング性能を引き上げた。また、Tensorコアは精度を抑えたFP4対応となり、これを活用したマルチフレーム生成のDLSS 4で、ゲーム性能を引き上げる手法を採った。

　GeForce RTX 5080の動画デコーダ(NVDEC)は従来の1基から2基に増え、なおかつ4:2:2のデコードを新たにサポートしたのもトピックだと言えるだろう。一方、動画エンコーダのNVENCの数は2基で従来通りだが、世代が進化して画質が向上したと謳われている。

【表】GeForce RTX 5080と4080を比較
GPU	GeForce RTX 5080	GeForce RTX 4080
CUDAコア数	10,752基	9,728基
RTコア	第4世代 84基 170.6TFLOPS	第3世代 76基 112.7TFLOPS
Tensorコア	第5世代 336基 1,801AI TOPS	第4世代 304基 780AI TOPS
SM数	84	76
TPC数	42	38
GPC数	7	7
ROP数	112	112
ピクセルフィルレート(Gigapixels/s)	293.1	280.6
テクスチャユニット	336	304
テクスチャフィルレート(Gigatexels/s)	879.30	761.50
L1データキャッシュ/共有メモリ	10,752KB	9,728KB
L2キャッシュ	66,536KB	66,536KB
レジスタファイルサイズ	21,504KB	19,456KB
ブーストクロック	2.617GHz	2.505GHz
ベースクロック	2.3GHz	2.205GHz
ピークFP32/FP16/BF16性能(non-Tensor)	56.3TFLOPS	48.7TFLOPS
ピークINT32性能(non-Tensor)	56.3TOPS	24.4TOPS
ピークFP4 Tensor TFLOPS with FP32 Accumulate	900.4/1,801	-
ピークFP8 Tensor TFLOPS with FP16 Accumulate	450.2/900.4	389.9/799.8
ピークFP8 Tensor TFLOPS with FP32 Accumulate	225.1/450.2	194.9/389.8
ピークFP16 Tensor TFLOPS with FP16 Accumulate	225.1/450.2	194.9/389.8
ピークFP16 Tensor TFLOPS with FP32 Accumulate	112.6/225.1	97.5/195
ピークBF16 Tensor TFLOPS with FP32 Accumulate	112.6/225.1	97.5/195
ピークTF32 Tensor TFLOPS	56.3/112.6	48.7/97.4
ピークINT8 Tensor TOPS	450.2/900.4	389.9/779.82
メモリ	GDDR7	GDDR6X
メモリ容量	16GB	16GB
メモリ速度	30Gbps	22.4Gbps
帯域幅	960GB/s	716.8GB/s
バス幅	256bit	256bit
NVENC	第9世代×2	第8世代×2
NVDEC	第6世代×2	第5世代×1
トランジスタ数	456億	459億
ダイサイズ	378平方mm	378.6平方mm
製造プロセス	TSMC 4nm 4N NVIDIAカスタム	TSMC 4nm 4N NVIDIAカスタム
最大GPU温度	88℃	90℃
TGP	360W	320W
システム要件電力	850W	750W
販売価格目安(発売時)	19万8,800円	21万9,800円