特集

10万円ちょいで4090並みの性能を謳うGeForce RTX 5070の仕様を旧世代と比較

劉尭

2025年3月5日 06:11

549ドルで4090並みの性能を謳うGeForce RTX 5070

　アッパーミドルレンジに位置づけられるGPU「GeForce RTX 5070」を搭載するビデオカードが発売開始となった。NVIDIAが公表している日本国内での価格は10万8,800円となっており、今のところPalit、MSI、およびZOTACがこの価格でカードを用意しているという。

　CESのタイミングで発表となったGeForce RTX 50シリーズの末っ子モデルとも言うべき存在で、GeForce RTX 5060 Ti(仮)辺りが出てくるまでは下位をしばらく担うことになるだろう。この記事ではこの5070について過去の製品と比較してみようと思う。

　5070は1つ上位の「GeForce RTX 5070 Ti」と同じ“70”を冠しているものの、5070 Tiはさらにその上の「GeForce RTX 5080」と共通の456億トランジスタを搭載したGB203というダイを採用しているのに対し、5070無印では311億トランジスタのGB205というダイが使われている。

　つまり、5070 Tiは当初よりハイエンドを目指して設計されたダイを採用しているのに対し、5070は当初よりアッパーミドルレンジをターゲットにしたダイを採用しているわけだ(いずれも歩留まり向上のためダイの一部を無効化しているが)。

　GeForce RTX 5070を4070 SUPERと比較すると、トランジスタ数が減少しダイの規模が小さくなっているのが印象的。CUDAコアやTensorコアも減っているのは気がかりだ。アーキテクチャの進歩やメモリ帯域幅の向上、先述のマルチフレーム生成技術の対応により、ゲーム性能を補っていると予想される。

　NVIDIAの発表時では、5070は4090並みの性能を549ドルで実現などとしていたが、これはもちろんネイティブの性能ではなく、マルチフレーム生成技術による“マジック”である。

【表】GeForce RTX 5070と4070 SUPER、4070、3070を比較
GPU	GeForce RTX 5070	GeForce RTX 4070 SUPER	GeForce RTX 4070	GeForce RTX 3070
CUDAコア数	6,144基	7,168基	5,888基	5,888基
RTコア	第4世代 48基 93.6TFLOPS	第3世代 66基 82TFLOPS	第3世代 46基 67.4TFLOPS	第2世代 46基 39.7TFLOPS
Tensorコア	第5世代 192基 987.8AI TOPS	第4世代 224基 568AI TOPS	第4世代 184基 466.4AI TOPS	第3世代 184基 325AI TOPS
SM数	48	56	46	46
TPC数	24	28	23	23
GPC数	5	5	5	6
ROP数	80	80	64	96
ピクセルフィルレート(Gigapixels/s)	201	198(試算)	158.4	165.6
テクスチャユニット	192	224	184	184
テクスチャフィルレート(Gigatexels/s)	482.3	554.4(試算)	455.4	317.4
L1データキャッシュ/共有メモリ	6,144KB	7,168KB	5,888KB	5,888KB
L2キャッシュ	49,152KB	49,152KB	36,864KB	4,096KB
レジスタファイルサイズ	12,288KB	14,336KB(試算)	11,776KB	11,776KB
ブーストクロック	2.512GHz	2.48GHz	2.475GHz	1.725GHz
ベースクロック	2.33GHz	1.98GHz	1.92GHz	1.5GHz
ピークFP32/FP16/BF16性能(non-Tensor)	30.9	35.4(試算)	29.1	20.3
ピークINT32性能(non-Tensor)	30.9	17.8(試算)	14.6	10.2
ピークFP4 Tensor TFLOPS with FP32 Accumulate	493.9/987.8	N/A	N/A	N/A
ピークFP8 Tensor TFLOPS with FP16 Accumulate	246.9/493.9	248(試算)/568	233.2/466.4	N/A
ピークFP8 Tensor TFLOPS with FP32 Accumulate	123.5/246.9	142/248(試算)	116.6/233.2	N/A
ピークFP16 Tensor TFLOPS with FP16 Accumulate	123.5/246.9	142/248(試算)	116.6/233.2	81.3/162.6
ピークFP16 Tensor TFLOPS with FP32 Accumulate	61.7/123.5	71/142(試算)	58.3/116.6	40.6/81.2
ピークBF16 Tensor TFLOPS with FP32 Accumulate	61.7/123.5	71/142(試算)	58.3/116.6	40.6/81.2
ピークTF32 Tensor TFLOPS	30.9/61.7	35.5/712(試算)	29.1/58.2	20.3/40.6
ピークINT8 Tensor TOPS	246.9/493.9	248(試算)/568	233.2/466.4	162.5/325
メモリ	GDDR7	GDDR6X	GDDR6X	GDDR6
メモリ容量	12GB	12GB	12GB	8GB
メモリ速度	28Gbps	21Gbps	21Gbps	14Gbps
帯域幅	672GB/s	504GB/s	504GB/s	448GB/s
バス幅	192bit	192bit	192bit	256bit
NVENC	第9世代×1	第8世代×1	第8世代×1	第7世代×1
NVDEC	第6世代×1	第5世代×1	第5世代×1	第5世代×1
トランジスタ数	311億	358億	358億	174億
ダイサイズ	263平方mm	294.5平方mm	294.5平方mm	392.5平方mm
製造プロセス	TSMC 4nm 4N NVIDIAカスタム	TSMC 4nm 4N NVIDIAカスタム	TSMC 4nm 4N NVIDIAカスタム	Samsung 8nm 8N NVIDIAカスタム
最大GPU温度	88℃	90℃	90℃	90℃
TGP	250W	220W	200W	220W
システム要件電力	650W	650W	650W	550W
販売価格目安(発売時)	10万8,800円	8万6,000円	10万2,080円	6万9,960円