特集

GeForce RTX 3070 Tiユーザーは買い替えるべき？本日発売のGeForce RTX 5070 Tiと比較

劉尭

2025年2月20日 06:17

　この記事では、ハイエンドである「GeForce RTX 5070 Ti」を、従来モデルである「GeForce RTX 4070 Ti SUPER」、「GeForce RTX 4070 Ti」および「GeForce RTX 3070 Ti」とで仕様を比較してみたいと思う。

　日本国内での参考価格が14万8,800円と決して安くはないのだが、ビデオメモリが上位の5080と同じ16GB搭載されていることもあり、ゲームのみならず生成AIも試すユーザーにとって最適だろう。同様に16GBのメモリを搭載した「GeForce RTX 4070 Ti SUPER」が一定の人気を得ていたことを考えれば、50シリーズで主力になりそうな雰囲気だ。

　こうして並べて見ると、4070 Tiがメモリ周りで同じ70 Tiシリーズの中でもスペック的に見劣る印象。この“汚名返上”をしたのが4070 Ti SUPERであるが、5070 Tiはそこからきっちりスペック向上しているのが偉い(値段が高くなったのは残念だが)。

　なお、NVIDIAは4070 Ti SUPERの一部仕様を比較表で公開していないので、筆者の試算として入れてある。

【表】GeForce RTX 5070 Tiと4070 Ti SUPER、4070 Ti、3070 Tiを比較
GPU	GeForce RTX 5070 Ti	GeForce RTX 4070 Ti SUPER	GeForce RTX 4070 Ti	GeForce RTX 3070 Ti
CUDAコア数	8,960基	8,448基	7,680基	6,144基
RTコア	第4世代 70基 133.2TFLOPS	第3世代 66基 102TFLOPS	第3世代 60基 92.7TFLOPS	第2世代 48基 42.5TFLOPS
Tensorコア	第5世代 280基 1,406AI TOPS	第4世代 264基 706AI TOPS	第4世代 240基 641.4AI TOPS	第3世代 192基 348AI TOPS
SM数	70	66	60	48
TPC数	35	33	30	24
GPC数	6	6	5	6
ROP数	96	96	80	96
ピクセルフィルレート(Gigapixels/s)	235.4	250.56(試算)	208.8	169.9
テクスチャユニット	280	264	240	192
テクスチャフィルレート(Gigatexels/s)	686.6	689	626.4	339.84
L1データキャッシュ/共有メモリ	8,960KB	8,448KB	7,680KB	6,144KB
L2キャッシュ	49,152KB	49,152KB	49,152KB	4,096KB
レジスタファイルサイズ	17,920KB	16,898KB(試算)	15,360KB	12,288KB
ブーストクロック	2.452GHz	2.61GHz	2.61GHz	1.575GHz
ベースクロック	2.3GHz	2.34GHz	2.31GHz	1.77GHz
ピークFP32/FP16/BF16性能(non-Tensor)	43.9	44.1(試算)	40.1	21.7
ピークINT32性能(non-Tensor)	43.9	22(試算)	20	10.9
ピークFP4 Tensor TFLOPS with FP32 Accumulate	703/1,406	N/A	N/A	N/A
ピークFP8 Tensor TFLOPS with FP16 Accumulate	351.5/703	352.8/705.6(試算)	320.7/641.4	N/A
ピークFP8 Tensor TFLOPS with FP32 Accumulate	175.8/351.5	176.4/352.8(試算)	160.4/320.8	N/A
ピークFP16 Tensor TFLOPS with FP16 Accumulate	175.8/351.5	176.4/352.8(試算)	160.4/320.8	87/174
ピークFP16 Tensor TFLOPS with FP32 Accumulate	87.9/175.8	88.2/176.4(試算)	80.2/160.4	43.5/87
ピークBF16 Tensor TFLOPS with FP32 Accumulate	87.9/175.8	88.2/176.4(試算)	80.2/160.4	43.5/87
ピークTF32 Tensor TFLOPS	43.9/87.9	44.1/88.2(試算)	40.1/80.2	21.7/43.4
ピークINT8 Tensor TOPS	351.5/703	352.8/705.6(試算)	320.7/641.4	174/348
メモリ	GDDR7	GDDR6X	GDDR6X	GDDR6X
メモリ容量	16GB	16GB	12GB	8GB
メモリ速度	30Gbps	21Gbps	21Gbps	19Gbps
帯域幅	960GB/s	672GB/s	504GB/s	608GB/s
バス幅	256bit	256bit	192bit	256bit
NVENC	第9世代×2	第8世代×2	第8世代×2	第7世代×1
NVDEC	第6世代×2	第5世代×1	第5世代×1	第5世代×1
トランジスタ数	456億	459億	358億	174億
ダイサイズ	378平方mm	378.6平方mm	294.5平方mm	392.5平方mm
製造プロセス	TSMC 4nm 4N NVIDIAカスタム	TSMC 4nm 4N NVIDIAカスタム	TSMC 4nm 4N NVIDIAカスタム	Samsung 8nm 8N NVIDIAカスタム
最大GPU温度	88℃	90℃	90℃	90℃
TGP	290W	285W	285W	290W
システム要件電力	750W	700W	700W	750W
販売価格目安(発売時)	14万8,800円	11万5,800円	14万9,800円	8万9,800円