特集
GeForce RTX 3070 Tiユーザーは買い替えるべき?本日発売のGeForce RTX 5070 Tiと比較
2025年2月20日 06:17
この記事では、ハイエンドである「GeForce RTX 5070 Ti」を、従来モデルである「GeForce RTX 4070 Ti SUPER」、「GeForce RTX 4070 Ti」および「GeForce RTX 3070 Ti」とで仕様を比較してみたいと思う。
日本国内での参考価格が14万8,800円と決して安くはないのだが、ビデオメモリが上位の5080と同じ16GB搭載されていることもあり、ゲームのみならず生成AIも試すユーザーにとって最適だろう。同様に16GBのメモリを搭載した「GeForce RTX 4070 Ti SUPER」が一定の人気を得ていたことを考えれば、50シリーズで主力になりそうな雰囲気だ。
こうして並べて見ると、4070 Tiがメモリ周りで同じ70 Tiシリーズの中でもスペック的に見劣る印象。この“汚名返上”をしたのが4070 Ti SUPERであるが、5070 Tiはそこからきっちりスペック向上しているのが偉い(値段が高くなったのは残念だが)。
なお、NVIDIAは4070 Ti SUPERの一部仕様を比較表で公開していないので、筆者の試算として入れてある。
【表】GeForce RTX 5070 Tiと4070 Ti SUPER、4070 Ti、3070 Tiを比較 | ||||
---|---|---|---|---|
GPU | GeForce RTX 5070 Ti | GeForce RTX 4070 Ti SUPER | GeForce RTX 4070 Ti | GeForce RTX 3070 Ti |
CUDAコア数 | 8,960基 | 8,448基 | 7,680基 | 6,144基 |
RTコア | 第4世代 70基 133.2TFLOPS | 第3世代 66基 102TFLOPS | 第3世代 60基 92.7TFLOPS | 第2世代 48基 42.5TFLOPS |
Tensorコア | 第5世代 280基 1,406AI TOPS | 第4世代 264基 706AI TOPS | 第4世代 240基 641.4AI TOPS | 第3世代 192基 348AI TOPS |
SM数 | 70 | 66 | 60 | 48 |
TPC数 | 35 | 33 | 30 | 24 |
GPC数 | 6 | 6 | 5 | 6 |
ROP数 | 96 | 96 | 80 | 96 |
ピクセルフィルレート(Gigapixels/s) | 235.4 | 250.56(試算) | 208.8 | 169.9 |
テクスチャユニット | 280 | 264 | 240 | 192 |
テクスチャフィルレート(Gigatexels/s) | 686.6 | 689 | 626.4 | 339.84 |
L1データキャッシュ/共有メモリ | 8,960KB | 8,448KB | 7,680KB | 6,144KB |
L2キャッシュ | 49,152KB | 49,152KB | 49,152KB | 4,096KB |
レジスタファイルサイズ | 17,920KB | 16,898KB(試算) | 15,360KB | 12,288KB |
ブーストクロック | 2.452GHz | 2.61GHz | 2.61GHz | 1.575GHz |
ベースクロック | 2.3GHz | 2.34GHz | 2.31GHz | 1.77GHz |
ピークFP32/FP16/BF16性能(non-Tensor) | 43.9 | 44.1(試算) | 40.1 | 21.7 |
ピークINT32性能(non-Tensor) | 43.9 | 22(試算) | 20 | 10.9 |
ピークFP4 Tensor TFLOPS with FP32 Accumulate | 900.4/1,801 | N/A | N/A | N/A |
ピークFP8 Tensor TFLOPS with FP16 Accumulate | 450.2/900.4 | 352.8/705.6(試算) | 320.7/641.4 | N/A |
ピークFP8 Tensor TFLOPS with FP32 Accumulate | 225.1/450.2 | 176.4/352.8(試算) | 160.4/320.8 | N/A |
ピークFP16 Tensor TFLOPS with FP16 Accumulate | 225.1/450.2 | 176.4/352.8(試算) | 160.4/320.8 | 87/174 |
ピークFP16 Tensor TFLOPS with FP32 Accumulate | 112.6/225.1 | 88.2/176.4(試算) | 80.2/160.4 | 43.5/87 |
ピークBF16 Tensor TFLOPS with FP32 Accumulate | 112.6/225.1 | 88.2/176.4(試算) | 80.2/160.4 | 43.5/87 |
ピークTF32 Tensor TFLOPS | 43.9/87.9 | 44.1/88.2(試算) | 40.1/80.2 | 21.7/43.4 |
ピークINT8 Tensor TOPS | 351.5/703 | 352.8/705.6(試算) | 320.7/641.4 | 174/348 |
メモリ | GDDR7 | GDDR6X | GDDR6X | GDDR6X |
メモリ容量 | 16GB | 16GB | 12GB | 8GB |
メモリ速度 | 30Gbps | 21Gbps | 21Gbps | 19Gbps |
帯域幅 | 960GB/s | 672GB/s | 504GB/s | 608GB/s |
バス幅 | 256bit | 256bit | 192bit | 256bit |
NVENC | 第9世代×2 | 第8世代×2 | 第8世代×2 | 第7世代×1 |
NVDEC | 第6世代×2 | 第5世代×1 | 第5世代×1 | 第5世代×1 |
トランジスタ数 | 456億 | 459億 | 358億 | 174億 |
ダイサイズ | 378平方mm | 378.6平方mm | 294.5平方mm | 392.5平方mm |
製造プロセス | TSMC 4nm 4N NVIDIAカスタム | TSMC 4nm 4N NVIDIAカスタム | TSMC 4nm 4N NVIDIAカスタム | Samsung 8nm 8N NVIDIAカスタム |
最大GPU温度 | 88℃ | 90℃ | 90℃ | 90℃ |
TGP | 290W | 285W | 285W | 290W |
システム要件電力 | 750W | 700W | 700W | 750W |
販売価格目安(発売時) | 14万8,800円 | 11万5,800円 | 14万9,800円 | 8万9,800円 |