特集
10万円ちょいで4090並みの性能を謳うGeForce RTX 5070の仕様を旧世代と比較
2025年3月5日 06:11
アッパーミドルレンジに位置づけられるGPU「GeForce RTX 5070」を搭載するビデオカードが発売開始となった。NVIDIAが公表している日本国内での価格は10万8,800円となっており、今のところPalit、MSI、およびZOTACがこの価格でカードを用意しているという。
CESのタイミングで発表となったGeForce RTX 50シリーズの末っ子モデルとも言うべき存在で、GeForce RTX 5060 Ti(仮)辺りが出てくるまでは下位をしばらく担うことになるだろう。この記事ではこの5070について過去の製品と比較してみようと思う。
5070は1つ上位の「GeForce RTX 5070 Ti」と同じ“70”を冠しているものの、5070 Tiはさらにその上の「GeForce RTX 5080」と共通の456億トランジスタを搭載したGB203というダイを採用しているのに対し、5070無印では311億トランジスタのGB205というダイが使われている。
つまり、5070 Tiは当初よりハイエンドを目指して設計されたダイを採用しているのに対し、5070は当初よりアッパーミドルレンジをターゲットにしたダイを採用しているわけだ(いずれも歩留まり向上のためダイの一部を無効化しているが)。
GeForce RTX 5070を4070 SUPERと比較すると、トランジスタ数が減少しダイの規模が小さくなっているのが印象的。CUDAコアやTensorコアも減っているのは気がかりだ。アーキテクチャの進歩やメモリ帯域幅の向上、先述のマルチフレーム生成技術の対応により、ゲーム性能を補っていると予想される。
NVIDIAの発表時では、5070は4090並みの性能を549ドルで実現などとしていたが、これはもちろんネイティブの性能ではなく、マルチフレーム生成技術による“マジック”である。
【表】GeForce RTX 5070と4070 SUPER、4070、3070を比較 | ||||
---|---|---|---|---|
GPU | GeForce RTX 5070 | GeForce RTX 4070 SUPER | GeForce RTX 4070 | GeForce RTX 3070 |
CUDAコア数 | 6,144基 | 7,168基 | 5,888基 | 5,888基 |
RTコア | 第4世代 48基 93.6TFLOPS | 第3世代 66基 82TFLOPS | 第3世代 46基 67.4TFLOPS | 第2世代 46基 39.7TFLOPS |
Tensorコア | 第5世代 192基 987.8AI TOPS | 第4世代 224基 568AI TOPS | 第4世代 184基 466.4AI TOPS | 第3世代 184基 325AI TOPS |
SM数 | 48 | 56 | 46 | 46 |
TPC数 | 24 | 28 | 23 | 23 |
GPC数 | 5 | 5 | 5 | 6 |
ROP数 | 80 | 80 | 64 | 96 |
ピクセルフィルレート(Gigapixels/s) | 201 | 198(試算) | 158.4 | 165.6 |
テクスチャユニット | 192 | 224 | 184 | 184 |
テクスチャフィルレート(Gigatexels/s) | 482.3 | 554.4(試算) | 455.4 | 317.4 |
L1データキャッシュ/共有メモリ | 6,144KB | 7,168KB | 5,888KB | 5,888KB |
L2キャッシュ | 49,152KB | 49,152KB | 36,864KB | 4,096KB |
レジスタファイルサイズ | 12,288KB | 14,336KB(試算) | 11,776KB | 11,776KB |
ブーストクロック | 2.512GHz | 2.48GHz | 2.475GHz | 1.725GHz |
ベースクロック | 2.33GHz | 1.98GHz | 1.92GHz | 1.5GHz |
ピークFP32/FP16/BF16性能(non-Tensor) | 30.9 | 35.4(試算) | 29.1 | 20.3 |
ピークINT32性能(non-Tensor) | 30.9 | 17.8(試算) | 14.6 | 10.2 |
ピークFP4 Tensor TFLOPS with FP32 Accumulate | 493.9/987.8 | N/A | N/A | N/A |
ピークFP8 Tensor TFLOPS with FP16 Accumulate | 246.9/493.9 | 248(試算)/568 | 233.2/466.4 | N/A |
ピークFP8 Tensor TFLOPS with FP32 Accumulate | 123.5/246.9 | 142/248(試算) | 116.6/233.2 | N/A |
ピークFP16 Tensor TFLOPS with FP16 Accumulate | 123.5/246.9 | 142/248(試算) | 116.6/233.2 | 81.3/162.6 |
ピークFP16 Tensor TFLOPS with FP32 Accumulate | 61.7/123.5 | 71/142(試算) | 58.3/116.6 | 40.6/81.2 |
ピークBF16 Tensor TFLOPS with FP32 Accumulate | 61.7/123.5 | 71/142(試算) | 58.3/116.6 | 40.6/81.2 |
ピークTF32 Tensor TFLOPS | 30.9/61.7 | 35.5/712(試算) | 29.1/58.2 | 20.3/40.6 |
ピークINT8 Tensor TOPS | 246.9/493.9 | 248(試算)/568 | 233.2/466.4 | 162.5/325 |
メモリ | GDDR7 | GDDR6X | GDDR6X | GDDR6 |
メモリ容量 | 12GB | 12GB | 12GB | 8GB |
メモリ速度 | 28Gbps | 21Gbps | 21Gbps | 14Gbps |
帯域幅 | 672GB/s | 504GB/s | 504GB/s | 448GB/s |
バス幅 | 192bit | 192bit | 192bit | 256bit |
NVENC | 第9世代×1 | 第8世代×1 | 第8世代×1 | 第7世代×1 |
NVDEC | 第6世代×1 | 第5世代×1 | 第5世代×1 | 第5世代×1 |
トランジスタ数 | 311億 | 358億 | 358億 | 174億 |
ダイサイズ | 263平方mm | 294.5平方mm | 294.5平方mm | 392.5平方mm |
製造プロセス | TSMC 4nm 4N NVIDIAカスタム | TSMC 4nm 4N NVIDIAカスタム | TSMC 4nm 4N NVIDIAカスタム | Samsung 8nm 8N NVIDIAカスタム |
最大GPU温度 | 88℃ | 90℃ | 90℃ | 90℃ |
TGP | 250W | 220W | 200W | 220W |
システム要件電力 | 650W | 650W | 650W | 550W |
販売価格目安(発売時) | 10万8,800円 | 8万6,000円 | 10万2,080円 | 6万9,960円 |