特集

10万円ちょいで4090並みの性能を謳うGeForce RTX 5070の仕様を旧世代と比較

549ドルで4090並みの性能を謳うGeForce RTX 5070

 アッパーミドルレンジに位置づけられるGPU「GeForce RTX 5070」を搭載するビデオカードが発売開始となった。NVIDIAが公表している日本国内での価格は10万8,800円となっており、今のところPalit、MSI、およびZOTACがこの価格でカードを用意しているという。

 CESのタイミングで発表となったGeForce RTX 50シリーズの末っ子モデルとも言うべき存在で、GeForce RTX 5060 Ti(仮)辺りが出てくるまでは下位をしばらく担うことになるだろう。この記事ではこの5070について過去の製品と比較してみようと思う。

 5070は1つ上位の「GeForce RTX 5070 Ti」と同じ“70”を冠しているものの、5070 Tiはさらにその上の「GeForce RTX 5080」と共通の456億トランジスタを搭載したGB203というダイを採用しているのに対し、5070無印では311億トランジスタのGB205というダイが使われている。

 つまり、5070 Tiは当初よりハイエンドを目指して設計されたダイを採用しているのに対し、5070は当初よりアッパーミドルレンジをターゲットにしたダイを採用しているわけだ(いずれも歩留まり向上のためダイの一部を無効化しているが)。

 GeForce RTX 5070を4070 SUPERと比較すると、トランジスタ数が減少しダイの規模が小さくなっているのが印象的。CUDAコアやTensorコアも減っているのは気がかりだ。アーキテクチャの進歩やメモリ帯域幅の向上、先述のマルチフレーム生成技術の対応により、ゲーム性能を補っていると予想される。

 NVIDIAの発表時では、5070は4090並みの性能を549ドルで実現などとしていたが、これはもちろんネイティブの性能ではなく、マルチフレーム生成技術による“マジック”である。

【表】GeForce RTX 5070と4070 SUPER、4070、3070を比較
GPUGeForce RTX 5070GeForce RTX 4070 SUPERGeForce RTX 4070GeForce RTX 3070
CUDAコア数6,144基7,168基5,888基5,888基
RTコア第4世代 48基 93.6TFLOPS第3世代 66基 82TFLOPS第3世代 46基 67.4TFLOPS第2世代 46基 39.7TFLOPS
Tensorコア第5世代 192基 987.8AI TOPS第4世代 224基 568AI TOPS第4世代 184基 466.4AI TOPS第3世代 184基 325AI TOPS
SM数48564646
TPC数24282323
GPC数5556
ROP数80806496
ピクセルフィルレート(Gigapixels/s)201198(試算)158.4165.6
テクスチャユニット192224184184
テクスチャフィルレート(Gigatexels/s)482.3554.4(試算)455.4317.4
L1データキャッシュ/共有メモリ6,144KB7,168KB5,888KB5,888KB
L2キャッシュ49,152KB49,152KB36,864KB4,096KB
レジスタファイルサイズ12,288KB14,336KB(試算)11,776KB11,776KB
ブーストクロック2.512GHz2.48GHz2.475GHz1.725GHz
ベースクロック2.33GHz1.98GHz1.92GHz1.5GHz
ピークFP32/FP16/BF16性能(non-Tensor)30.935.4(試算)29.120.3
ピークINT32性能(non-Tensor)30.917.8(試算)14.610.2
ピークFP4 Tensor TFLOPS with FP32 Accumulate493.9/987.8N/AN/AN/A
ピークFP8 Tensor TFLOPS with FP16 Accumulate246.9/493.9248(試算)/568233.2/466.4N/A
ピークFP8 Tensor TFLOPS with FP32 Accumulate123.5/246.9142/248(試算)116.6/233.2N/A
ピークFP16 Tensor TFLOPS with FP16 Accumulate123.5/246.9142/248(試算)116.6/233.281.3/162.6
ピークFP16 Tensor TFLOPS with FP32 Accumulate61.7/123.571/142(試算)58.3/116.640.6/81.2
ピークBF16 Tensor TFLOPS with FP32 Accumulate61.7/123.571/142(試算)58.3/116.640.6/81.2
ピークTF32 Tensor TFLOPS30.9/61.735.5/712(試算)29.1/58.220.3/40.6
ピークINT8 Tensor TOPS246.9/493.9248(試算)/568233.2/466.4162.5/325
メモリGDDR7GDDR6XGDDR6XGDDR6
メモリ容量12GB12GB12GB8GB
メモリ速度28Gbps21Gbps21Gbps14Gbps
帯域幅672GB/s504GB/s504GB/s448GB/s
バス幅192bit192bit192bit256bit
NVENC第9世代×1第8世代×1第8世代×1第7世代×1
NVDEC第6世代×1第5世代×1第5世代×1第5世代×1
トランジスタ数311億358億358億174億
ダイサイズ263平方mm294.5平方mm294.5平方mm392.5平方mm
製造プロセスTSMC 4nm 4N NVIDIAカスタムTSMC 4nm 4N NVIDIAカスタムTSMC 4nm 4N NVIDIAカスタムSamsung 8nm 8N NVIDIAカスタム
最大GPU温度88℃90℃90℃90℃
TGP250W220W200W220W
システム要件電力650W650W650W550W
販売価格目安(発売時)10万8,800円8万6,000円10万2,080円6万9,960円