ニュース

GeForce RTX 3080はどうやって2倍の性能を達成したのか

多くのゲームで2倍の性能を実現したGeForce RTX 3080

 米NVIDIAは1日(現地時間)の深夜に、新しいAmpereアーキテクチャを採用したGeForce RTX 30シリーズを発表した。

 GeForce RTX 30シリーズは旧世代のGeForce RTX 20シリーズと比較して、同一SKUで最大で2倍の性能を実現。下位のGeForce RTX 3070でも従来の最上位にあたるGeForce RTX 2080 Ti以上の性能を発揮するという、2世代をまたぐほどの飛躍を達成。海外のPC関連のユーザーコミュニティではこのところGeForce RTX 30シリーズの高性能に関する話題で持ち切りだ。

 このGeForce RTX 30シリーズの圧倒的な性能はどこから来ているのか。これは4日(日本時間)にメディア向けに開催された「GeForce RTX 30-Series Tech Sessions」で明らかになった。

ほぼあらゆる数字が2倍に

 Ampereアーキテクチャでは、GPUを構成する最小単位であるStreaming Multiprocessor(SM)から改良が加えられている。新設のデータパスにより、1クロックに128FMA(融合積和演算)が可能になり、FP32性能が2倍となった。また、L1のバンド幅が2倍となり、容量は33%増加、キャッシュのパーティションサイズが2倍となっている。

 リアルタイムレートレイシングをハードウェアで高速化するRTコアでは、三角形との交差を計算する速度が2倍となり、新たに時間ベースで位置補完する機能が加わった。これにより、光線が物体にあたったさいに時間の要素を加えることが可能になり、モーションブラーを8倍高速に処理できるようになったという。

SMの改良。多くの数字が2倍になっている
新たにInterpolate tri position(time)機能が加わり、モーションブラーの処理を8倍高速化させた

 そしてTensorコアは、スパコン向けに発表された「GA100」と同様スパース(疎)ネットワークに対応した。SMあたりのTensorコアは8基から4基に半減しているが、FP16 FMA実行性能は倍とし、1SMあたりの合計性能は同等、スパース時は2倍の性能を達成した。

 Ampereではさらに、RTコアとTensorコアが並列で動作できるようになり、フレームの描画時間をさらに短縮。これによりフレームレートを向上させている。

 もっとも、GeForce RTX 30シリーズではこういった小さな数字よりも、全体的な数字を見たほうがインパクトがある。というのもSM数がGeForce RTX 2080 SUPERの48基から68基となり、CUDAコア数が3,072から8,704基、シェーダーの演算性能が11TFLOPSから30TFLOPSに飛躍しているからだ。これは12nm FFNから8Nプロセスに微細化した影響が一番大きいと言っていいだろう。

Tensorコアはスパースネットワークへ対応した
RTコアとTensorコアが並列動作できるようになり、フレームの描画時間をさらに短縮
GeForce RTX 2080からあらゆるスペックで向上した

 GeForce RTX 20シリーズはTSMCの12nm FFNプロセスを採用していたが、これはGeForce GTX 10シリーズの16nm FinFETの派生プロセス。一方今回のSamsung 8Nプロセスは、10nmをベースとしたNVIDIAカスタムとなっている。よって、かつてGeForce GTX 980がGTX 1080になった衝撃以上のインパクトはあって然るべきだとも言える。

初の「8K対応」を謳うGeForce RTX 3090

 発売はもう少し先だが、GeForce RTX 3090は世界初の「8K対応」GPUとしてリリースされる。ディスプレイとケーブル1本で接続すればOKなHDMI 2.1への対応はもちろんのことだが、8Kでゲームをするということはどういうことなのか、もう少し詳しい解説がなされた。

 8K解像度は、フルHDのじつに16倍ものピクセル数にもなり、たとえそれがフラグシップのGeForce RTX 3090とてたやすく駆動できるものではない。3090ではネイティブで「Apex Legends」、「Destiny 2」、「Forza Horizon 4」、「Rainbow 6 Siege」、「Rocket League」、「World of Tanks」、「World of Warcraft」といったタイトルを60fps以上で動作させられるが、なかにはそのままでは厳しいタイトルもある。

 そこでNVIDIAはDLSS 2.0の使用を提唱している。もちろんDLSS 2.0対応タイトルでないと意味がないのだが、DLSS 2.0を使えば60fps以上でプレイできるというわけだ。

 8KにおいてDLSS 2.0を使った場合、レンダリング元の解像度は2,560×1,400ドットで、ネイティブ解像度とのあいだには9倍もの差が存在する。NVIDIAでは空間分析を用いたAIモデルでDLSSを強化し、この解像度差を埋めているという。

8KのDLSS。レンダリング元の解像度は2,560×1,400ドットで、8Kとは大きな開きがあるため、空間分析を用いたAIモデルでDLSSを強化した
一部ゲームはDLSSによって60fps超えを実現する

 また、GeForce RTX 3090では8Kに対応したAV1ハードウェアデコーダを内蔵しており、CPU使用率を抑えながら60fpsで8K動画を再生できるという。すでにGoogle Chrome、YouTube、Windows 10とMicrosoft Edge、VideoLANが、GeForce RTX 3090のAV1デコーダへの対応を表明している。

AV1デコーダの対応