ニュース

NVIDIA、GeForce RTX 20シリーズの詳細を明らかに

～安全な自動オーバークロック機能「NVIDIA Scanner」や従来のSLIと互換性をもったNVLink

笠原一輝

2018年9月14日 22:00

NVIDIAが9月20日に販売を開始するGeForce RTX 20シリーズ、左からGeForce RTX 2070、GeForce RTX 2080 Ti、GeForce RTX 2080

　NVIDIAは、9月20日に販売開始するGeForce RTX 20シリーズの詳細を明らかにした。NVIDIAはGeForce RTX 20シリーズのアーキテクチャ、新しいオーバークロック機能「NVIDIA Scanner」の概要やそのデモ、さらにはSLIとの関係性が注目を浴びたNVLinkによるマルチGPU機能などについて説明した。

　GeForce RTX 20シリーズは、新しいNVLinkのSLIにより帯域幅が大きく引き上げられ、より高解像度やHDRといった環境で利用できるようになるほか、従来のSLIとソフトウェア的な互換性があるとする。

Tensorコア、RTコアが追加されている新しいGeForce RTX 20シリーズのSM

　NVIDIA GPUエンジニアリング担当上級副社長ジョナ・アルベン氏は、GeForce RTX 20シリーズのアーキテクチャを説明した。GeForce RTX 20シリーズは、コンカレントの浮動小数点演算と整数演算の実行ユニットから構成されており、従来の世代に比較してL1キャッシュの容量が増え(前世代に比べて最大2.7倍)、TensorコアとRTコアという新しい演算器が追加されていることが特徴となる。

　また、メモリは既報のとおりGDDR6に対応しており、従来世代に比べて最大で50%程度、メモリ帯域の効率が改善している。最上位モデルとなるGeForce RTX 2080 Ti(TU102)ではこのSMが72基ある構造となっている。

NVIDIA GPUエンジニアリング担当上級副社長ジョナ・アルベン氏

GeForce RTX 2080 Ti(TU102)の基本構造

SMの構造

Pascal世代とのシェーダーエンジンの性能比較、おおむね1.5倍程度

GDDR6が導入され効率が上昇している

　新しく追加されたTensorコアは、3つあるダイ(TU102、TU104、TU106)というダイのうち最上位モデルでは114TOPS(FP16時)、228TOPS(INT8)、445TOPS(INT4)という性能を備えている。またRTコアでは既報のとおり10G Rays/秒超の処理が可能になっており、従来世代のGeForce GTX 1080 Tiの1.1G Rays/秒に比べて約10倍の性能を備えている。

　GeForce RTX 20シリーズでは、こうしたSMに内蔵されているシェーダー、Tensorコア、RTコアを利用して1フレームの間に複数の演算器を利用して演算していくことで、従来よりも圧倒的に表現力が高い3D画面をレンダリングすることが可能になる。

Tensorエンジン

RTコア

　ディスプレイ出力は最大で最大で8K/60HzのHDRまで対応しており、HDRの出力を行なう場合にも低遅延での出力が可能になる。DisplayPortの最新規格であるDisplayPort 1.4aに対応している。HDCP 2.2およびHDMI 2.0bに対応しており、HDCP 2.2とHDM 2.0b以降が必要になる著作権保護された動画なども利用することができる。

　また、GPUダイにUSB 3.1 Gen2のコントローラを統合しており、VirtualLinkと呼ばれるUSB Type-Cケーブル1本で、VR HMDにディスプレイ出力、データ、さらには電力(27W)まで供給できる規格が利用できる。

　エンコーダやデコーダの性能も強化されており、エンコーダは最大でHEVC 8K30fpsをリアルタイムにエンコードできる。デコーダはVP9は10/12b HDRを、HEVC 444は10/12 HDRをとそれぞれ12bitのHDRをまでデコードすることが可能だ。

ディスプレイ

エンコーダ・デコーダ

　NVIDIA コンテンツ・技術担当上級副社長トニー・タマシ氏はNVIDIAがGeForce GTX 20シリーズで新しく導入するDLSSについて説明した。DLSSは、いわゆるアンチエイリアシングに、AIを活用する手法で、NGXというクラウド側で学習したデータをクライアント側にフィードバックする仕組みが用意されており、AIによりさまざまな補正を行なう。

　従来の手法に比べてシェーダなどの処理に負荷をかけないため、表示品質を従来と同じにすれば、より高いフレームレートを実現することができる。発表時点では15のゲームでの対応が決まっており、今後対応するタイトルが増加する予定とのことだ。

NVIDIA コンテンツ・技術担当上級副社長トニー・タマシ氏

NGX

AIを利用したDLSS

DLSSを利用した場合の性能

対応予定の15のゲーム

新オーバークロック機能のNV ScannerはGPU個体の限界を自動で確認して最適なレンジにオーバークロック

　NVIDIA GeForceデスクトップ製品管理担当部長ジャスティン・ウォーカー氏は、オーバークロック版として提供されるFounders Editionについての説明を行なった。

　Founders Editionは標準版に加えて、2つの13ブレード(羽)を持つファンを備えており、2倍のチャンバーを持つヒートシンクを備えているほか、最大で8フェーズの電源供給ユニットを備えており、負荷に応じて増減することで負荷が低いときには電力効率を高め、オーバークロック時など負荷が高いときには高い性能を発揮できるように工夫されている。

　これにより、GeForce RTX 2080は、GeForce GTX 1080に比較してオーバークロック時に5分の1の静かさを実現している。

NVIDIA GeForceデスクトップ製品管理担当部長ジャスティン・ウォーカー氏

すでに発表されているGeForce RTX 2080の性能

Founders Editionの放熱機構

GeForce RTX 2080は、GeForce GTX 1080に比較してオーバークロック時に5分の1の静かさを実現

　NVIDIA 上級エンジニアトム・ピーターソン氏は、GeForce RTX 20シリーズのオーバークロック機能とNVLinkを利用したSLI機能について説明した。

　NVIDIAのGPUには従来からもオーバークロック用のAPIが用意されており、AICパートナーやサードパーティのソフトウェアベンダーはこのAPIを利用してソフトウェアによるオーバークロック機能を実現できていた(GPU Boostと呼ばれている)。

　ピーターソン氏によれば「GPU BoostはそのGPU単体の周波数のオフセット値がどの程度あるかが重要になる。そのオフセット値を超える設定にしてしまえばシステムはクラッシュしてしまう」と、従来のGPU Boostにはその歯止めをかける機能がなかったため、ユーザーがGPU個体の限界値を超える設定にしてしまった場合にはシステムがクラッシュ(動作が停止したりリセットしたり)してしまう可能性があったとした。

NVIDIA 上級エンジニアトム・ピーターソン氏

オーバークロックのオフセット値を探る作業は難しい

APIとしてNVIDIA Scannerが導入される

　そこで今回、NVIDIA Scannerという新しいAPIを追加したという。ピーターソン氏によれば「GPUの表示部分には影響を与えないように、テストアルゴリズムを利用して数値演算を行なう。これによりクロックを上げていっても、99%の確率でシステムはクラッシュせずに限界を探し当てることができる」と述べ、テストの結果を利用してその限界点よりも低いところでGPU Boostを利用し、安定的にオーバークロックができるようになるとした。

　アンダーソン氏によればテストは15～20分程度かかるということだが、そのデータをデータベースに記録していき、後で確認することができるということだ。ユーザーは放置してその間にコーヒーでも飲んでいれば、後で結果がわかり、かつ安定してオーバークロックを狙うことができるので、なかなか便利な機能と言えるだろう。

　なお、このAPIはAICパートナーなどに対して公開されており、EVGA、ASUS、GIGA-BYTE、MSIなどが提供していく計画だとピーターソン氏は説明した。会場で行なわれたデモでは、1,500MHzあたりから初めて、じょじょに上がっていき最終的に2,130MHzまで到達したところで、演算にエラーが発生し、終了となった。

NVIDIA Scannerのデモ。1,470MHzからだんだんと2GHz近くまで上げられていく

2,130MHzまで上昇

1,500MHzへと戻る

高解像度に対応できる広帯域幅が特徴のNVLink、ソフトウェア的にはSLIと互換

　すでに発表されているとおり、GeForce GTX 20シリーズでは、従来までのSLIに変わって新しくNVLinkブリッジというマルチGPUの機能が導入される。NVLinkはサーバー向けのTeslaを複数つなぐソリューションとして導入されており、上位版のNVSwitchを利用すると最大16基のGPUを接続して1つのGPUとして利用することができる。

　もちろんGeForceにはそうしたソリューションは用意されず、GeForceのNVLinkでは最大2枚まで接続が可能な仕様になっている。ピーターソン氏によれば「従来のSLIシングルブリッジで1GB/s、Pascalで導入されたSLI HBブリッジで4GB/sが実現された。それに対してGeForce RTX 2080では50GB/s、GeForce RTX 2080 Tiでは100GB/sの帯域が実現されており、8Kや8Kサラウンドでも利用することができる」と、対応できる解像度が大きくなることが、NVLinkベースのブリッジのメリットだとした。

NVLinkによりより高い解像度でSLIが可能に

　なお、今回変わったのはハードウェアレイヤーとしてNVLinkが導入されたので、ソフトウェアレイヤーは従来のSLIと完全に互換性がある。つまり、従来のSLIに対応したゲームはそのままNVLinkでもSLIとして利用できる。このため、ソフトウェアベンダーはSLIに対応させる必要もなくそのまま使えることができるので、すでにSLIに対応したゲームを多数持っているユーザーも心配する必要はない。