イベントレポート

あらゆる場面でAIを積極的に活用するGeForce RTX 50シリーズ

 NVIDIAは、CES 2025にあわせて発表したコンシューマ向けGPU「GeForce RTX 50」シリーズに関する報道関係者向け技術解説イベントを開催した。本稿ではその模様をまとめてお届けする。

AIの力でグラフィックスを引き上げる機能が多数登場

 RTX Blackwellでは、グラフィックスAPIのCompute ShaderからTensorコアを利用できるようになったことで、従来からのProgrammable ShaderにAIを組み合わせたRTX Neural Shadersを導入した。AIの力を使うことで、グラフィックスの品質やライティングの表現などを引き上げられるとする。

 あわせて、Tensor Coreを使ったNeural Renderingをクロスプラットフォームで実現するため、Microsoftと共同でDirectX用のAPI「Cooperative Vectors」を開発したことも明らかにした。

RTX Neural Shadersを導入
RTX Neural Shaders。Microsoftと協業し、DirectX向けAPIの開発も

 たとえばマテリアルでは、フィルムレンダリング並みのアセットをリアルタイムグラフィックスで使えるようにするRTX Neural Materialsを投入。複数のレイヤーで構成される複雑なシェーダーコードをAIで圧縮し、処理を大幅に高速化する。また、テクスチャをAIで圧縮するRTX Neural Texture Compressionも用意する。

RTX Neural Meterials
左が通常のマテリアル、右がNeural Materials

 ライティングに関しては、RTX Neural Radiance Cacheが登場。光線をパストレースする際に、最初の1〜2回目以降のバウンスをAIが推測することで、ゲームパフォーマンスを落とすことなく、より正確に間接光を表現できる。

 加えて、光を透過するオブジェクトの表現品質を高めるRTX Skinも用意。レイトレーシングを使った表面化散乱アルゴリズムを実装したもので、人間の皮膚など光が透過するオブジェクトの表現品質を引き上げられる。

RTX Neural Radiance Cache
RTX Skin
RTX Neural Radiance Cache、左が無効時、右が有効時

 そのほかにも、不気味の谷を越えるほどの自然な人間の顔をレンダリングできるというRTX Neural Faces、クラスタベースのジオメトリシステムにおけるBVH構築を高速化し、レイトレーシングシーンのパフォーマンスを改善するRTX Mega Geometryなども機能として追加される。

RTX Neural Faces
髪の毛を少ない容量で描けるようにするLinear Swept Spheres
RTX Mega Geometry
RTX Mega Geometryによる効果(無効時)
有効時

DLSS 4

DLSS 4はTransformerを採用して性能アップ

 今回新しくなったDLSS 4では、モデルのタイプを従来のCNN(畳み込みニューラルネットワーク)からTrasnformerへと変更。より大規模なデータセットを使ったトレーニングが可能となり、計算効率も向上しており、従来のDLSSと比べて4倍の演算能力を実現したという。これによりたとえばRay Reconstructionでは、ちらつきやゴーストを抑えることに成功している。

CNNモデルとTransformerモデルの比較。Transformerの方が品質が高いことが分かる

 新たに加わるMulti Frame Generationは、従来のFrame Generationを強化した機能で、1つのフレームから生成できるフレーム数が3まで引き上がった。生成フレームの増加にともなうフレーム表示のばらつきを抑えるための機能として、Flip Meteringと呼ばれるものも設け、適切なタイミングでフレームが表示されるよう調整も行なっているという。

 DLSS 4による効果は絶大で、4K/240Hzのゲームプレイのケースでは、DLSSオフのときと比べて最大8倍のパフォーマンス差があると説明している。本機能は75のゲームでRTX 50シリーズ発売日より利用可能となる予定。NVIDIAアプリ上からはゲーム側の設定をオーバーライドするオプションも選べるようになるという。

 なお、Transformerモデルの導入などによる品質や性能向上といった恩恵の一部は、GeForce RTX 20/30/40シリーズGPUでも受けられる。

Multi Frame Generation
DLSS Super Resolutionなどと組み合わせると、実質的に16ピクセル中15ピクセルはAIが生成している計算に
フレームの表示タイミングを制御するFlip Metering。無効時(グレー)に比べ、有効時(緑)の方がばらつきがない
DLSS 4による効果。フレームレートが劇的に上がるとしている
各GeForce RTXシリーズとDLSS 4の対応表。一部の機能は旧GPUでも使える

Reflex 2

レイテンシを

 Reflex 2では、新たにFrame Warpと呼ばれる機能が加わった。マウスの入力がCPUに受け取られてから新しいフレームが表示されるまでにかかる時間を短縮する技術になる。

 通常、プレイヤーが敵を狙って撃とうとすると、マウスの入力がCPUに受け取られ、計算結果に基づいて新しいフレームがGPUにレンダリングされ、画面に表示されるという過程を経る。

 Frame Warpでは、まず、通常通りマウス入力の計算結果に沿って、GPUがフレームのレンダリングを開始する。ただし、レンダリング中もCPUはマウス入力に基づいてカメラの位置を計算していて、レンダリングが完了してモニターに表示する直前の段階では、でき上がったフレームのカメラ位置と、最新の入力に基づくカメラ位置にはズレが生じることになる(フレームの方が古い)。

 そこで、でき上がったフレームを最新のカメラ位置に合うように歪めて表示することで、最新の入力を画面にすばやく反映し、遅延を抑えようというのがFrame Warpの仕組みだ。当然、カメラ位置を調整した際にレンダリングされていない部分が出てくるのだが、その部分は過去のフレームなどを参照してインペインティングすることで、映像として破綻していないように見せている。

 THE FINALSおよびVALORANTで対応予定となっており、VALORANTの場合ではレイテンシを2〜3ms程度にまで抑えられると説明している。

画像左は、武器を持つ手の左側などに白い部分がある。ここがフレームを歪めたことでできた空白部分で、Reflex 2では画像右のように空白をインペインティングして補完している
THE FINALSやVALORANTで利用可能になる予定

Neural Renderingを想定したRTX Blackwellアーキテクチャ

RTX Blackwell

 NVIDIA GPUコアの基本単位とも言えるSM(Streaming Multiprocessor)については、Neural Shaderの利用に向けて、従来2つに分かれていたShader Core部分を1つに統合。帯域幅とスループットを引き上げるなど最適化を図った。加えて、Neural ShaderからのさまざまなワークロードをTensore CoreとShader Coreに適切に振り分けられるよう、Shader Execution Reordering(SER)にも改良を施した。

 メモリは新たにGDDR7を採用。GDDR6と比べて2倍のデータレートを半分の電力で実現する。信号方式がPAM4からPAM3となり、高い周波数を低電圧で動作できる点が電力効率の良さにつながっているという。

BlackwellのSMの設計。Shader Core部分が改良された
ワークロードを適切に振り分けるSER

 第4世代RT Coreでは、RTX Mega Geometryに向けた変更を実施。クラスタを効率的に処理できるTriangle Cluster Intersection EngineおよびDecompression Engine、Linear Swept Spheresが加わった。これによって、三角形の交差判定レートは前世代比で2倍としつつ、メモリフットプリントを25%縮小した。

 第5世代Tensor Coreについては、Nerural Renderingを想定し、精度、同時実行、メモリ使用量の3つを考慮した結果、FP4をネイティブサポートすることで実効的なAIスループットを向上。前世代で採用していたFP8と比べるとスループットやパフォーマンスを引き上げつつ、モデルサイズは小型化できるため、GDDR7のメリットも受けやすくなったという。

 一方で、AIモデルの同時実行することによるスケジューリングの問題を解消するため、AI Management Processor(AMP)と呼ばれる特殊なプロセッサを用意した。

GDDR7メモリを採用
第4世代RT Coreには新機能も搭載
第5世代Tensor Coreはスループットを向上
AI Management Processor

 それ以外にも、モバイル製品などで重要になる電力効率については、パワーゲーティング周りの改良や、より細かな周波数スイッチングへの対応などによって改善。そのほか、DisplayPort 2.1 UHBR20やAV1 UHQコーデックのサポートなど、映像周りの最新規格への対応が進められている。

誰もがAI開発を始められる時代へ

ローコード/ノーコードでもAI開発できる「NVIDIA NIM for RTX」

NVIDIA NIM for RTX

 AI関連では、RTXシリーズGPUを搭載するAI PC向けに最適化した生成AI用のマイクロサービス「NVIDIA NIM for RTX」を展開する。コミュニティで多く使われているものや同社が開発したものなど、さまざまなAIモデルをパッケージ化して提供しており、AIアプリケーションなどに簡単に組み込んで、ローカルPCやクラウド上などあらゆる場所に展開できる。

 量子化をはじめとしたAIモデルの最適化、ライブラリなどのドメイン固有コード、RTX GPUに最適化した推論バックエンド、カスタマイズ性、業界標準のAPI群、事前構築済みコンテナといった点を特徴とする。こういった項目は通常、開発者がAIモデルごとに対処する必要のある複雑なポイントだが、NIM for RTXによってそういった手間を省けるため、開発者はどこでもすぐに展開できるようになるという。

 サービスの第1弾は2月より提供を予定。言語処理や画像生成などさまざまな種類を用意しており、以降も順次追加していくという。

2月からサービスの第1弾を提供予定

 また、NIM for RTXはローコード/ノーコード開発ソリューションとの互換性も確保しており、CrewAI、ComfyUI、FlowiseAI、Langflowといったツールで利用可能。加えて、チャットベースのAnythingLLM、LM Studio、NVIDIA ChatRTXといったツールにも対応する。こういったツールの活用により、あらゆるユーザーがAI開発者になることができるとしている。

言語処理や画像生成など、さまざまな種類を用意する
NIM for RTXはWindows Subsystem for Linux上で動作する

高度なAIアプリを簡単に試せる「NVIDIA AI Blueprints for RTX」

NVIDIA AI Blueprints for RTX

 このNIM for RTXによるマイクロサービスを複数組みあわせ、より高度なAIワークフローを実現することももちろん可能だ。あわせて発表した「NVIDIA AI Blueprints for RTX」は、NIM for RTXを組み合わせて作ったAIワークフローのサンプルプロジェクトのようなものになる。

 ソースコード、サンプルデータ、サンプルアプリ、カスタマイズ用ツールなどが揃ったセットで、AIワークフローをすぐに実行して試したり、それをベースに新たな機能を拡張したりできる。今回NVIDIAでは例として、「PDF to Podcast」と「Digital Human」の2つを紹介した。

 PDF to Podcastは、PDFファイルを読み込ませると、その内容を解釈し、Podcast番組(ラジオ番組)風の音源に変換してくれるもの。2人の話者がトークをしながら、PDFの内容を説明してくれるような音源が生成される。

PDF to Podcast
PDFを読み込ませると、Podcast番組の音源に変換して出力してくれる

 Digital Humanは、キャラクターUIを通じたAIエージェントを実現するもの。話しかけると会話をしたり、質問に答えてくれたりするほか、アプリ上での操作の支援、Teams会議への参加、文章の解釈や要約にも対応できる。

Digital Human
Introducing Project R2X | A Preview of a RTX-Powered Digital Human Interface

人間の意志決定すら再現する「NVIDIA ACE」

 NVIDIA ACEは、当初はゲーム内で自由にプレイヤーと会話できるNPCの作成を目標として進められていたプロジェクトだったが、現在ではNPCをプレイヤーにより近づけることを目指しているという。それに向けて、人間のプレイヤーが行なう意志決定の再現を試みた。

人間の意志決定プロセス
上記のプロセスをNVIDIA ACEに落とし込んだ

 人間の意志決定は、知覚→認識→行動とステップが進むが、ただ単純に反応してくのではなく、それらの基板に記憶が結びついている。たとえば過去にどういったものを見た/聞いたか、どう考えていたかといった記憶を鑑みて反応をしている。

 NVIDIA ACEでは、こういった構図を再現するAIモデルを作成。まず、音声認識と視覚認識モデルを通じて状況を知覚する。その情報を小規模言語モデルに渡し、行動の計画を考え、発する言葉や取るアクションなどの指示を生成。最後にアニメーション関連の生成AI技術を使って、キャラクターの外観などを表現する。

NVIDIA ACEを使ったゲームのデモも。ユーザーの言葉を認識し、ゲーム内でそれに応じたアクションを起こす

 また、テキストプロンプトから3Dアニメーションを作り出す「ACE AI Body Motion」も発表。膨大なモーションキャプチャデータに基づいてトレーニングされており、高品質な2足歩行の身体動作を生成する。キーポーズやキーフレームを設定し、その間の動きを生成するといったことも可能で、アニメーターのアニメーション作成を支援する。

ACE AI Body Motion
テキストプロンプトを通じて3Dモーションを生成できる

AIアシスタントの「Project G-Assist」がNVIDIAアプリに搭載へ

Project G-Assistが正式リリース

 COMPUTEX 2024で同社が発表していたAIアシスタント「Project G-Assist」が、2月にNVIDIAアプリへ搭載予定であることも明らかにされた。

 音声またはテキストで使えるAIアシスタントで、ゲームの起動や画面録画、ドライバの更新、ゲームパフォーマンスの最適化や分析、周辺機器のLEDコントロールやファンの制御などを手助けしてくれる。APIも提供される予定で、パートナーメーカー製デバイスの制御なども可能になる見込み。

クリエイター向けの機能もさまざま追加

3D Guided Generative AI Blueprint

 クリエイター向け用途の観点では、NVIDIA NIMから「3D Guided Generative AI Blueprint」を紹介した。Blender上の3Dシーンをベースとした画像を生成できるものになる。ビューポートの情報からデプスマップを取得し、テキストプロンプトとあわせて入力することで、狙った画像をAIで生成する。

 また、4:2:2 10bitカラーをサポートした点についても紹介。民生用のカメラでも4:2:2に対応する機器が増える中、GeForce RTX 50シリーズではハードウェアデコード/エンコードをサポート。CPUと比べてエンコードが最大11倍高速化したほか、最大9つの4K/60fps 4:2:2 10bitストリームを同時再生するといったことも可能になっている。

 それ以外にも、最上位のRTX 5090では3基のNVENCを内蔵するなど、ハードウェアエンコーダ/デコーダ周りも強化。DLSS 4などの各種AI機能が3Dワークフローにおいても活用できる点もアピールした。

4:2:2 10bitカラー動画のハードウェアエンコード/デコードに対応
GeForce RTX 5090では3基のNVENCを内蔵

配信中にツッコんでくれるAIキャラなど、配信者向け機能も登場

Streamlabs Intelligent Streaming Assistant
ユーザーの問いかけや、ゲーム内のイベントにあわせてAIキャラクターがリアクションしてくれる

 配信者向けには、NVIDIA ACEを活用した「Streamlabs Intelligent Streaming Assistant」を発表。配信ソフトのStreamlabs向けに実装されたもので、配信画面を見てコメントしてくれたり、技術的なサポートなどをしてくれるAIアシスタントとなる。

 また、NVIDIA Broadcastにもアップデートを実施。ノイズ除去とAIイコライザでマイクを問わず高品質なサウンドを実現するStudio Voice、カメラに写る被写体に対して仮想的なライティングを施すVirtual Key LightといったAI機能が加わる。さらにUIの刷新も行なわれる。こちらは2月に提供予定。

NVIDIA Broadcastに機能を追加
Studio Voice
Visual Key Light。左が適用前、右が適用後

GeForce RTX 50シリーズは1月30日より順次投入

 製品ラインナップや発売時期、価格についても改めて紹介が行なわれた。

 発売時期および価格は、GeForce RTX 5090が1月30日/1,999ドル、RTX 5080が1月30日/999ドル、RTX 5070 Tiが2月/749ドル(Founder's Editionなし)、RTX 5070が2月/549ドル。

 モバイル向けは、3月より搭載製品が順次投入される予定。価格は、GeForce RTX 5090 Laptop GPU搭載機が2,899ドル、RTX 5080 Laptop GPU搭載機が2,199ドル、RTX 5070 Ti Laptop GPU搭載機が1,599ドル、RTX 5070 Laptop GPU搭載機が1,299ドル。

GeForce RTX 50シリーズ
従来製品との仕様の違い
GeForce RTX 50シリーズLaptop GPUシリーズ