ニュース
レイトレ性能が2倍になった「Radeon RX 9070」正式発表!
2025年2月28日 22:00
米AMDは28日(現地時間)、レイトレーシング性能の改善などを施したRDNA 4アーキテクチャ採用のGPU「Radeon RX 9070」、「Radeon RX 9070 XT」を正式発表した。2025年初のCESにて予告されていた製品で、このたびアーキテクチャの詳細などが明らかにされた。
なお、価格帯については、1440pゲーミング向けの「Radeon RX 7900 GRE」の549ドルと4Kゲーミング向けの「Radeon RX 7900 XT」の899ドルの“間”とされているが、具体的な価格は執筆時点では明らかにされなかった。
トランジスタ数はGeForce RX 7900 GREの538億よりわずかに多い539億となっており、AMDによれば、“1440pゲーミング対応GPUの価格帯で4Kゲーミングを実現する”としている。
RDNA 4アーキテクチャ
新アーキテクチャのRDNA 4では、まずCU(Compute Unit)の改善が図られて基礎性能が向上。具体的には、メモリサブシステムの改善(メモリ圧縮の強化、256bit/20GbpsのGDDR6メモリの採用)、スカラユニットの強化、ダイナミックレジスタアロケーションの対応、CUの効率改善および動作クロックの向上を図った。
このうちダイナミックレジスタアロケーションについて解説すると、従来のRDNA 3はレジスタに対するワークロードの割当が静的であって、処理でアイドルになるレジスタが存在していた。RDNA 4ではレジスタをプールで管理し、必要時にリクエスト、処理終了時にレジスタを解放できるようになったことで、メモリレイテンシの改善やシェーダコア利用率の向上を実現した。
また、レイトレーシング処理を行なうアクセラレータ(以下RTアクセラレータ)が第3世代に進化し、スループットが従来から2倍に向上。具体的には、光線のインタセクション処理を行なうユニットが2倍となったほか、BVH圧縮の強化、光線トラバーサルおよびシェーディングの高速化、オリエンテッドバウンディングボックス(OBB)の対応を図った。
OBBとは、光線の交差判定などを行なうバウンディングボックスに回転の情報をもたせ、回転/整列できるようにするもの。従来のバウンディングボックス(BVH)はワールドの座標系軸に沿って並べられているのだが、各ボックスは中に含まれるジオメトリを完全に覆う必要があるため、ワールド軸に対して斜めに配置されたジオメトリでは、必要以上にボックスが大きくなり無駄な空間が増えてしまっていた。
そこでOBBでは、ジオメトリに合わせて回転/整列できるようにし、空きスペースを減少させる。回転に合わせた座標系に光線を変換することで交差判定を行なうようにした。これによりトラバーサルのステップ数を減らせるようになり、ピーク時の演算コストを下げられるとしている。
AIアクセラレータ機能も強化し、FP16性能は2倍、INT8およびFP16スパース性能は4倍、INT8スパース性能は9倍になったほか、新たにFP8フォーマットの演算にも対応した。これにより生成AIの速度も向上する。
動画を処理するデュアルメディアエンジンも進化させ、同じビットレート下での画質が改善。H.264/HEVC/AV1をサポートしているほか、最大8K/80fpsのエンコード/デコードへの対応を謳う。セッションやエンコードストリームについても制限はない。
インターフェイス面では、PCIe 5.0、DisplayrPort 2.1a、HDMI 2.1bをサポート。FreeSyncの電力消費の最適化を行ない、2台モニターの接続時で低アイドル電力を実現できるという。また、ハードウェアフリップキューに対応し、ビデオフレームスケジューリングのオフロードが可能となり、ビデオ再生時のCPU電力を低減できるという。映像の先鋭化を行なう「Radeon Image Sharpering 2」も搭載した。
RDNA 4に最適化した超解像技術「FidelityFX Super Resolution 4」(FSR 4)も同時に発表。従来のFSR 3.1 APIから容易にアップグレード可能で、ニューラルレンダリングにも対応する。AMDによれば、同じパフォーマンスモードでは従来のFSR 3.1から画質を改善しつつ、ネイティブ4K解像度と比較して性能を3.4倍に引き上げられるという。ローンチ時は30以上のタイトルが対応し、2025年内には75タイトル以上が対応を謳う。
各製品の仕様と性能
Radeon RX 9070/9070 XTはいずれも製造はTSMC 4nmプロセスで行なわれており、ダイサイズは356.5平方mm。Aggregate CUキャッシュは2MB、L2キャッシュは8MB、第3世代Infinity Cacheは64MB。
下位のRadeon RX 9070の主な仕様は、CU数が56基、RTアクセラレータ数が56基、AIアクセラレータ数が112基、ピークAI TOPSが1,165TOPS(INT4スパース時)、ブーストクロックが2.52GHz、メモリ容量が16GB、TBP(Total Board Power)が220W。
同社によれば、4K最大画質設定では、Radeon RX 6800 XTと比較して38%高速、GeForce RTX 3080と比較して26%高速。Radeon RX 7900 GREのウルトラ画質設定と比較した場合、平均21%高速で、ウルトラ画質でレイトレーシングを有効にしても11~34%高速だという。
上位のRadeon RX 9070 XTの主な仕様は、CU数が64基、RTアクセラレータ数が64基、AIアクセラレータ数が128基、ピークAI TOPSが1,557TOPS(INT4スパース時)、ブーストクロックが2.97GHz、メモリ容量が16GB、TBPが304W。
こちらも同様に4K最大画質設定では、Radeon RX 6900 XTと比較して51%高速、GeForce RTX 3090と比較して26%高速。一方、Radeon RX 7900 GREのウルトラ画質設定と比較して平均42%高速で、レイトレーシングを有効にすると36~66%高速だ。