●WinHECのキーノートスピーチでR420を公開
ATIのDavid E. Orton(デビッド・E・オートン)社長兼COOは、5月4日(現地時間)から米シアトルで開催されているWinHECのキーノートスピーチに登場。「毎年グラフィックスの性能を2倍にする」と宣言、16パイプライン構成の次世代GPU「RADEON X800(R420)」を発表した。RADEON X800のパフォーマンスは、従来のハイエンドRADEON 9800XT(R360)の約2倍に上がったという。 R420の基本構成は、ジオメトリ処理を行なうVertex Shaderが6ユニット、ピクセル処理を行なうPixel Shaderが16ユニット、ラスタオペレーションも16並列で、メモリインターフェイスは256bit幅でGDDR3に対応、AGP 8xインターフェイスを備える。この基本構成は、NVIDIAのGeForce FX 6800(NV40)と同じ。R420とNV40は、完全に同じフィールドで角を突き合わせることになる。ATIのRick Bergman氏(リック・バーグマン、Senior Vice President & General Manager, Desktop Business Unit)は「RADEON X800XTは、NV40 Ultraより30~40%程度高速で、パフォーマンスリーダシップを維持する」とぶちあげる。 R420では、従来的な数え方でのピクセルパイプ数は、これまでのハイエンドR360の8パイプから2倍に増えた。その一方で、Shaderアーキテクチャの拡張は小幅にとどめた。NVIDIAがNV40でDirectX 9のProgramable Shader 3.0に対応したのに対して、R420はShader 2.0ベース。NVIDIAがPixel Shaderの内部演算精度を32bitにしてきたのに対して、R420の内部演算精度は24bitのままだ。
●3Dc圧縮機能でより緻密なバンプマップを現実的に ただし、重要な新機能も加わっている。中でも重要なのは、法線マップの圧縮機能「3Dc」を実装したこと。一般的なバンプマッピングは法線マップを使うが、Shader時代になって法線マップの精度を高めて、より緻密なディテールをバンプマッピングで実現できるようになった。 しかし、法線マップの精度を高めようとすると、法線マップのデータ量が肥大してしまうという問題が発生する。現在のGPUは、テクスチャやZの圧縮機能は備えているが、これまでは法線マップに特化した圧縮機能は備えていなかった。そのため、法線マップは精度を高めるとデータが肥大し、データ量を減らしたり圧縮すると精度が落ちるという問題を抱えていた。 そこでATIは法線マップに特化した圧縮アルゴリズムを搭載。最大1/4にまで法線マップを圧縮することにより、従来は難しかった精緻なバンプマップを可能にする。その結果、少ないポリゴン数でも、3Dオブジェクトをリアルに見せることができるようになる。NV40の方は、これと同等の機能は備えていない。 また、R420では内蔵のビデオプロセッサとShaderで実現するビデオ機能も拡張された。RADEON X800では、MPEG-1/2/4ビデオのエンコードとデコード、WMV9のデコードをハードウェアアクセラレートする。 Shaderも、R420ではShader 2.0より拡張されている。例えば、Pixel Shaderの最大命令数は最大1,536命令とShader 2.0の160命令より多い。また、Shader内の処理を効率化する改良も施された。例えば、R420のPixel Shaderは、最大でベクタ演算2命令(3コンポーネントづつ)とスカラ演算2命令を並列に実行できる。これはNV40とある程度似ている。その他、テンポラリレジスタの拡張なども行なわれている。つまり、Shader数を増やすだけでなく、Shader内部の効率を向上させている。
●基本的にはR3xx系の拡張版 こうしたアーキテクチャ上の拡張はあるももの、R420は革新というよりも、RADEON 9700/9800(R300/R350)系を拡張、パイプラインを2倍に広げたGPUに近い。つまり、NV40でNV3xから大きくアーキテクチャを切り替えたNVIDIAとは路線が異なる。この違いの背景には、現状ではソフトウェアのトレンドはShader 2.0に留まるというATIの読みがある。Shader 3.0はあくまでも中間ステップで、メジャーステップは次のDirectX 10という読みだ。 そのため、無意味にアーキテクチャを拡張するよりも、この世代ではパフォーマンスの向上に集中するというのがATIの基本戦略のようだ。 一方、NV40の方はNV3xですでにPixel Shaderを32bit精度にしていたためShader 3.0への対応がATIよりも容易という事情もある。Pixel Shaderの32bit精度を活かすには、32bit精度のVertex Shaderにテクスチャアクセス機能を持たせるShader 3.0に対応した方がいい。 アーキテクチャ選択の差は、NV40とR420に大きな違いをもたらした。 NV40はShader 3.0/32bit Pixel Shaderで、6 Vertex Shader、16 Pixel Shader、16 ROP(Rasterizing OPeration)サブシステムを備える。そのため、GPUのトランジスタ数は非常に多い。2億2,200万トランジスタでダイサイズ(半導体本体の面積)は300平方mmクラスだ。その結果、NV40は高消費電力&高発熱で、しかも高コストという問題を抱えてしまった。また、Shader 3.0対応のシェーダプログラムを走らせた場合には、Shaderユニットの実行効率を維持することが難しいという課題もある。
RADEON X800の製造プロセスは、消費電力が比較的低い台湾TSMCの0.13μmのLow-kオプション付きプロセスなので、RADEON X800の発熱量はRADEON 9800XT(TSMC 0.15μm)よりも少ないという。つまり、R420の方がNV40より、実装しやすく熱設計や熱対策も容易で、製造コストも低く量産に向いたGPUというわけだ。 無理をしても巨大GPUを作るNVIDIAと、あくまでも現実的な範囲でGPUを設計するATI。今回は、両社の姿勢の違いが明確になった格好だ。 R420の製品ラインナップは、16パイプの「RADEON X800 XT」と、12パイプの「RADEON X800 PRO」の2製品。RADEON X800 XTは500MHz以上のコアクロックと1Gtps(transfer per second)以上の転送レートのGDDR3メモリ256MB搭載で提供され、価格は米国で499ドル程度。RADEON X800 PROは475MHzのコアクロックと900Mtpsのメモリ256MBで399ドル程度という。 また、今回発表されたRADEON X800はAGP 8xバージョンだが、ATIはPCI Expressネイティブ版も用意している。そちらは、IntelのPCI Expressチップセット発表とほぼ同時期にリリースされるという。
ATIは、また従来アーキテクチャのパフォーマンスGPUとメインストリームGPUのPCI Express版「RV380」と「RV370」も発表する予定。さらに、今年後半にはRADEON X800アーキテクチャのメインストリームGPUも投入する。今年もATIは怒濤のように新GPUを発表する予定だ。
□ATIのホームページ(英文) (2004年5月6日) [Reported by 後藤 弘茂(Hiroshige Goto)]
【PC Watchホームページ】
|
|