ATIカンファレンスレポート

[an error occurred while processing the directive]

ATIカンファレンスレポート

Radeon X1900 3枚構成で物理演算をデモ
「物理演算はAGEIA/NVIDIAより10倍速い」

Nick Radovsky氏

会期：6月6日～6月10日(現地時間)

会場：Taipei World Trade Center Exhibition Hall 1/2/3
　　　Taipei International Convention Center

　ATI Technologiesは8日(現地時間)、6日にIntelによる基調講演の場で電撃的に発表したビデオカードによる物理演算について解説を行なった。担当したのは同社のNick Radovsky氏で、同氏によればRadeonによる物理演算はAGEIAやNVIDIA製品より最大10倍以上高速だという。

　ゲーム内での大規模な物理演算は、最近にわかに脚光を浴びているが、Radovsky氏によれば、最新のConroeであっても力不足で、そのほかのハードウェアによる支援が必要だという。

　その解として、AGEIAは独自の物理演算プロセッサ(PPU)「PhysX」を開発し、NVIDIAとATIは、Havokと協業し、GPUをPPU代わりに利用する「Havok FX」への対応を打ち出してきた。

　PhysXとHavok FXは、それぞれ対応したゲームが必要だが、Radovsky氏によれば、Havok FXでは、各GPUに対して何らかの最適化を図っている可能性はあるが、その違いはマイナーなもので、Havok FX対応ゲームであれば、ATIかNVIDIAかを問わず動作するだろうとしている。

　だが、その性能については、ATIとNVIDIAとで大きな差が出ると主張する。Radeon X1000シリーズでは、各ピクセルシェーダのALUごとに分岐実行ユニットを搭載しており、物理演算処理にかかるサイクルを減らすことができる。

　また、条件分岐では1つの処理が終わるのを待つために、ほかのスレッド処理が滞るというロスが発生することがあるが、Radeon X1000シリーズはGeForceよりもずっと小さなスレッドサイズを採用することで、効率を上げている。

　その差は歴然たるもので、GeForce 7900シリーズに対して、Radeon X1600シリーズでも、球体、メッシュ、四面体の衝突処理について、およそ4倍から6倍、Radeon X1900に至っては、12倍から14倍の性能差が出るという。


Radeon X1000シリーズは各ALUに分岐予測ユニットを装備することで、処理能力を上げている	物理演算のベンチマーク結果。左からRadeon X1600、Radeon X1800、Radeon X1900、GeForce 7800、GeForce 7900

　実際に、オブジェクト数を1万5千個に設定した衝突デモでは、Radeon X1900を物理演算処理に使うことで、CPU処理(Conroe 2.66GHz)では7fps程度しか出ないのに対し、70fps近い性能を発揮。Radovsky氏によれば、NVIDIAが行なった全く同じデモではオブジェクト数が1万で、フレームレートは50fpsだったという。

　もう1つ、NVIDIAに対するアドバンテージとして同社が主張しているのが、非対称構成の対応だ。Havok FXでは、原理的には1つのGPUでグラフィック処理と物理処理を受け持つことも可能だが、処理能力の問題から、NVIDIAではSLI環境での利用を前提としている。

　ATIでも2枚のビデオカードを使って、1枚でグラフィック処理、もう片方で物理処理を行なうことができるが、その際に同じGPUを用意する必要がない。例えば、Radeon X1900とRadeon X1600という組み合わせも可能と言うことだ。

　加えて、Radeonではビデオカード3枚構成も可能となる。この場合は、2枚をCrossFireとしてグラフィック処理に割り当て、残りの1枚を物理処理に割り当てる。実際に同社は、Radeon X1900 CrossFire+Radeon X1600、およびRadeon X1900 CrossFire+Radeon X1900という構成のデモ機を展示、動作させていた。

　ちなみに、前者はPCI Express x16スロットをx1スロットに変換する下駄を用意して、X1600を無理矢理x1接続させて動作。物理処理ではグラフィック処理ほどの帯域がいらないため、ボトルネックにはならないという。

　X1900を3枚用いた後者は、PCI Express x16スロットを3基備えるマザーボードを用い、CrossFireの2枚はx8で、3枚目はx4で接続されている。

　なお、ATIのGPUをNVIDIAのGPUを組み合わせた環境も原理的には不可能ではないが、グラフィック処理担当GPUと物理処理担当GPUとでダイレクトアクセスが必要なことから、どのGPUをどちらの処理に割り当てるかはドライバで指定する必要があるため、実際には難しいようだ。


Radeon X1900 CrossFire+Radeon X1600の環境。X1600はPCI Expressの変換下駄をかましているので、その分はみ出している	Radeon X1900 CrossFire+Radeon X1900の最強構成


【動画】岩が衝突しながら降ってくるデモ。オブジェクト数は1万5千で、CPU処理した場合(1.3MB)	【動画】CPUに代わってRadeon X1900で処理させた場合(1.0MB)


【動画】単純な形状のレンガとボールの衝突デモ(2.2MB)	【動画】複雑な形状のチェスの駒の衝突デモ(2.3MB)	【動画】兵士がゴミの山の中を歩くデモ(3.7MB)

　PhysXに対しても、Radeon X1600 XTでおよそ2倍、Radeon X1900 CrossFireでは9倍近い性能を発揮するとしている。専用ハードウェアでありながら、PhysXの性能が低いことについて、Radovsky氏は、ハードウェア設計経験の浅さによるものではないかと指摘している。

　また、AGEIAでは物理演算がゲームプレイに直接関わる「ゲームプレイ物理」に積極的な姿勢を見せており、PhysX必須のゲームも存在する。この点についてRadovsky氏は、「物理演算が立ち上がり始めた今現在では、ゲームプレイ物理は時期尚早ではないか」との見方を示し、ゲームプレイに関わらない見た目の「効果物理」に注力するHavokの方が妥当だが、Havok FXの今後のアップデートで、Radeonでもゲームプレイ物理に対応できるとした。


RadeonとPhysXの性能差

□COMPUTEX TAIPEI 2006のホームページ(英文)
http://www.computextaipei.com.tw/
□関連記事
【6月6日】【COMPUTEX】Intelチャンドラシーカ氏基調講演
http://pc.watch.impress.co.jp/docs/2006/0606/comp02.htm
【2005年10月24日】【海外】マルチスレッディング化が性能の重要な鍵となる新世代GPU
http://pc.watch.impress.co.jp/docs/2005/1024/kaigai218.htm

(2006年6月9日)

[Reported by wakasugi@impress.co.jp]

【PC Watchホームページ】

PC Watch編集部 pc-watch-info@impress.co.jp

Radeon X1900 3枚構成で物理演算をデモ 「物理演算はAGEIA/NVIDIAより10倍速い」

【PC Watchホームページ】

Radeon X1900 3枚構成で物理演算をデモ
「物理演算はAGEIA/NVIDIAより10倍速い」