米NVIDIAは27日(現地時間)、DirectX 11に対応した「Fermiアーキテクチャ」を採用するコンシューマ向けGPU「GeForce GTX 480」および「同470」を発表した。国内では4月中旬より搭載品が出荷開始の予定で、実売価格は前者が6万円、後者が4万円前後となる見込み。
Fermiアーキテクチャは、2009年の10月にその仕様が発表。製品としては2009年11月にHPC向けの「Tesla 20」シリーズが発表。その後、2010年の1月にコンシューマ向けに「GF100」のコードネームがついた製品の仕様を公開し、第1四半期中に正式発表すると予告。ぎりぎりとはなったが、公約通り正式発表にこぎ着けた。ただし、前述の通り、国内の製品出荷まではもう2週間程度かかる見込み。
GF100コアのブロックダイヤグラム |
アーキテクチャの詳細についてはすでに関連記事が詳しいので、ここでは先だって行なわれた事前説明会での内容を元に、ポイントを紹介する。機能面での大きな特徴は、DirectX 11で新たに正式採用されるテッセレーションに対応した点。これにより、必要最低限のジオメトリ(ポリゴン)データをCPUからGPUに渡すだけで、GPU側のハードウェアテッセレータにより、自動的に詳細なポリゴンへ細分化される。
これを利用すると、LoD(Level of Detail)と呼ばれる手法を効率的に実装できる。LoDを使うと、遠方にあるオブジェクトは詳細を描写する必要がないので、最低限のポリゴンだけで表現し、視点に近づくにつれ、自動的かつリニアにポリゴンが増え、滑らかで精細なオブジェクトに変形する。
また、テッセレーションはディスプレースメントマッピングと組み合わせることで、これまでのバンプマッピングでは擬似的に表現されていた凹凸に、実際のジオメトリを持たせることができる。そのため、オブジェクト表面を横から見ても、きちんとポリゴンによって凹凸が作られ、それによる影も自然なものとなる。また、3D Visionを利用した際の立体感向上にも寄与するという。
GF100では、32個のSP(NVIDIAではCUDAコアと呼称)を1つのSM(Streaming Multiprocessor)と呼ばれるユニットにまとめている。そして各SMには、テッセレーションエンジンを含むジオメトリ制御機構「PolyMorph Engine」が備わり、GPU全体では16基を搭載し、並列処理が可能。DirectX 11の実装で先行するAMDの「ATI Radeon HD 5000」シリーズでは、テッセレーションエンジンは1基しかないため、高度なテッセレーションを行なうと、ボトルネックが発生し、GF100との性能差が大きくなると言う。また、同社のGeForce GTX 285に対してもジオメトリ性能は、最大で8倍向上しているという。
従来のシェーダの性能も、SP数を倍増させたことなどにより、GeForce GTX 285に対して、1.5~3.5倍に向上。アンチエイリアスは32xまでサポートするが、8xまでは性能の低下が非常に少ないことを売りとしている。
左上の黄色いブロックがPolyMorph Engineの概要。これが各SMに装備され、全16基となる | テッセレーションの効果。ポリゴン数が増えるだけでなく、これまで2次元的な凹凸で表現されていたものを、3次元で表現できるようになる | Radeon HD 5870とのテッセレーションのレベルによる性能差。右の方がテッセレーションが高度 |
【動画】テッセレーションのオン/オフの違い |
【動画】テッセレーションのオン/オフの違いその2 |
【動画】テッセレーションとPhysXを使った海面の表現 |
実際のゲームにおける性能は、DirectX 9/10対応タイトルで、Radeon HD 5870に対しおおむね2割程度、高いものでは5割程度性能が伸びる。SLIでのスケーリングの具合がいいのも特徴で、数多くのタイトルで1枚に対して9割近い性能向上が得られるという。
また、DirectXとCUDAの切り替えが高速化され、キャッシュを活用することで、PhysXを利用する際の性能も、GeForce GTX 285に対して最大で2.5倍向上。このほか、独自のレイトレーシングエンジン「OptiX」利用時のレイトレース性能も最大3.5倍に強化されている。なお、つい先日発売となった「Just Cause 2」など、ゲームでCUDAを利用するものも出始めている。
【動画】PhysXを利用した水の表現 |
【動画】PhysXを利用した物体の衝突/落下の表現 |
3D Visionについても、フルHD液晶を横に3台並べる「3D Vision Surround」という機能が追加された。ただしこれは、SLI構成が必須となる。ちなみに、ドライバのアップデートで、既存のGeForce GTX 200シリーズでも利用できる。説明会では、カプコンが現在開発中の「LOST PLANET 2」による3D Vision Surroundのデモが行なわれた。
3D Vision Surroundシステム | 今回、初めてLOST PLANET 2 PC版のデモが3D Vision Surroundで実施された | ビデオカードはSLIが必須。1枚から2台、もう1枚から1台のディスプレイにつなぐ。ちなみに、このシステムはGeForce GTX 285を使っている |
【動画】LOST PLANET 2の冒頭のデモ |
製品の具体的仕様は以下の通り。GeForce GTX 480は、SP数が480基、コアクロックが700MHz、シェーダクロックが1,401MHz。メモリは384bit接続のGDDR5を1,536MB搭載可能で、クロックは3,696MHz。最大消費電力は250Wで、電源コネクタは8ピン+6ピン。カード長は10.5インチ(約267mm)、カード圧は2スロットで、ヒートパイプ式のヒートシンクファンを搭載。
GeForce GTX 470は、SP数が448基、コアクロックが607MHz、シェーダクロックが1,215MHz。メモリは320bit接続のGDDR5を1,280MB搭載可能で、クロックは3,348MHz。最大消費電力は215Wで、電源コネクタは6ピン×2。カード長は9.5インチ(約241mm)、カード圧は2スロットで、ヒートパイプなしのヒートシンクファンを搭載。
いずれも、ディスプレイインターフェイスはDual Link DVI×2、mini HDMI。3-way SLIに対応。PureVideoはGeForce GT 240と同じ最新のVP4を搭載する。
先だってGF100のアーキテクチャが公開されたとき、SP数は512基となっていた。にもかかわらず、GeForce GTX 480で480基となっているのは、SM 1つ分を無効にしているためだ。SPだけでなく、PolyMorph EngineなどSMに含まれる機能は、480で1つ分、470で2つ分、無効になる。
これは、発熱や歩留まりが原因と思われるが、NVIDIAでは、可能な限り早く出荷させることと、この構成でも現時点で最高レベルの性能が実現できると判断したためこの仕様にしたと説明している。なお、将来512基搭載のモデルが出る可能性についてNVIDIAでは特に否定はしていない。
GeForce GTX 480の主なスペック | GeForce GTX 470の主なスペック |
DirectX 11対応各カードの性能比較 | 搭載カードはZOTACやエルザジャパン、搭載PCはマウスコンピューターやドスパラなどから早々に発売予定 |
(2010年 3月 27日)
[Reported by 若杉 紀彦]