後藤弘茂のWeekly海外ニュース

2005年のビデオメモリはGDDR3/4? XDR DRAM?
~メモリ帯域は60GB/secの世界に




●XDR DRAMをグラフィックスカードへもたらす動き

Samsungが一部限定顧客に出荷しているXDR DRAMのサンプルチップ

 先週レポートしたように、ソニー・コンピューターエンタテインメント(SCE)の次世代PlayStation(PlayStation 3?)に搭載されるメモリ「XDR DRAM」は、当初の512Mbitチップから256Mbitチップへと変更になっていた。最大顧客のSCEが256Mbitへと要求を変えたため、DRAMベンダーはXDR DRAMを256Mbit品から量産スタートする。

 この変化は、XDR DRAMの先行きに若干の変化をもたらしている。というのは、DRAMベンダーがXDR DRAMの2番目の市場ターゲットについて、多少、方向を修正したように見えるからだ。ここへ来て、XDR DRAMの次の市場としてPCグラフィックス、つまり、グラフィックスカードが浮上してきた。

 昨年の計画通りXDR DRAMが512Mbitで立ち上がると、PCグラフィックスを初期ターゲットにするのはややハードルが高くなる。2005~6年のグラフィックスカードでは512Mbitでは容量が大きすぎるからだ。そのためか、DRAMベンダー側は、XDR DRAMのターゲットとして以前からPCグラフィックスを挙げてはいたものの、昨年はそれほど強調していなかった。

 ところが、XDR DRAMが256Mbitから立ち上がるため、今度はむしろグラフィックスカードの方が有望な市場となってきた。DRAMベンダー側は、PlayStation 3へ供給するため256Mbitをメインに作り続けなければならない。そうすると、大容量が欲しいという市場より、比較的小容量で広帯域というニーズが持続する市場がXDR DRAMに適してくる。それが、PCグラフィックスだったというわけだ。

●グラフィックスカードでのXDR DRAMの利点

 XDR DRAMがグラフィックスカードに適している理由はいくつかある。最大のポイントは、帯域とメモリグラニュラリティ(粒度:最小構成単位)のバランスだ。現在のグラフィックスは、メモリ帯域を確保するためにメモリインターフェイス幅をどんどん広げている。DirectX 9世代に入ってからは、ハイエンドGPUのメモリインターフェイスは256bit幅が一般的となった。そのため、x32のDRAMチップで構成しても、最低8個のDRAMチップが必要になっている。

 インターフェイス幅の増大は、メモリのグラニュラリティの増大と配線の複雑化という悪影響をもたらしている。256bitインターフェイスの場合は、x32の256Mbit DRAMで最低256MB、512Mbit DRAMで最低512MBの容量を搭載しなければならない。つまり、ムーアの法則でDRAM容量が上がって行くと、相対的に過剰なビデオメモリを搭載しなければならなくなってしまう。配線に至っては、等長配線を考慮しなければならないため悪夢のようだ。

 ところがXDR DRAMの場合はピン当たりの転送レートが2.4~4.8Gtps(transfer per second)と非常に高い。そのため、GDDR3/4メモリと比べると、1/3~1/2のインターフェイス幅で同等レベルの帯域を確保できる。XDR DRAMは配線遅延に応じて各ピンの信号タイミングをずらしてしまうため、等長配線も不要となる。そのため、配線もずっと簡易になる。

 もう少し詳しく、2005年の時点で比べると、XDR DRAMはピン当たり4Gtpsが達成できるのに対して、GDDR3は最大1.6Gtpsが予定されている。DDR系メモリでグラフィックス向けはx32構成品が主流。だからDRAM 8個で構成すると256bit幅で、帯域は51.2GB/secとなる。それに対してx16のXDR DRAMの場合、DRAM 8個で128-bit幅で、帯域は64GB/secになる。つまり、同じ粒度で、帯域はGDDR3より広く、配線はずっと容易になるわけだ。DDR系は、2004年末までに標準化されるGDDR4になるとさらに転送レートが上るが、それでもXDR DRAMの利点は残る。

 XDR DRAMが256Mbit立ち上げになって、なぜグラフィックスが有望になったかというと、粒度を半分にできるようになったからだ。512Mbitで立ち上げだと、上記の64GB/secの帯域時の最小構成は512MBビデオメモリになってしまう。ところが、256Mbit立ち上げなら、ビデオメモリ量を256MBに抑えることができる。将来、x32のXDR DRAMが登場すれば、メモリ粒度ではXDR DRAMがさらに有利になる。

Samsungの生産予測では2005年には4GtpsのXDR DRAMの出荷が可能に。ちなみに、PlayStation 3向けは3.2Gtps Samsungの計画する第2世代XDR DRAM 高速化を続けるSamsungのXDR DRAMロードマップ
Rambusは今回のRambus Developer Forum(RDF)で、グラフィックス向けとしてのXDR DRAMの優位性も強調。GDDR3に対してランダムアクセス性能でも優れていることを示した GDDR3/4と比較したXDR DRAMの転送レート

●業界標準を狙うGDDR3/4との対決

 こうした背景からXDR DRAMはPCグラフィックスでも可能性が出てきた。実際、一部DRAMベンダーはGPU業界にXDR DRAM採用を働きかけており、大手のGPUベンダーが検討しているという。もっとも、大手と言えるのは既に2社しかないわけで、そのうちATI Technologiesは可能性が薄い。というのは、ATIは、JEDEC(米国の電子工業会EIAの下部組織で、半導体の標準化団体)でのDDR系グラフィックスメモリの標準化に深く関与しているからだ。

 特に、DDR2とGDDR3/4については、JEDECのJC42.3 Committee for DRAMのチェアマンであるATIのJoe Macri氏がリードして来た。そのため、GDDR3/4と並立するXDR DRAMの採用はあまり考えられない。

 もう少し背景を説明すると、これまでグラフィックスメモリは、メインメモリDRAMから派生させたx32構成品などを使ってきた。基本的なアーキテクチャはメインメモリ向けの汎用DRAMのままで、スタブ無しのポイントツーポイント接続にすることで、高速化したのがグラフィックス向けDRAMだった。

 しかし、GPU側のメモリ要求が増大したことで、こうした方向性が変わり始めた。グラフィッックス用途に特化したアーキテクチャを開発することで、より高速なメモリを実現しようという方向に変わった。もっとも、これまでも、そうしたメモリはあったが、サプライヤが限られるため、GPU側は採用しにくかった。

 しかし、GDDR3からは状況が変わった。JEDECでグラフィックスメモリを標準化、汎用DRAMと同様に、どのDRAMベンダーからも共通のグラフィックスメモリを入手できるようにした。つまり、GDDR2までは各ベンダーのスペックは標準化されていなかったが、GDDR3からは標準化され、誰もが標準規格のDRAMを供給できるようになったわけだ。そして、その動きの中心にいたのがATIのMacri氏だったというわけだ。

 こうした背景から、GDDR3/4はメインメモリDRAMから技術的に離れたことで、一気に高速化が可能になった。

 ATIのDavid E. Orton(デビッド・E・オートン)社長兼CEOも「メモリサプライヤの2005~6年のロードマップを見ると、周波数は今後2年間で現在の500MHzから1GHz(転送レートで2Gtps)に増えつつある。我々は、GDDR3(おそらくGDDR4も含めて語っている)には十分なヘッドルーム(余裕)があると考えている」と語り、XDR DRAMについては「我々はオープンスタンダードの技術を信じている」と否定的にコメントしている。Orton氏は、XDR DRAMがRambusの独自技術である点が問題かという質問に「それが問題だ」とも答えている。これは、ATIの現在のスタンスからすると当然のことだ。

 実際、グラフィックスメモリの主流としては、今のところGDDR3/4が本命だ。XDR DRAMが主流になれるとは思えないが、ハイエンドに食い込める可能性はある。ちなみに、RambusはXDR DRAMとDDRを兼用できるメモリインターフェイスのデザインも発表している。NVIDIAがどう動くかは注目だ。

●DRAMの高速化がGPUアーキテクチャに影響を

 2005~6年のビデオメモリのハイエンドがGDDR3/4とXDR DRAMのどちらになるにせよ、メモリ帯域は早いペースで伸び続ける。GPUベンダーは現在ピン当たり1.xGtpsの転送レートのメモリをハイエンドGPUに組み合わせている。メモリ帯域は約35GB/secに達している。これが2年程度で約70GB/sec以上に伸びる。GPUベンダーは、今後2~3年は、ビデオメモリ帯域は心配しなくていいことになる。GPUコアの性能拡張と、ほぼ並列にメモリ帯域が伸びてゆくからだ。

 こうしたグラフィックス向けメモリの急速な高速化は、GPUアーキテクチャにも多大な影響を与えている。それは、ピクセル性能の拡充だ。

 ラフに言うと、ジオメトリ性能はホストバスに制約され、ピクセル性能はビデオメモリの帯域に制約される。そのため、メモリ帯域が向上すると相対的にピクセル性能を上げることが可能になる。GPUベンダーは、現在、グラフィックスメモリ帯域は十分なカーブで上がってゆくことを前提にピクセル部のアーキテクチャを開発することができる。

 例えば、NVIDIAはGeForce FX 5800(NV30)の投入時には、ピクセル性能よりシェーダ性能を重視すると説明。実際、NV30/NV35ではシングルテクスチャフィルのピクセル性能は約4(3.99)ピクセル/クロックに過ぎなかった。ところが、GeForce 6800(NV40)では16ピクセルパイプ構成を取り、シングルテクスチャフィルのピクセル性能は12.27ピクセル/クロックに達している。ピクセル性能重視へと一転したわけだ。

 もっとも、NV40は16Pixel Shader/16ラスターオペレーションユニット構成だから、理論値では16ピクセル/クロックを達成できるはずだ。それが12.27に削れているのはメモリ帯域が足りないためだ。つまり、16ピクセルパイプマシンは、現在のメモリ帯域に対してはピクセル性能が過剰なのだ。メモリ帯域とピクセル性能のバランスは崩れていることになる。

 NVIDIAはこれについて、メモリ性能が今後向上すると、さらにGPU性能が上がる余裕があると説明している。メモリ帯域の向上を前提に、NV40のベースアーキテクチャを決めたと見られる。つまり、NVIDIAとATIの、16パイプアーキテクチャは、グラフィックスメモリの速度向上が予測できているからこそ採用できたということだ。そして、今後、2年で2倍のペースでメモリ帯域が伸び続けるということは、GPUベンダーは、2年以内に32ピクセルパイプのアーキテクチャを採用できることも意味している。

□関連記事
【7月14日】【海外】PlayStation 3は来年3月頃にプレミア公開、E3で正式公開
http://pc.watch.impress.co.jp/docs/2004/0714/kaigai102.htm
【7月9日】【海外】PlayStation 3のスケジュールは変更なし、メモリ仕様は変更へ
http://pc.watch.impress.co.jp/docs/2004/0709/kaigai101.htm

(2004年7月16日)

[Reported by 後藤 弘茂(Hiroshige Goto)]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp 個別にご回答することはいたしかねます。

Copyright (c) 2004 Impress Corporation All rights reserved.