●2ステップで評価キットを提供
ソニー・コンピューターエンタテインメント(SCEI)は、PlayStationの1年の総決算であるカンファレンス「PlayStation Meeting 2005」を開催。その中で、PLAYSTATION 3(PS3)についても、いくつかの新情報を明らかにした。 まず、PS3のスケジュールは2006年春の発売であることが再確認され、その直前の2006年2月に、プレイベントとして「PLAYSTATION Conference」が開催されることが明らかになった。 また、SCEIの代表取締役社長兼グループCEOの久夛良木健氏はPS3の開発ツールとそのロードマップについても説明を行なった。PS3のリファレンスマシンは2段階で提供される。 SCEIは当初、Cellプロセッサの評価用マシン「Cell Evaluation System」で、Cellとそのソフトウェアスタックのバリデーションを行なっていた。これは、いわゆるデバッグ用マシンで社内ラボ向けだが、ごく一部の協力ベンダーに対しては評価用に提供していたという。搭載するCellプロセッサの動作周波数は2.4GHzで、XDR DRAM 256MBを搭載。グラフィックスにはNVIDIAのボードを載せていた。 次にSCEIは、「PS3 Evaluation System」と呼ぶ、顧客に提供することを主目的とした評価マシンを開発した。このマシンには「CEB-2030」という型番がついておりコードネームは「Cytology」とされている。SCEIが、ソフトウェアベンダーに対して配布しつつあるのは、このマシンで今春から稼働している。PS3 Evaluation Systemの概要はあとで説明するが、基本スペックはCell 2.4GHz、XDR DRAM 512MB、GeForce 7800 GTX(G70)となっている。 2005年12月になると、SCEIはほぼPS3実機と同等構成となる「PS3 Reference Tool」を提供する予定だ。Cell 3.2GHz、RSX(Reality Synthesizer)、XDR DRAM 512MBで、BDドライブも搭載される。形状は、現在の予定ではラックマウント型の2Uサイズだが、縦置きも考慮するという。 SCEIは、11月まではPS3 Evaluation Systemを順次提供していく予定だ。現在、PS3 Evaluation Systemは450ユニットが出されているが、下のような予定で提供台数を増やしていく。それによって、集中しているリファレンスマシンへの要望に応えるという。
●CellとXDR DRAMはPS3の75%の性能 PS3 Evaluation Systemでは、PS3最終仕様とさまざまな相違がある。 まず、Cellの動作周波数は2.4 GHzと製品版の75%の周波数となっている。CPUの場合、バリデーションが終わるまでは、評価マシンでは周波数を抑えるというのは珍しいことではない。当然、PS3の最終仕様相当の性能は出ないわけだが、これは単純に75%の性能と想定すればすむという考え方もできる。 メインメモリはXDR DRAMで、Cellに搭載されているXDR DRAMインターフェイス(XIO)に接続されている。こちらもフルスペックではない。6月時点でのPS3 Evaluation Systemでは、XDR DRAMのデータ転送レートも2.4Gbpsに抑えられていた。PS3が搭載するXDR DRAMの転送レートは3.2Gbpsの予定なので、こちらも75%のレートということになる。 CPUクロックを落とすのと連動して、XDR DRAMの転送レートも落ちているように見える。これが示しているのは、CellのCPUコアとXDR DRAMインターフェイスが同期設計になっている可能性だ。同期させた方が設計が容易になるという利点がある。特に、CPU-メモリの場合はレイテンシが重要な要素となるため、同期させる利点は多い。 もっとも、XDR DRAMの転送レートを落とすことは、新メモリであるXDR DRAMの歩留まりを考慮した可能性もある。初期の段階ではXDR DRAMも3.2Gbps品を予定通りに採ることは難しいかもしれない。DRAMセルのコアクロック(Internal Column Frequency)を考えると、XDR DRAM 3.2Gbpsはかなりきつい。XDR DRAMはPS3の量産数が増える頃には90nmプロセスに移行するが、現状では100~110nmプロセスであることもスピード歩留まりの面では不利だ。また、PS3 Evaluation Systemで、RIMM(Rambusのメモリモジュール)を使っているとしたら、モジュールの分、タイミングマージンが食われることも影響しているかもしれない。 今回のカンファレンスで発表されたPS3 Evaluation Systemは、メインメモリにXDR DRAMを512MB搭載する。PS3仕様ではXDR DRAM 256MBなので、メモリ量は2倍となる。これはRIMMで増設されている可能性もある。6月時点では、PS3 Evaluation SystemはRIMMも使えるようになっていると説明されていた。大容量メモリ構成の検証も行なうためだという。 XDR DRAMのインターフェイスはコンフィギュラブルで柔軟性が高い。x16インターフェイスだが、x8やx4にも設定可能だ。XDR DRAMはデータ線はポイントツーポイント接続(CellとDRAMチップ間)だが、例えば、x16をx8に設定変更することで1チャネル当たり2倍のDRAMチップを接続できる。XDR DRAMのRIMMはこの特性を活かすことで、ポイントツーポイント接続でありながら、1チャネルに2RIMMを接続できる。ちなみに、最終版のPS3では、XDR DRAMメモリはマザーボードに直づけされる。
●現状ではPCI Express x4接続のグラフィックス PS3 Evaluation Systemでは、グラフィックスにPC向けの「GeForce 7800 GTX(G70)」を搭載している。PS3に搭載されるメディアプロセッサ「RSX(Reality Synthesizer)」の代用だ。G70はRSXとほぼ同じShader構成で、Shader内のアーキテクチャもかなり類似していると推定される。そのため、グラフィックス回りでは、G70ベースでソフトウェアを開発しても、問題はそれほど生じないだろう。シェーダプログラムも全く同じものが使えるはずだ。 ただし、G70はRSXより動作周波数が低いため、パフォーマンスはある程度落ちる。しかし、GPU内部のパフォーマンスよりも相違が大きいのはインターフェイスだ。 PS3では、CellとRSXが、Rambusの開発したパラレルインターフェイス「FlexIO(Redwood:レッドウッド)」で35GB/sec(下り20GB/sec/上り15GB/sec)の広帯域で接続される。しかし、PCI Express x16チップであるG70にはFlexIOは実装されていないため、Cellとは直接接続できない。 そこで、PS3 Evaluation Systemでは、G70はサウスブリッジチップとPCI Expressで接続されている。6月時点のPS3 Evaluation Systemでは、PCI Express x4で接続されていた。これは、PS3 Evaluation Systemに搭載されているサウスブリッジチップは、IBMのCellワークステーションに搭載されているI/Oチップと基本的には同じものだからだ。そのため、同チップにはサーバー向けのペリフェラルI/OのPCI Express x4が実装されている。最終版のサウスブリッジチップではPCI Expressは消える予定だが。現状ではG70はそこに接続されている。 そのため、現状ではG70のネイティブのPCI Express x16も活かされていない。Cellとサウスブリッジチップは、スペック上では5GB/secのFlexIOで接続されることになっている。PS3 Evaluation Systemでも同様だとすると、まずここで帯域は実機仕様より格段に細くなる。さらに、サウスブリッジチップとG70の間はPCI Express x4なので2GB/secで、ここも細い。Cell→GPUの帯域で比較すると、PS3 Evaluation SystemはPS3の20分の1の帯域しか持っていないことになる。 SCEIによると、PS3 Evaluation Systemでは、グラフィックス側のメモリもGDDR3 512MBに増やされるという。PS3の実機では、ビデオメモリはGDDR3 256MBになる予定だ。ビデオ側のメモリをPS3より大きく取っているため、バスの空いている時に素材をビデオメモリ側に転送してバッファしておくといった対応もできると言う。しかし、広いバス帯域を活かしたPS3ならではのCellとRSXの連携は、PS3 Evaluation Systemでは評価が難しい。 ちなみに、RSXのGDDR3インターフェイスは128bit幅なのに対して、G70は256bit幅なので同じx32の512Mbit DRAMチップならメモリ搭載量は2倍になる。 ●PS3アーキテクチャの特長はCellとRSXの連携 PS3グラフィックスの大きな特徴は、CellとRSXの連携だ。RSX自体のアーキテクチャはG70と類似だが、ホストインターフェイスはPC向けのG70とは全く異なる。G70の場合はPCI Express x16で8GB/sec(片方向4GB/sec)でチップセットに接続され、G70はメインメモリにも直接アクセスができない。それに対してRSXは35GB/sec(下り20GB/sec,上り15GB/sec)でCellと直結され、Cell側のメインメモリに直接レンダリングもできる。 この違いは大きく、そのためPCアーキテクチャと全く異なるGPUの使い方ができるとSCEIは説明する。まず、バスが広いため、Cellで膨大な数のジオメトリオブジェクトを生成して、その頂点データをどんどん転送するといった使い方ができる。逆にRSX側からCellにいったんデータを戻すことも容易にできる。 「Cellプロセッサは、プリプロセッシングとポストプロセッシングに使うことができる。例えば、テッセレーション(平面分割)やドットフィルのような。Cell上で物理プロセッシングを行なってモーションやコリジョンを計算し、それをベースに頂点アレイをトランスフォームするといったこともできる」とNVIDIAのDavid B. Kirk(デビッド・B・カーク)氏(Chief Scientist)は説明する。 SCEIは、基本的な考え方としては、抽象度の高い部分はCellが行ない、細かな(頂点やピクセル単位?)の処理はGPUが行なうといった分担を想定しているという。これは合理的で、例えば、CPUサイドでジオメトリの変成を行なう場合、ゲームで重要となる当たり判定で問題が発生しない。GPU側で変成すると、CPU側にデータを戻さない限り、元のオブジェクトと形状が異なるため、当たり判定でずれが生じてしまう。PS3の場合は、Cell側で変成もできるし、GPUで変成したとしても、データをCPU側に戻すことが比較的容易にできる。 これまでのアーキテクチャでは、CPUとGPUのどちらかがボトルネックになって処理できないと、それ以上のことができなかった。それに対して、PS3アーキテクチャの場合は、GPUがネックだったらCellへ、Cell側がネックだったらGPUへと負荷を分担させることができるという。例えば、ソフトウェアによってはCell側でもっとグラフィックスを処理させて表現を向上させる、あるいはその逆に、Cell側は物理プロセッシングにもっと割きたいから、グラフィックスはGPUにまかせるといった調整が容易になると説明する。つまり、CPUとGPUという2つのプログラマブルプロセッサの間での、フレキシブルなバランス調整が可能になるというわけだ。 従来のPCアーキテクチャの場合、CPUとGPUのパイプが制限されているため、ジオメトリオブジェクトの数は限定されていて、その範囲でどれだけリッチに見せるかの技術を向上させてきた。それに対して、PlayStation 2のようなゲームコンソールの場合、逆にポリゴンは大量に作れるようにしたが、その後の表現力はPCほど高くなかった。PS3アーキテクチャの場合は、その両方が可能で、しかも柔軟にバランスを取ることができるというわけだ。 しかし、現在提供されているPS3 Evaluation Systemの場合、アーキテクチャ上の制約から、そうしたバランシングの検証はできない。これは難点だが、逆を言えば、現在のシステムでのソフトウェアデモは、まだPS3の潜在性をフルには活かしていないことになる。実際のPS3システムでは、現状のデモ以上のことができる可能性がある。 もっとも、バス帯域だけで言うなら、Xbox 360のCPU-GPU間も21.6GB/secで、PCと比べると格段に広い。次世代機では、広帯域のCPU-GPU接続は、PS3だけの特長ではない。 PS2では簡単なローダがファームウェアから起動し、OSやライブラリはディスクからロードした。それに対して、PS3ではハイパーバイザが最初にファームから起動する。ハイパーバイザは「VMM(Virtual Machine Manager)」ソフトの一種だが、OSの上ではなくOS層の下で完全にマシンを仮想化する。PS3の場合は、ゲームプレイのためにCell OS単独で使用する場合も、必ずハイパーバイザが起動し、その上に従来の定義のOS(ゲストOS)が立ち上がる。OSは、ハイパーバイザ層も含めた2層構成になっているイメージだ。この基本的なOS階層はPS3 Evaluation Systemでも同様だという。
□関連記事 (2005年7月22日) [Reported by 後藤 弘茂(Hiroshige Goto)]
【PC Watchホームページ】
|
|