●IBMの100万プロセッサスパコン計画
「Cellular architecture builds next generation supercomputers」 |
第3世代PlayStation分散環境のベースになるプロセッサ「Cell」。ソニー・コンピューターエンタテインメント(SCEI)がIBM、東芝と組んで開発をスタート、4億ドルを超える投資を予定する新アーキテクチャだ。プロセッサ開発としては、IBM、Apple Computer、Motorolaによる「PowerPC」に匹敵するくらいのビッグプロジェクトであるにも関わらず、その正体は謎に包まれている。Cellは、実際にはどんなチップになるのだろう。
じつは、これに対してはかなりの量のヒントが、アイデアの出元であるIBM ResearchのWebサイト(http://www.research.ibm.com)にある。IBM Researchの情報をもとに類推したCellの特徴は以下の通りだ。
[1] メインメモリDRAM混載
[2] 広帯域コミュニケーションポート内蔵
[3] 複数プロセッサを1チップに搭載
[4]「スレッドレベル並列処理(TLP:Thread-Level Parallelism)」技術
[5] 自律コンピューティング(Autonomic Computing)機能
[6] シンプルな命令セットアーキテクチャ
まずどうしてこうした類推ができるのか?これは簡単で、IBMがそもそも「Cellular Architecture」または「Cell」と呼ばれる、新しいプロセッサ&スーパーコンピュータアーキテクチャを研究しているからだ。これは、IBMの「Blue Gene」プロジェクトと呼ばれる、2004年に完成予定の遺伝子研究用スーパーコンピュータに使われるもので、'99年頃から開発が始まっている。Blue Geneは、100万プロセッサを搭載、チェスチャンピオンスパコン「Deep Blue」の1,000倍の1PetaFLOPSという、前人未踏のパフォーマンスを達成する予定になっている。また、IBMは、CellをBlue Geneだけで終わらせるつもりはなく、汎用スーパーコンピュータからサーバーまで展開する計画も発表している。
Blue Geneプロジェクトについては、IBMのワトソン研究所のサイト( http://researchweb.watson.ibm.com/bluegene/ )にいくつかの資料が上がっている。それを見ると、これが既存のプロセッサの概念を覆す、全く新しいアイデアであることがわかる。
例えば、Cellular Architectureでは各CellはメインメモリDRAMをチップに搭載しており、またGB/secクラスの転送能力を持つコミュニケーションポートを備えている。Cell同士はコミュニケーションポートで相互接続され、マッシブなマルチプロセッサ構成を可能にする。スーパーコンピュータなら数万~100万プロセッサの構成が可能となる。
●既存の概念を崩すCellのアーキテクチャ
CellがDRAMを混載するのは、メモリアクセスがCPU性能の最大のボトルネックになっているからだ。これはわかりやすい話で、DRAMを混載してしまえば、メモリアクセスがローレイテンシかつ広帯域になるため、ボトルネックを劇的に軽減できる。その分、性能が向上するだけでなく、CPUの構造を単純化できる。というのは、メモリアクセスのペナルティを軽減するために、今のCPUは大量のキャッシュを搭載したりパイプラインを深くしたり、複雑なスケジューリングをしたりしているからだ。
また、さらにメモリアクセスのレイテンシを軽減するため、CellではSimultaneous Multithreading技術、つまりIntelのHyper-Threadingに似た技術で、複数スレッドを並列処理する。メモリアクセス待ちの空いた実行ユニットを別スレッドが利用できるようにして、処理性能を上げるらしい。
もっとも、Multithreadingを搭載しても、DRAM混載のアドバンテージでCellのプロセッサ構造自体は比較的単純になるらしい。これは、DRAMを混載するため、ロジック回路に割ける面積が限られることも影響しているようだ。そのため、Cellのプロセッサは、単体ではそれほど性能は高くない。例えば、Blue Geneの場合はプロセッサ単体では性能は1GigaFLOPSに過ぎない。だが、単純で比較的大人しい性能のプロセッサを大量に搭載することで、Cellular architectureでは膨大な演算処理を可能とするという。つまり、1GigaFLOPSも100万個集まれば1PetaFLOPSになるというわけだ。
また、Cellular architectureでは、膨大なマルチプロセッサシステムの信頼性を確保するために、自律コンピューティング(Autonomic Computing)機能をチップレベルで搭載するらしい。問題が発生した場合に、Cell自体がそれを認識、システムが落ちる前に解決する手段を提供するらしい。メモリやコミュニケーションポートまで内蔵していれば、これもやりやすいだろう。
以上が“IBM版Cell”だ。では、これとSCEI版Cellの関係はどうなるのか?
今のところ、これは明らかになってはいない。しかし、IBMと組んで、同じ名前で、同じ時期で、そうそう違うアーキテクチャということもありえない。しかし、全く同じというわけでもなさそうだ。これまでの発表から、違う部分も見えているからだ。そのため、IBM版Cellと、基本アーキテクチャや命令セットは同じだが、構成が異なるSCEI版Cellが存在すると想像される。ちなみに、IBM版Cellも、Blue Gene用と汎用のBlue Gene/L用ではかなり構成が異なる。
SCEIの発表資料で明確なCellのテクノロジは次のようになっている。
・ 0.10μmプロセス
・ SOI
・ 低誘電体層間絶縁膜
・ 銅配線
・“1つのCellが”TeraFLOPS級の演算性能
このうち、プロセス技術は、2005年という時期を考えればすべてリーズナブルな技術で不思議はない。当たり前過ぎるくらいだ。ポイントは、TeraFLOPS級の演算性能という点にある。これがピーク性能だとしても、かなり驚異的な数字だ。パッと計算してもすぐにわかる。
まず、現在のPlayStation 2のEE(Emotion Engine)と比較してみよう。EEは6.2GigaFLOPSだから、Cellは約160倍以上の性能ということになる。EEの場合、クロックは295MHzなので、逆算すると21オペレーション/サイクルを実行できることになる。これは、演算ユニットの構成を考えれば不思議はない。
ではCellの場合はこの性能を達成できる構成というと、どうなるか。SCEI版Cellのクロックが1GHzになると仮定してみよう。そうすると、1TeraFLOPSを実現するには、1サイクル当たりの演算性能は1,000オペレーションが必要ということになる。積和算が1命令で2オペレーションと計算しても500命令/サイクル。つまり、浮動小数点演算ユニットは500個必要になる。単精度演算だけと考えれば、この構成もありうるが、IBMのCellが比較的シンプルであるのと隔たりがありすぎる。
そうすると、SCEIのリリースで言っている“1つのCell”という単位を、考え直す必要が出てくる。つまり、ここで言うCellの中に、複数個のプロセッサが含まれている可能性がある。実際、Blue Geneは32個のプロセッサをシングルチップに搭載して、32GFLOPSを達成する。SCEIのCellも類似の構成の場合には、計算は全然違ってくる。例えば、SCEIのCellが16プロセッサ構成なら32演算ユニット、32プロセッサ構成なら16演算ユニット。PlayStationの場合は単精度ですむと考えるなら、SIMDを計算に入れられるので、これはありそうな話になってくる。
実際、0.10μmで製造するなら、200平方mmクラスのチップに数億トランジスタを搭載できる。そうすると、Cellが1,350万トランジスタのEE程度のチップだとしたら16個程度は搭載できる計算になる。もしCellがEEより大分小さかったら、32個という可能性もある。もっとも、これにはDRAM分は含まれていない。
ではCellが、DRAM混載だとしたらどの程度のメモリを搭載できるのか。0.10μmの時点でDRAMだと512Mbit品がおそらく60平方mm弱程度のダイサイズ(半導体本体の面積)で製造できると見られている。混載だと、これよりかなりサイズが大きくなるし、Cellの場合はバンク数も多くなるのでその分さらにサイズが増える、それでも200平方mmクラスのチップなら半分をメモリに使うとして512Mbit(64MB)程度を混載できるかもしれない。実際、SCEIがGScubeに搭載した2世代目のGraphics Synthesizerチップは0.18μmで256Mbit(32MB)を約462平方mmのダイに混載している。
【参考資料】
「Cellular architecture builds next generation supercomputers」
(Think Research Magazine, 2001/6)
http://researchweb.watson.ibm.com/thinkresearch/pages/2001/20010611_cellular.shtml
「Interview: George Chiu, IBM Researcher」
http://www.research.ibm.com/autonomic/academic/interview_chiu.html
「Blue Gene: A vision for protein science using a petaflop supercomputer」
(IBM SYSTEMS JOURNAL,VOL40,NO 2,2001)
http://www.research.ibm.com/journal/sj/402/allen.html
□関連記事
【3月25日】【海外】PlayStation 3の正体は“Cell+Linux+グリッド+自律コンピューティング”
http://pc.watch.impress.co.jp/docs/2002/0325/kaigai01.htm
(2002年3月25日)
[Reported by 後藤 弘茂]