■後藤弘茂のWeekly海外ニュース■
AMDとIntelは、それぞれ次世代サーバーCPUの技術概要を、8月23日から米スタンフォードで開催されているチップカンファレンス「HotChips 21」で発表した。AMDが発表したのは12コアの「Magny-Cours(マニクール)」、Intelが発表したのは8コアの「Nehalem-EX(Beckton:ベックトン)」。いずれも、マルチプロセッサ構成をメインターゲットとしたハイエンドのサーバーCPUだ。
AMDのMagny-Coursは2010年早期に投入される予定のCPU。AMDから分離したGLOBALFOUNDRIESの45nm SOIプロセスで製造される。12個のCPUコアはそれぞれ512KBのL2キャッシュを備えるほか、共有のL3キャッシュを12MB備える。主な特長は下のチャートの通りだ。CPUコアのアーキテクチャの名称が、マーケティング名の「K10」ではなく、本来のコードネームである「Greyhound(グレイハウンド)」となっている。
x64プロセッサの進化 |
プロセッサの性能向上 |
Magny-Coursの12コアは、6コアの「Istanbul(イスタンブール)」のダイを2個、1つのパッケージに収めることで実現している。CPUソケットは新しい「G34」となるが、6コアのIstanbulと同じTDP(Thermal Design Power:熱設計消費電力)枠を維持するという。
Magny-Coursのダイレイアウトは下の通り。ダイ自体はIstanbulと全く同じものを使っている。そのため、Istanbulでのチップ設計のチューニングによる動作周波数の向上などは、そのままMagny-Coursにも反映される。つまり、Istanbulが高速化すれば、Magny-Coursも高速化できることになる。また、1個の超巨大ダイではなく、そこそこのサイズのダイ2個で構成することで、チップの歩留まりが向上。供給が安定するとともに、製造コストも抑えられるという。
Magny-Coursのダイレイアウト |
Magny-Coursの特長 |
●2個のダイをHyperTransportで接続
Magny-CoursのパッケージはG34で、この名前は第3世代で4チャネルのDDR3インターフェイスを備えるところから来ているという。G34では4ポートのx16のHyperTransport(HT)を備える。x16のHTポートは、2つのx8 HTのように分割可能だ。Istanbul自体は、2チャネルのDDR3インターフェイスと4ポートのx16 HTを持つ。G34のパッケージは、2つのIstanbulダイのインターフェイスを使う。
2個のIstanbulダイは、Magny-CoursのMCM(Multi-Chip Module)パッケージの中で、HTによって相互接続されている。ダイ同士は、1ポートのx16 HTと、x16を分割したx8 HTポートで接続されている。x24分のリンクとなる。下の図では、片方のダイ「プロセッサ0(P0)」が、もう片方のダイ「プロセッサ1(P1)」と、ブルーの線で描かれたx16とx8で接続されている。
それぞれのコアのHT |
P1ダイには4つのx16 HTがあるが、そのうち1つのx16と、半分のx8はP0ダイとの相互接続に使われる。残りのHTのうち1つのx16はノンコヒーレントなHyperTransport(ncHT)として、I/Oチップとの接続に使われる。スライド中の右下のグリーンのx16がそれだ。スライドではコヒーレントHyperTransport(cHT)となっているが、これはncHTの間違いだ。P1ダイの残りの1つのx16と1つのx8は、cHTとしてマルチプロセッサ構成での、他のCPUパッケージとの接続に使われる。
P0ダイも同様で、1つのx16と1つのx8が、cHTとしてマルチプロセッサ接続に使われる。ただし、残った1つのx16は接続されない。P0のx16とx8のcHT、P1のx16とx8のcHT、そしてP1のx16 ncHTで合計してG34ソケットの4ポートのx16 HTを構成する。
マルチプロセッサ時の接続は次のようになる。左の2ソケット構成では、4つのCPUダイがそれぞれ相互接続され、1ホップでアクセスできる。右の4ソケット構成ではそれぞれがx8で接続され2ホップでアクセスできる。
マルチCPU時のHT |
●プローブフィルタをCPUに搭載
Magny-Coursのブロックダイヤグラムは、CPUコア数が6になった以外は、4コアのGreyhound系CPU「Barcelona(バルセロナ)」からそれほど変わっていない。最大の違いは、マルチプロッサ構成時のバス効率を上げる「プローブフィルタ(Probe Filter)」を搭載していること。プローブフィルタは、Magny-CoursとIstanbulの大きな特長となっている。
ブロックダイアグラム |
プローブフィルタは、マルチプロセッサ時に、チップ間のキャッシュコヒーレントの維持のためのトラフィックを減らすことができる。HT Assistと呼ばれるプローブフィルタでは、各プロセッサのキャッシュをトラックするダイレクトリを納めるメモリを持つ必要がある。しかし、CPU内にプローブフィルタ専用のメモリを備えた場合、そのメモリは1CPU構成時には使われない無駄となってしまう。
そこで、Magny-Cours/Istanbulでは、それぞれのダイ毎に備えるL3キャッシュSRAM 6MBのうち1MB分をブローブフィルタのダイレクトリに使う。つまり、プローブフィルタを有効にする場合はL3は各ダイにつき実質5MBに減ることになる。しかし、プローブフィルタ専用のメモリを搭載する必要がないため、効率がよくなる。
ブローブフィルタの仕組み |
L3キャッシュの一部を使用するブローブフィルタ |