後藤弘茂のWeekly海外ニュース

PCI Express Gen3とDDR3-1600をサポートするSandy Bridge



●デスクトップとUPサーバー向けのSocket H2(LGA1155)

 Intelの次世代CPUアーキテクチャ「Sandy Bridge(サンディブリッジ)」は、現在の「Nehalem(ネヘイレム)」からCPUソケットを一新。新プラットフォームとなる。これは、サーバー向けNehalemと、サーバー版Sandy Bridgeでは、CPUダイ(半導体本体)に統合したインターフェイス構成が異なるためだ。デスクトップCPUのソケットも、ベースはサーバーソケットと共通となっている。

サーバー版Sandy Bridgeの分類
PDF版はこちら

 Sandy BridgeのCPUソケットのうち、メインストリームデスクトップPCとエントリサーバーをカバーするのは「Socket H2(LGA1155)」だ。UP(ユニプロセッサ)向けのSocket H2(LGA1155)はミニマムのインターフェイスを備えたソケットとなっている。メモリインターフェイスはデュアルチャネルDDR3。デスクトップPCとサーバーとも、Unbuffered DIMM(UDIMM)でDDR3-1066/1333に対応する。ECCありなしどちらもOKで、1チャネルにつき2DIMMで合計4DIMMをサポートする。DDR3-1333時のメモリ帯域は21.3GB/secとなる。

 I/O回りでは、PCI Express Gen2をサポート。PCI Express Gen3はサポートされない。また、サーバー&ワークステーション向けとデスクトップPC向けでは、同じLGA1155 CPUでも、PCI Express回りの構成が異なっている。

 サーバー&ワークステーションではPCI Express Gen2は20レーンを備えており、Nehalem系より4レーン増えている。また、PCI Expressコントローラも4つ備えているため、合計20レーンの枠内で4リンクまでの構成が可能だ。例えば、サーバーならx4を3リンクにx8を1リンク、ワークステーションならx16が1リンクにx4が1リンクといった構成が取れる。それに対して、クライアントのデスクトップPC向けはPCI Express Gen2が16レーンで3コントローラと制約されている。そのため、通常はx16を1リンクまたはx8を2リンクといった構成となる。

Socket H2(LGA1155) Sandy Bridge
PDF版はこちら

 Socket H2(LGA1155)では、PCH(Platform Controller Hub)「Cougar Point(クーガーポイント)」との接続に、汎用のDMI Gen2 x4を使う。PCHとの接続帯域も2倍にアップしている。また、デスクトップPCとワークステーションでは、グラフィックス用のFDIもPCH間接続に用いる。これは、Socket H2のSandy BridgeだけがGPUコアを内蔵するためで、他のソケットは備えていないフィーチャとなっている。

 Socket H2(LGA1155)のプラットフォームは、デスクトップPCでは「Sugar Bay(シュガーベイ)」、サーバー&ワークステーションでは「Bromolow(ブロモロウ)」となる。

 Socket H2(LGA1155)は、2チャネルメモリにPCI Express Gen2、DMIとFDIと、現在のLGA1156(Socket H1)とよく似た構成となっている。対応CPUのCPUコア数は最大4コアで、これも現在のLGA1156 CPUと同じだ。L3キャッシュは、各コア1.5MBまで対応で、4コア版では6MB、2コア版では3MBのL3キャッシュとなる。TDP(Thermal Design Power:熱設計消費電力)の枠は95Wまでだ。また、2012年までに登場する22nm版のSandy Bridge系CPU「Ivy Bridge(アイビーブリッジ)」も、Socket H2(LGA1155)となる。

●デュアルプロセッサ向けのSocket B2(LGA1356)

 DP(デュアルプロセッサ)または高級版UP(ユニプロセッサ)向けのSocket B2(LGA1356)は、Socket H2と比べると大幅にインターフェイスが拡張される。メモリインターフェイスは3チャネルのDDR3と、現在のLGA1366と同じだが、ピーク帯域と対応メモリが異なる。

 Socket B2(LGA1356)ではSocket H2(LGA1155)と異なり、従来のDDR3だけでなく、インターフェイス電圧を1.5Vから1.35Vに落とした低電圧版のDDR3Lをサポートする。Sandy Bridgeと同じ32nmで製造される「Westmere-6C」のダイでも、DDR3Lはサポートされている。この他、Socket B2では、UDIMMだけでなく、Registered DIMM(RDIMM)とLoad-Reduced DIMM(LRDIMM)に対応する。

Socket B2(LGA1356) Sandy Bridge
PDF版はこちら

 メモリスピードも最大1,600MT/secのDDR3-1600までをサポートする。DDR3-1600時のメモリ帯域は38.4GB/secとなり、Socket H2より80%もアップする。ただし、DDR3-1600をサポートできるのは、1チャネルに1DIMM(1DPC)だけを挿してポイントツーポイント的な使い方をした時のみ。1チャネルに2DIMM(2DPC)を挿す場合には、どちらのDIMMも最高DDR3-1333で駆動することになる。

 また、低電圧のDDR3Lを使う場合は1DPC時に1,333MT/sec、2DPC時に1,066MT/secと1グレードスピードが落ちる。1チャネルにつき2DIMMまでで合計6DIMMをサポートする。メモリ容量は8G DIMMを使う場合に最大48GBとなる。デュアルソケット構成なら96GBのシステムメモリとなる。ただし、LRDIMM使用時についてはわかっていない。

●Socket B2はPCI Express Gen3に初めて対応する

 従来のNehalem系のLGA1366 CPUは、CPU側にPCI Expressを持っていなかった。しかし、Sandy Bridge系のSocket B2(LGA1356)CPUは、CPUダイ側にインターフェイスを持つ。従来のPCI Express Gen2ではなく、新たにPCI Express Gen3をサポートする。転送レートは8GT/secとなった。レーン数は24で、コントローラは6つ。図では、x8構成を3リンクにしてあるが、6リンクまで自由にリンクの構成を取ることができる。この他、PCHとの接続用にDMI Gen2 x4を備えている。このインターフェイスは、PCI Express Gen2 x4に転用することもできる。

 Socket B2(LGA1356)はDP(デュアルプロセッサ)構成をサポートするため、CPU間インターコネクトとしてQuickPath Interconnect(QPI)を備えている。QPIは従来の最高6.4GT/secのリンクスピードより高速な7.2と8GT/secをサポート。IntelはWestmere-6Cのダイでも8GT/secを達成したとISSCC 2010で説明しており、32nmプロセスのQPIマクロが8GT/secに対応していると推定される。

 Socket B2(LGA1356)はQPIをサポートするものの、そのリンク数は1リンクまで(1ソケット向けでは0リンク)に限られている。NehalemでのUP/DP向けのLGA1366は、最大2リンクのQPIをサポートしていたが、1リンク削られた。これは、Socket B2ではLGA1366と異なり、QPIはCPU間の接続だけに使い、チップセットとの接続はDMI(プラス付加的にPCI Express)で行なうためだ。DP/MPについては、システムのトポロジが若干変わった。

 概観すると、Socket B2(LGA1356)は、基本的には現在のLGA1366の後継だが、機能面では大幅な拡張と変更がなされていることがわかる。対応PCHは「Patsburg(パッツバーグ)」でサーバーでのプラットフォームは「Romley-EN(ロムレイEN)」となる。

 対応するCPUはSandy Bridge-EN系で、最大8コアで2/4/6コアのバリエーションもある。22nmのIvy Bridge-ENも同ソケットとなる。TDP(Thermal Design Power:熱設計消費電力)は95Wまでサポートする。また、CPUコア当たりのL3キャッシュ量は各コア当たり2.5MBをサポートする。8コア版は20MB、6コア版が15MB、4コア版が10MB、2コア版が5MBとなる。また、パフォーマンスデスクトップPCのソケットもSocket B2ベースになると見られる。パフォーマンスデスクトップPCのCPU自体が8コアダイをベースにするからだ。

Intel CPU移行図
PDF版はこちら

●4チャネルDDR3をサポートするマルチプロセッサ向けのSocket R(LGA2011)

 Sandy Bridgeのソケットでややこしいのは、上位DP(デュアルプロセッサ)サーバーと、下位のMP(マルチプロセッサ)サーバー向けの「Socket R(LGA2011)」があることだ。Socket Rは、Socket B2よりさらにインターフェイスが拡張されている。

 Socket R(LGA2011)のメモリインターフェイスは4チャネルのDDR3。Socket B2(LGA1356)より1チャネル増えており、メモリ帯域は最大51.2GB/secとなる。Socket B2(LGA1356)と同様に、従来のDDR3だけでなく低電圧版のDDR3Lをサポートし、UDIMMだけでなく、Registered DIMM(RDIMM)とLoad-Reduced DIMM(LRDIMM)に対応する。メモリスピードも最大1,600MT/secのDDR3-1600までをサポートするが、DDR3-1600をサポートできるのは1チャネルに1DIMM(1DPC)だけの場合。1チャネルに2DIMM(2DPC)では、2つのDIMMとも最高DDR3-1333で駆動することになる。低電圧のDDR3Lのグレードスピードが落ちることもSocket B2(LGA1356)と同様。

Socket R(LGA2011) Sandy Bridge
PDF版はこちら

 メモリインターフェイス回りでのSocket B2(LGA1356)との大きな違いは、1チャネルに3DIMM(3DPC)の大容量構成をサポートすること。ただし、その場合はメモリスピードは3枚のDIMMとも800MT/secに落ちる。つまり、3DPCの大容量構成は、DDR3-800でしか実現できない。メモリ容量は8G DIMMを使う場合に最大96GBとなる。4ソケット構成なら96GBのシステムメモリは384GBとなる。ちなみに、Socket R(LGA2011)とSocket B2(LGA1356)のCPUでは、CPUのアドレス空間はバーチャル48bits、物理46bitsに拡張されている。

 Socket R(LGA2011)では、CPUに統合するPCI Express Gen3のレーン数も40へと大幅に拡張される。コントローラは10個で、40レーンを10リンクまで自由に構成することができる。PCHとの接続用のDMI2 x4を、PCI Express Gen2 x4に転用することもできる点はSocket B2(LGA1356)と同じだ。

 Socket R(LGA2011)は、MP(マルチプロセッサ)構成もサポートするため、CPU間インターコネクトとしてQuickPath Interconnect(QPI)を2リンク備えている。QPIは6.4GT/secより高速な7.2と8GT/secをサポートする。

 概観すると、Socket R(LGA2011)は、NehalemのLGA1366より大幅に拡張された1ランク上のソケット仕様であることがわかる。対応チップセットはSocket B2(LGA1356)と同様に「Patsburg(パッツバーグ)」。対応するCPUはSandy Bridge-EP系とSandy Bridge-EX系で、22nmのIvy Bridge-EPとIvy Bridge-EX-Bもサポートする。プラットフォームはEP系が「Romley-EP(ロムレイEP)」で、EX系が「Romley-EX(ロムレイEX)」。

 サポートするCPUコア数は最大8コアで4/6コアのバリエーションもある。TDP(Thermal Design Power:熱設計消費電力)は最大130Wまでサポートし、ワークステーション版では150Wも予定している。CPUコア当たりのL3キャッシュ量は各コア当たり2.5MBをサポートする。

 Sandy Bridgeのソケット群を概観するとわかるのは、かなり思い切った拡張を行なっている点。特に、Socket R(LGA2011)とSocket B2(LGA1356)は、Sandy Bridge世代だけでなく、Ivy Bridgeを含めた2年間を支えるための仕様として作られたように見える。

NehalemとSandy/Ivy Bridgeのマルチプロセッサ構成
PDF版はこちら