ニュース

Intel、データセンター向けCPU「Xeon E5-2600 v2」を発表

~12/10/6コアの3種類のダイをラインナップ

Xeon E5-2600 v2のパッケージ

 Intelは、現在サンフランシスコで開催中のIDF(Intel Developer Forum) 2013に合わせて、同社のデータセンター向けCPU「Xeon」の最新製品となる「E5-2600 v2」シリーズを発表した。

 開発コードネーム「Ivy Bridge-EP」で知られてきた同製品は、昨年(2012年)の3月にリリースされたE5-2600(Sandy Bridge-EP)の後継となる製品で、製造プロセスルールが32nmから22nmに微細化されたほか、最大CPUコア数が8個から12個に強化されるなど、性能と電力効率が改善されているのが特徴になる。

 従来のSandy Bridge-EPでは、8コアのダイのみが用意され、そのダイからCPUコアを無効にすることで6/4コア製品ラインナップを実現していたが、Ivy Bridge-EPでは当初から6/10/12コアという3つのダイデザインを用意し、製造効率を高めたのも特徴の1つと言える。

マイクロアーキテクチャに拡張が加えられているXeon E5-2600 v2

 Xeon E5-2600 v2は、“v2”という製品名からもわかるように、2012年の3月に発表したXeonプロセッサー E5-2600の後継となる製品だ。

 Intelのデータセンターサーバー向けのプロセッサは、4ソケット以上向けの「Xeon E7」、4ソケット向けの「Xeon E5-4600」、2ソケット向けの「Xeon E5-2600/2400」、1ソケット向けの「Xeon E3」、さらには先日「Atom C2000」として発表された低消費電力で高密度サーバー向けの「Atom C」などが用意されている。今回取り上げるXeon E5-2600 v2は、2ソケットのメインストリームサーバー向けとなる。

 Xeon E5-2600 v2を、前世代のXeon E5-2600(Sandy Bridge-EP)、2世代前となるXeon 5600(Westmere-EP)の違いを表にすると、以下のようになる。

【表1】Xeon E5-2600 v2、Xeon E5-2600、Xeon 5600の仕様
製品ブランド-Xeon E5 2600 v2Xeon E5 2600Xeon 5600
開発コードネーム-Ivy Bridge-EPSandy Bridge-EPWestmere-EP
プロセッサマイクロアーキテクチャ-Ivy BridgeSandy BridgeNehalem
製造プロセスルール-22nm32nm32nm
CPUソケット-LGA2011LGA2011LGA1366
CPUコア最大コア数/スレッド(ダイあたり)6/12、10/20、12/248/166/12
AVX対応-
LLC(最大)15MB、20MB、30MB20MB12MB
メモリメモリDDR3/DDR3LDDR3/DDR3LDDR3/DDR3L
メモリチャネル4ch4ch3ch
メモリクロック最大1,866MT/sec最大1,600MT/sec最大1,333MT/sec
最大メモリ容量768GB768GB288GB
電圧1.5/1.35V1.5/1.35V1.5/1.35V
RDIMM
LRDIMM-
I/OQPI2ch2ch2ch
QPI帯域8GT/sec8GT/sec6.4GT/sec
PCI Express内蔵40レーン(Gen3)+4レーン(Gen2/DMI)内蔵40レーン(Gen3)+4レーン(Gen2/DMI)-
PCI Express x16 NTB対応--

 表からも分かるように、最大の違いは、製造プロセスルールがXeon E5-2600の32nmから22nmに微細化されたことだ。

 CPUの世代が新しくなるのは、マイクロアーキテクチャが新しくなるか、新しい製造プロセスルールが導入された時ということになるのだが、Intelはこの2つの要素を交互に導入することで、プロセッサの開発時に生じるさまざまなリスク(開発の失敗や、スケジュールの遅延など)を最小限にする“チックタック”ビジネスモデルを採用している。

 Xeon E5-2600の製造プロセスルールは、その前の世代にあたるXeon 5600シリーズと同じ32nmを利用して製造されていたが、マイクロアーキテクチャを刷新し、PC向けのCoreプロセッサと同じリングバス構造を採用。CPUコア数を8つまで拡張できるようにした。

 それに対して、今回のXeon E5-2600 v2は製造プロセスルールを22nmへ微細化する一方で、マイクロアーキテクチャは若干の拡張を加えるに留めた。しかし、微細化による性能向上と消費電力削減が期待できる。

IntelのIvy Bridge-EPことXeon E5-2600 v2のダイ
プラットフォーム面ではXeon E5-2600シリーズと共通のRomley-EPを利用する、チップセットなども共通

6/10/12コアと3つのダイバリエーションが存在するIvy Bridge-EP

 Xeon E5-2600 v2のマイクロアーキテクチャの改良点は、複数のダイバリエーションの存在と、リングバス構造の拡張だ。

 Xeon E5-2600では、ダイバリエーションは8コアの1つのみで、SKUに用意されていた6/4コアといった製品は、8コアのダイからコアを無効にすることで製品展開をしていた。6コアの製品では2コアを無効にし、4コアの製品では4コアを無効にするといった具合だ。

 しかし、Xeon E5-2600 v2ではダイは12/10/6コアと3つを用意し、後述するSKUにある8コアや4コアは、それぞれ10コア、6コアのダイから2コアを無効にするという形で提供される(実際には10コアから4コアを無効にして6コアにした製品もあるとIntelは説明する。これは製造上の柔軟性を確保するための措置だ)。このようにダイバリエーションを増やすことは、開発や動作検証にコストや時間がかかるという制約は付くものの、無駄が減るという意味で、より効率よく製造できるメリットがある。

 また、12コア版のダイでは、リングバス構造を拡張した。従来のXeon E5-2600では、CPUコア/メモリコントローラ/システムバスなどを双方向のリングバスで接続していたのだが、これが12コア版では三重構造となる。ただし、各CPUコアやシステムバスが接続しているのは2つのリングバスになるという仕組みは変わらない。

 12コア版では、そのままではレイテンシが増大する可能性があるため、こうした構造を採ったのだとIntelは説明する。また、三重リングバスを採用したことにより、メモリコントローラも増やすことができるようになった(ただしチャネル数は従来と変わらず4チャネル)。これにより、12コアではメモリ帯域の効率性が向上している。

 Xeon E5-2600 v2は従来と同様、L3キャッシュがCPUコアに付随して配置される。各コアあたり2.5MBのL3キャッシュが付随するため、12コア版では30MB、10コア版では25MB、6コア版では15MBのL3キャッシュを搭載する。

 CPUコアのアーキテクチャそのものは、クライアントPC向けの第3世代Coreプロセッサ(開発コードネーム:Ivy Bridge)に採用されているコアと共通で違いはない。Sandy Bridgeからの内部効率の改善と、Float 16-SPコンバージョンなどがAVX/SSEに追加されたことなどが強化点となる。

 また、6コアのダイは、コンシューマのハイエンド向けデスクトップCPU「Core i7」のLGA2011ソケット版に転用される(別記事参照)。Core i7-4960X、i7-3970X、i7-3960Xは開発コードネームIvy Bridge-Eの名前が与えられているが、これはIvy Bridge-EPの6コア版そのものだと考えていい。

Sandy Bridge-EPとの最大の違いは、12コア時にリングバスの構造が変わっていること。12コア時にはリングバスが三重構造となるが、各コアやメモリコントローラを貫くリングバスが最大2つであることは変わらない。
Xeon E5-2600 v2のダイ構成。6コア、10コア、12コアの3つのダイが用意される
Xeon E5-2600 v2のコア以外の部分の変更点。CPUコアの設計そのものはクライアントの第3世代Coreプロセッサ(Ivy Bridge)と共通

プラットフォームはRomley-EPで共通だが、PCI Express効率が改善

 Xeon E5-2600 v2のプラットフォームは、Romley-EPの開発コードネームが与えられている、Xeon E5-2600と同じモノを利用することになる。チップセットも同じC600シリーズ(開発コードネーム:Patsburg)で、マザーボードはファームウェアのアップグレードは必要になるが、基本的に同じマザーボードが利用できる(サポートされるかはメーカーによる)。プロセッサ間の接続に利用されるQPIが2つ、CPU毎に40レーンのPCI Express Gen 3.0、チップセットに接続していないCPUがPCI Express Gen2が4レーンを提供できるという、プラットフォーム側の仕様は何も変わっていない(ただしメモリは新たに1,866MT/secに対応)。

PCI Express Gen3コントローラは従来と同じだが、機能の追加で帯域効率などが向上している

 ただし、PCI Expressのコントローラ内部には改良が入っており、PCI Express Gen3の仕様でオプションとして規定されているPCIe Atomic(フェッチ機能、スワップ機能など)やx16NTB(Non-Transparent Bridge、Sandy Bridge-EP世代ではx8NTBまで対応)などの機能を追加。これらにより帯域の有効活用が可能になるほか、追加のクロックゲーティング機能などにより省電力性も高まっている。こうした機能により、PCI Expressに、GPUを追加してGPGPUとして利用する場合に効率が高まるとIntelでは説明している。

前世代と比較して26~45%の性能向上を実現しているXeon E5-2600 v2シリーズ

 Intelの発表によれば、Xeon E5-2600 v2は以下のようなSKUが用意されている。

【表2】Xeon E5-2600 v2のSKU構成(Wが付くのはワークステーション版、Lが付くのが省電力向け版)
プロセッサナンバーコア数/スレッド数クロック周波数(ターボモード時)ターボブースト対応L3キャッシュQPIクロック周波数ソケットTDP千個ロット時価格(米ドル)
E5-2697 v212/242.7GHz(3.5GHz)30MB8.00 GT/secLGA2011130W2,614
E5-2695 v212/242.4GHz(3.2GHz)30MB8.00 GT/secLGA2011115W2,336
E5-2690 v210/203GHz(3.6GHz)25MB8.00 GT/secLGA2011130W2,057
E5-2680 v210/202.8GHz(3.6GHz)25MB8.00 GT/secLGA2011115W1,723
E5-2670 v210/202.5GHz(3.3GHz)25MB8.00 GT/secLGA2011115W1,552
E5-2660 v210/202.2GHz(3GHz)25MB8.00 GT/secLGA201195W1,389
E5-2650 v28/162.6GHz(3.4GHz)20MB8.00 GT/secLGA201195W1,166
E5-2640 v28/162GHz(2.5GHz)20MB7.20 GT/secLGA201195W885
E5-2630 v26/122.6GHz(3.1GHz)15MB7.20 GT/secLGA201180W612
E5-2620 v26/122.1GHz(2.6GHz)15MB7.20 GT/secLGA201180W406
E5-2609 v24/42.5GHz×10MB6.40 GT/secLGA201180W294
E5-2603 v24/41.8GHz×10MB6.40 GT/secLGA201180W202
E5-2650L v210/201.70GHz(2.2GHz)25MB8.00 GT/secLGA201170W1,219
E5-2630L v26/122.4GHz(2.8GHz)15MB7.20 GT/secLGA201160W612
E5-2687W v28/163.4GHz(4GHz)25MB8.00 GT/secLGA2011150W2,108
E5-2667 v28/163.3GHz(4GHz)25MB8.00 GT/secLGA2011130W2,057
E5-2643 v26/123.5GHz(3.8GHz)25MB8.00 GT/secLGA2011130W1,552
E5-2637 v24/83.5GHz(3.8GHz)15MB8.00 GT/secLGA2011130W996
E5-1660 v26/123.7GHz(4GHz)15MBLGA2011130W1,080
E5-1650 v26/123.5GHz(3.9GHz)12MBLGA2011130W583
E5-1620 v24/83.7GHz(3.9GHz)10MBLGA2011130W294

 12/10/8/6/4コアと各種の製品が用意されており、ユーザーはニーズや消費電力のバランスから必要な製品を選択することができる。

 なお、Intelは発表と同時にベンチマーク結果も発表しており、その結果は以下のようになっている。

Intelが公開したSPEC_rate_base2006とSPECpower_ssj2008のベンチマーク結果
Dynamic Web Benchmark、SPECvirt_sc2010、SPECjbb2013の結果
OLTP、SAP-SD 2-Tierのベンチマーク結果
STREAM、SPECfp_rate_base2006、Linpackのベンチマーク結果
科学演算のベンチマーク結果
Xeon E5-2697 v2(2.7GHz、12コア、TDP 130W)と前世代のXeon E5-2690(2.9GHz、8コア、TDP 135W)の比較データ。26~46%程度の性能向上が確認できる
Xeon E5-2697 v2(2.7GHz、12コア、TDP 130W)と、2世代前の製品(Xeon X5580=Westmere-EP)と3世代前の製品(Xeon X5570=Nehalem-EP)との比較

 最上位SKUとなるXeon E5-2697 v2(2.7GHz、12コア、TDP 130W)は、前世代のXeon E5-2690(2.9GHz、8コア、TDP 135W)と比較して26~47%程度の性能向上を実現していることが分かる。さらに2世代前のXeon X5570との比較では概ね2.2倍、3世代前のXeon X5570との比較では概ね3.3倍の性能向上があることが確認できたとIntelでは説明している。

(笠原 一輝)