ニュース

Intel、データセンター向けCPU「Xeon E5-2600 v2」を発表

〜12/10/6コアの3種類のダイをラインナップ

Xeon E5-2600 v2のパッケージ

 Intelは、現在サンフランシスコで開催中のIDF(Intel Developer Forum) 2013に合わせて、同社のデータセンター向けCPU「Xeon」の最新製品となる「E5-2600 v2」シリーズを発表した。

 開発コードネーム「Ivy Bridge-EP」で知られてきた同製品は、昨年(2012年)の3月にリリースされたE5-2600(Sandy Bridge-EP)の後継となる製品で、製造プロセスルールが32nmから22nmに微細化されたほか、最大CPUコア数が8個から12個に強化されるなど、性能と電力効率が改善されているのが特徴になる。

 従来のSandy Bridge-EPでは、8コアのダイのみが用意され、そのダイからCPUコアを無効にすることで6/4コア製品ラインナップを実現していたが、Ivy Bridge-EPでは当初から6/10/12コアという3つのダイデザインを用意し、製造効率を高めたのも特徴の1つと言える。

マイクロアーキテクチャに拡張が加えられているXeon E5-2600 v2

 Xeon E5-2600 v2は、“v2”という製品名からもわかるように、2012年の3月に発表したXeonプロセッサー E5-2600の後継となる製品だ。

 Intelのデータセンターサーバー向けのプロセッサは、4ソケット以上向けの「Xeon E7」、4ソケット向けの「Xeon E5-4600」、2ソケット向けの「Xeon E5-2600/2400」、1ソケット向けの「Xeon E3」、さらには先日「Atom C2000」として発表された低消費電力で高密度サーバー向けの「Atom C」などが用意されている。今回取り上げるXeon E5-2600 v2は、2ソケットのメインストリームサーバー向けとなる。

 Xeon E5-2600 v2を、前世代のXeon E5-2600(Sandy Bridge-EP)、2世代前となるXeon 5600(Westmere-EP)の違いを表にすると、以下のようになる。

【表1】Xeon E5-2600 v2、Xeon E5-2600、Xeon 5600の仕様
製品ブランド - Xeon E5 2600 v2 Xeon E5 2600 Xeon 5600
開発コードネーム - Ivy Bridge-EP Sandy Bridge-EP Westmere-EP
プロセッサマイクロアーキテクチャ - Ivy Bridge Sandy Bridge Nehalem
製造プロセスルール - 22nm 32nm 32nm
CPUソケット - LGA2011 LGA2011 LGA1366
CPUコア 最大コア数/スレッド(ダイあたり) 6/12、10/20、12/24 8/16 6/12
AVX対応 -
LLC(最大) 15MB、20MB、30MB 20MB 12MB
メモリ メモリ DDR3/DDR3L DDR3/DDR3L DDR3/DDR3L
メモリチャネル 4ch 4ch 3ch
メモリクロック 最大1,866MT/sec 最大1,600MT/sec 最大1,333MT/sec
最大メモリ容量 768GB 768GB 288GB
電圧 1.5/1.35V 1.5/1.35V 1.5/1.35V
RDIMM
LRDIMM -
I/O QPI 2ch 2ch 2ch
QPI帯域 8GT/sec 8GT/sec 6.4GT/sec
PCI Express 内蔵40レーン(Gen3)+4レーン(Gen2/DMI) 内蔵40レーン(Gen3)+4レーン(Gen2/DMI) -
PCI Express x16 NTB対応 - -

 表からも分かるように、最大の違いは、製造プロセスルールがXeon E5-2600の32nmから22nmに微細化されたことだ。

 CPUの世代が新しくなるのは、マイクロアーキテクチャが新しくなるか、新しい製造プロセスルールが導入された時ということになるのだが、Intelはこの2つの要素を交互に導入することで、プロセッサの開発時に生じるさまざまなリスク(開発の失敗や、スケジュールの遅延など)を最小限にする“チックタック”ビジネスモデルを採用している。

 Xeon E5-2600の製造プロセスルールは、その前の世代にあたるXeon 5600シリーズと同じ32nmを利用して製造されていたが、マイクロアーキテクチャを刷新し、PC向けのCoreプロセッサと同じリングバス構造を採用。CPUコア数を8つまで拡張できるようにした。

 それに対して、今回のXeon E5-2600 v2は製造プロセスルールを22nmへ微細化する一方で、マイクロアーキテクチャは若干の拡張を加えるに留めた。しかし、微細化による性能向上と消費電力削減が期待できる。

IntelのIvy Bridge-EPことXeon E5-2600 v2のダイ
プラットフォーム面ではXeon E5-2600シリーズと共通のRomley-EPを利用する、チップセットなども共通

6/10/12コアと3つのダイバリエーションが存在するIvy Bridge-EP

 Xeon E5-2600 v2のマイクロアーキテクチャの改良点は、複数のダイバリエーションの存在と、リングバス構造の拡張だ。

 Xeon E5-2600では、ダイバリエーションは8コアの1つのみで、SKUに用意されていた6/4コアといった製品は、8コアのダイからコアを無効にすることで製品展開をしていた。6コアの製品では2コアを無効にし、4コアの製品では4コアを無効にするといった具合だ。

 しかし、Xeon E5-2600 v2ではダイは12/10/6コアと3つを用意し、後述するSKUにある8コアや4コアは、それぞれ10コア、6コアのダイから2コアを無効にするという形で提供される(実際には10コアから4コアを無効にして6コアにした製品もあるとIntelは説明する。これは製造上の柔軟性を確保するための措置だ)。このようにダイバリエーションを増やすことは、開発や動作検証にコストや時間がかかるという制約は付くものの、無駄が減るという意味で、より効率よく製造できるメリットがある。

 また、12コア版のダイでは、リングバス構造を拡張した。従来のXeon E5-2600では、CPUコア/メモリコントローラ/システムバスなどを双方向のリングバスで接続していたのだが、これが12コア版では三重構造となる。ただし、各CPUコアやシステムバスが接続しているのは2つのリングバスになるという仕組みは変わらない。

 12コア版では、そのままではレイテンシが増大する可能性があるため、こうした構造を採ったのだとIntelは説明する。また、三重リングバスを採用したことにより、メモリコントローラも増やすことができるようになった(ただしチャネル数は従来と変わらず4チャネル)。これにより、12コアではメモリ帯域の効率性が向上している。

 Xeon E5-2600 v2は従来と同様、L3キャッシュがCPUコアに付随して配置される。各コアあたり2.5MBのL3キャッシュが付随するため、12コア版では30MB、10コア版では25MB、6コア版では15MBのL3キャッシュを搭載する。

 CPUコアのアーキテクチャそのものは、クライアントPC向けの第3世代Coreプロセッサ(開発コードネーム:Ivy Bridge)に採用されているコアと共通で違いはない。Sandy Bridgeからの内部効率の改善と、Float 16-SPコンバージョンなどがAVX/SSEに追加されたことなどが強化点となる。

 また、6コアのダイは、コンシューマのハイエンド向けデスクトップCPU「Core i7」のLGA2011ソケット版に転用される(別記事参照)。Core i7-4960X、i7-3970X、i7-3960Xは開発コードネームIvy Bridge-Eの名前が与えられているが、これはIvy Bridge-EPの6コア版そのものだと考えていい。

Sandy Bridge-EPとの最大の違いは、12コア時にリングバスの構造が変わっていること。12コア時にはリングバスが三重構造となるが、各コアやメモリコントローラを貫くリングバスが最大2つであることは変わらない。
Xeon E5-2600 v2のダイ構成。6コア、10コア、12コアの3つのダイが用意される
Xeon E5-2600 v2のコア以外の部分の変更点。CPUコアの設計そのものはクライアントの第3世代Coreプロセッサ(Ivy Bridge)と共通

プラットフォームはRomley-EPで共通だが、PCI Express効率が改善

 Xeon E5-2600 v2のプラットフォームは、Romley-EPの開発コードネームが与えられている、Xeon E5-2600と同じモノを利用することになる。チップセットも同じC600シリーズ(開発コードネーム:Patsburg)で、マザーボードはファームウェアのアップグレードは必要になるが、基本的に同じマザーボードが利用できる(サポートされるかはメーカーによる)。プロセッサ間の接続に利用されるQPIが2つ、CPU毎に40レーンのPCI Express Gen 3.0、チップセットに接続していないCPUがPCI Express Gen2が4レーンを提供できるという、プラットフォーム側の仕様は何も変わっていない(ただしメモリは新たに1,866MT/secに対応)。

PCI Express Gen3コントローラは従来と同じだが、機能の追加で帯域効率などが向上している

 ただし、PCI Expressのコントローラ内部には改良が入っており、PCI Express Gen3の仕様でオプションとして規定されているPCIe Atomic(フェッチ機能、スワップ機能など)やx16NTB(Non-Transparent Bridge、Sandy Bridge-EP世代ではx8NTBまで対応)などの機能を追加。これらにより帯域の有効活用が可能になるほか、追加のクロックゲーティング機能などにより省電力性も高まっている。こうした機能により、PCI Expressに、GPUを追加してGPGPUとして利用する場合に効率が高まるとIntelでは説明している。

前世代と比較して26〜45%の性能向上を実現しているXeon E5-2600 v2シリーズ

 Intelの発表によれば、Xeon E5-2600 v2は以下のようなSKUが用意されている。

【表2】Xeon E5-2600 v2のSKU構成(Wが付くのはワークステーション版、Lが付くのが省電力向け版)
プロセッサナンバー コア数/スレッド数 クロック周波数(ターボモード時) ターボブースト対応 L3キャッシュ QPIクロック周波数 ソケット TDP 千個ロット時価格(米ドル)
E5-2697 v2 12/24 2.7GHz(3.5GHz) 30MB 8.00 GT/sec LGA2011 130W 2,614
E5-2695 v2 12/24 2.4GHz(3.2GHz) 30MB 8.00 GT/sec LGA2011 115W 2,336
E5-2690 v2 10/20 3GHz(3.6GHz) 25MB 8.00 GT/sec LGA2011 130W 2,057
E5-2680 v2 10/20 2.8GHz(3.6GHz) 25MB 8.00 GT/sec LGA2011 115W 1,723
E5-2670 v2 10/20 2.5GHz(3.3GHz) 25MB 8.00 GT/sec LGA2011 115W 1,552
E5-2660 v2 10/20 2.2GHz(3GHz) 25MB 8.00 GT/sec LGA2011 95W 1,389
E5-2650 v2 8/16 2.6GHz(3.4GHz) 20MB 8.00 GT/sec LGA2011 95W 1,166
E5-2640 v2 8/16 2GHz(2.5GHz) 20MB 7.20 GT/sec LGA2011 95W 885
E5-2630 v2 6/12 2.6GHz(3.1GHz) 15MB 7.20 GT/sec LGA2011 80W 612
E5-2620 v2 6/12 2.1GHz(2.6GHz) 15MB 7.20 GT/sec LGA2011 80W 406
E5-2609 v2 4/4 2.5GHz × 10MB 6.40 GT/sec LGA2011 80W 294
E5-2603 v2 4/4 1.8GHz × 10MB 6.40 GT/sec LGA2011 80W 202
E5-2650L v2 10/20 1.70GHz(2.2GHz) 25MB 8.00 GT/sec LGA2011 70W 1,219
E5-2630L v2 6/12 2.4GHz(2.8GHz) 15MB 7.20 GT/sec LGA2011 60W 612
E5-2687W v2 8/16 3.4GHz(4GHz) 25MB 8.00 GT/sec LGA2011 150W 2,108
E5-2667 v2 8/16 3.3GHz(4GHz) 25MB 8.00 GT/sec LGA2011 130W 2,057
E5-2643 v2 6/12 3.5GHz(3.8GHz) 25MB 8.00 GT/sec LGA2011 130W 1,552
E5-2637 v2 4/8 3.5GHz(3.8GHz) 15MB 8.00 GT/sec LGA2011 130W 996
E5-1660 v2 6/12 3.7GHz(4GHz) 15MB LGA2011 130W 1,080
E5-1650 v2 6/12 3.5GHz(3.9GHz) 12MB LGA2011 130W 583
E5-1620 v2 4/8 3.7GHz(3.9GHz) 10MB LGA2011 130W 294

 12/10/8/6/4コアと各種の製品が用意されており、ユーザーはニーズや消費電力のバランスから必要な製品を選択することができる。

 なお、Intelは発表と同時にベンチマーク結果も発表しており、その結果は以下のようになっている。

Intelが公開したSPEC_rate_base2006とSPECpower_ssj2008のベンチマーク結果
Dynamic Web Benchmark、SPECvirt_sc2010、SPECjbb2013の結果
OLTP、SAP-SD 2-Tierのベンチマーク結果
STREAM、SPECfp_rate_base2006、Linpackのベンチマーク結果
科学演算のベンチマーク結果
Xeon E5-2697 v2(2.7GHz、12コア、TDP 130W)と前世代のXeon E5-2690(2.9GHz、8コア、TDP 135W)の比較データ。26〜46%程度の性能向上が確認できる
Xeon E5-2697 v2(2.7GHz、12コア、TDP 130W)と、2世代前の製品(Xeon X5580=Westmere-EP)と3世代前の製品(Xeon X5570=Nehalem-EP)との比較

 最上位SKUとなるXeon E5-2697 v2(2.7GHz、12コア、TDP 130W)は、前世代のXeon E5-2690(2.9GHz、8コア、TDP 135W)と比較して26〜47%程度の性能向上を実現していることが分かる。さらに2世代前のXeon X5570との比較では概ね2.2倍、3世代前のXeon X5570との比較では概ね3.3倍の性能向上があることが確認できたとIntelでは説明している。

(笠原 一輝)