後藤弘茂のWeekly海外ニュース

BecktonからClarkdaleまでの実態が明らかに



●スケーラブルなNehalemファミリの設計

 「Nehalem(ネヘイレム)」マイクロアーキテクチャのCPUダイがほとんど出そろった。ダイを並べて明瞭にわかるのは、Nehalem系がスケーラブルなレイアウトになっていること。しかし、ダイサイズには、奇妙な不自然さが見えてくる。CPUダイの中でI/O関係の部分が占める割合が支配的になりつつあることだ。

 最上位の8コアの「Nehalem-EX(Beckton:ベックトン)」では、特にCPUコア以外の部分の比率が高い。Nehalem-EXはL3キャッシュも24MBと大きいが、さらに内部をリングバスで接続している。Intelは共有L3と呼んでいるが、実際にはCPUコアがそれぞれ3MBのL3に接続されL3のタグも各コアが備える。L3までをミスした場合にリング経由でスヌープする。

Nehalem系CPUの比較

 一見してわかるように、Nehalem系では8コアのNehalem-EXから、クアッドコアコアの「Bloomfield(ブルームフィールド)/Gainestown(ゲインズタウン)」、「Lynnfield(リンフィールド)」、「Clarksfield(クラークスフィールド)」まで、CPUコア自体のレイアウトにはほぼ変化が見られない。32nm化してマイクロアーキテクチャ上の拡張を加えたWestmere(ウエストミア)系の「Clarkdale(クラークデール)」「Arrandale(アランデール)」のコアでもほとんどレイアウトには手を入れていない。

 CPUコアだけではない。4コアのBloomfield系とLynnfield系に至っては、PCI Express関連の部分を除けば、他の部分はほぼそっくりだ。しかし、これは奇妙な話だ。というのは、Lynnfield系はBloomfield系からQuickPath Interconnect(QPI)を取り除き、DDR3メモリインターフェイスを3チャネルから2チャネルに縮小した上で、PCI Express Gen 2 x16とDMIを実装した製品のはずだったからだ。ところが、ダイを見ると、Bloomfieldが備えるI/Oは全て揃えた上で、PCI Expressを加えたように見える。

●実はBloomfieldのスーパーセットだったLynnfield系ダイ

 9月22日からサンフランシスコで開催された「Intel Developer Forum(IDF)」では、その理由の一部が明らかにされた。IDFでは、Nehalem系の新しい4コアCPUが明らかにされた。組み込み向けのCPU「Jasper Forest(ジャスパーフォレスト)」で、3チャネルのメモリコントローラにPCI Express Gen 2 x16とQPI 1リンクを備える。そして、Jasper Forestとして公開されたダイは、Lynnfieldのダイとレイアウトが同じものだった。

IDFで公開された組み込み向けの「Jasper Forese」

 実際にはLynnfield系の4コアCPUは、BloomfieldのフルI/Oを備えており、Lynnfield/Clarksfieldでは、一部が無効にされているだけだということだ。Jasper Forestではほとんどの機能が有効になっている。つまり、IntelはスーパーセットのCPUを一種類設計して、そこから製品を派生させている。これは、Intelがよく使う方法で、珍しくはない。

 この設計のために、Intelの現在のCPUラインナップでは奇妙な逆転現象が起きている。価格レンジが高いBloomfield系よりも、価格レンジが低いLynnfield系の方がCPUのダイサイズが大きい。Bloomfieldが263平方mm程度なのに対して、Lynnfieldは296平方mm程度と10%以上も膨らんでいる。通常は、ダイが小さく製造コストが安いCPUの方が価格が安い。実際には、コストはもう少し複雑だ。Lynnfieldのダイ上で無効されているブロックには不良があっても歩留まりには関係がない。そのため、逆転していてもおかしくはないが、メインストリームデスクトップをカバーするCPUとしてはダイが大きい。

 Lynnfieldとほとんど同じ価格帯に並ぶCore Microarchitecture(Core MA)の4コア「Yorkfield(ヨークフィールド)」と比べるよくわかる。Yorkfieldは、2つのCPUダイをMCM(Multi-Chip Module)で封止しており、L2が4MB/6MBのバージョンは1個のダイが81平方mmだ。2個合計で162平方mm分のダイということになる。

CPUのダイサイズ

●2コアのClarkdale/Arrandaleは小さなダイ

 IDFでは、Nehalemマイクロアーキテクチャのデュアルコア版であるClarkdale/Arrandaleのダイも明らかにされた。Clarkdale/Arrandaleは、CPUパッケージの中に、CPUだけでなく、GMCH(Graphics Memory Controller Hub)の機能を全て統合する。CPUにGPUコアを統合するのはデュアルコア製品のClarkdale/Arrandaleだけで、クアッドコア系のLynnfield/ClarksfieldはGPUが統合されていない。

 ただし、Clarkdale/Arrandaleでは、GPUコアはGMCH(Graphics Memory Controller Hub)ダイに分離されている。GMCH側のコードネームは「Iron Lake(アイロンレイク)」で、GMCHの慣習通りLakeがついたコードネームとなっている。もともとIntelは、デスクトップではデュアルコアはGMCHを別パッケージとした3チップ構成を計画していたが、最終的にCPUと統合したMCMパッケージになった。次のSandy Bridge(サンディブリッジ)マイクロアーキテクチャからは、GMCHの機能はCPUダイに統合される。

2ダイのClarkdale/Arrandale

 Clarkdale/ArrandaleのCPUダイである「Dual-core Westmere」は32nmプロセス。ダイサイズは推定で80平方mm以下となる。このダイサイズは、同じ2コアなら45nmのPenryn 3Mの81平方mm、1コアなら65nmのMerom-Lの80平方mm、さらに遡れば90nmのDothanの87平方mmや130nmのBaniasの82平方mmとほぼ同クラスだ。つまり、IntelのモバイルCPUが、各プロセス世代で保ってきたダイサイズに並ぶことになる。CPUコアのサイズは、45nm世代のNehalemが約29平方mmであるのに対して、32nm世代のWestmereコアは17平方mm以下にシュリンクしている。シュリンク率は50%台の後半となる。

CPUダイサイズの推移

 一方、GMCHであるIron Lakeは45nmプロセスで、ダイサイズは推定120平方mm以下と、相対的に大きい。GMCHとしては穏当なサイズだ。GMCHのエッジのほとんどは、I/O系と見られるブロックで占められている。

Iron Lakeのダイサイズ

●スイッチャブルグラフィックスでCPU性能も引き上げる

 Clarkdale/ArrandaleのWestmere CPUダイとIron Lakeダイの間は、物理的にはQPIで接続されている。IntelでPCクライアントビジネスを担当するShmuel (Mooly) Eden(ムーリー・エデン)氏(Vice President, General Manager, PC Client Group, Intel)は次のように説明する。

 「ArrandaleのCPUとグラフィックスをパッケージの中で結んでいるのはインターナルのQPIだ。パッケージ内だけのポイントツーポイントの接続に最適化している。電圧も下げている。私が設計したわけではないが、バッファを小さくして(I/O部分の)面積を小さくすることもできるだろう」。

 内部的な構造は下のようになっていると推定される。

Arrandaleの構造

 モバイル向けのArrandaleについては、内蔵の統合グラフィックスと、PCI Express経由のディスクリートグラフィックスの動的な切り替えが可能なスイッチャブルグラフィックス機能を備えることも明らかにされた。

 「電力の面では、いくつかのOEMは、オプションを考えている。統合グラフィックスかディスクリートグラフィックスのどちらかに、スイッチして使うことができるようにすることだ。(Arrandaleの)2つのダイのうち、グラフィックスがシャットダウンされると、(GPUの電力消費がなくなりTDPに余裕ができる分だけ)CPUにより多くの電力を割り当て、さらにターボできる」とEden氏は説明する。

 これによって、Arrandaleではモバイル時は統合グラフィックスで省電力化を図り、AC電源時はディスクリートグラフィックスで性能を上げる。さらに、AC電源時には、CPUパッケージ内でGPUコアをシャットダウンすることで、CPUの動作周波数をさらにターボしてCPU性能を上げることも可能になる。

●GPU統合化へと段階的に進むIntel

 IntelはClarkdale/Arrandale以降に、CPUへのGPUコアの統合化を促進する。Sandy Bridge世代では、2コアだけでなく4コアもGPUコア統合へと変わる。

 「我々は、マジョリティのアプリケーションでは、統合グラフィックスでパフォーマンスが充分以上になると考えている。その理由は、統合グラフィックスの性能が上がって行くからだ。より強化したグラフィックスのトップには、グラフィックスターボを据える。

 今日では、モバイルPC市場のおよそ30%がディスクリートグラフィックスで、70%が統合グラフィックスだ。我々がArrandaleを出した後に、統合グラフィックスの比率が上がったとしても、驚かないだろう。なぜなら、ハイエンドゲーミングなどを除けばほとんどのユーザーにとってはディスクリートグラフィックスは必要がないと考えているからだ。それよりも、バッテリ駆動時間の方が重要な事柄だろう。

 もちろん、より高いグラフィックスパフォーマンスと新しい世代のグラフィックスが欲しいユーザーは、PCI Expressバス経由でNVIDIAやATIの拡張グラフィックスを使うこともできる。特に、ハイエンドゲーミングはディスクリートGPUに留まるだろう」(Eden氏)。

 NehalemマイクロアーキテクチャCPUには、このほか32nmのWestmere系の6コアCPU「Gulftown(ガルフタウン)」と、12コアと推定されるWestmere-EX(Eagleton)がある。

クライアント向けロードマップエンタープライズ向けロードマップ