後藤弘茂のWeekly海外ニュース

AMDの6コア「Phenom II X6」はターボモードを備えバーゲン価格で登場



●戦略的な低価格で登場するAMDのPhenom II X6

 AMDは、2010年の同社のCPUの切り札である6コアCPU「Phenom II X6(Thuban:トゥバン)」を発表した。Thubanは、サーバー向けの6コアCPU「Opteron 8400(Istanbul:イスタンブール)」と同ダイのデスクトップCPUだ。上位モデル1090Tの動作周波数は3.2GHz(ベース)で、L3キャッシュは6MB(L2と合計で9MB)、オーバークロック可能なブラックエディションとなっている。

 Phenom II X6の重要なポイントは2つ。1つはアグレッシブな価格戦略、もう1つはターボモードの実装。AMDは、Phenom II X6の価格を、Intelの6コアデスクトップCPUよりはるかに低い価格に設定した。また、Intelと同様に、CPUコアの動作周波数を引き上げるターボモードを実装した。トップSKU(Stock Keeping Unit=アイテム)のPhenom II X6 1090Tの場合、ベース3.2GHzに対してターボ周波数は3.6GHzとなっている。

 AMDはPhenom II X6(Thuban)の価格を攻撃的に設定した。ハイエンドSKUのPhenom II X6 1090Tは295ドル、廉価なPhenom II X6 1055Tは199ドルだ。このコラムで予想していた価格レンジより数段低い。ラフに言えば、Intelの4コアCPUの価格帯に、AMDは6コアを投入する。Intel CPUで言えば4コアの「Core i7-860(2.8GHz)」284ドルから「Core 2 Quad Q9500(2.83GHz)」183ドルのレンジだ。同じ6コアのIntel CPU「Core i7-980X(Gulftown:ガルフタウン)」の999ドルをはるかに下回る。

 また、下位の1055T(199ドル)では、同社の4コアCPUの最上位であるPhenom II X4 965の185ドルとほとんど価格差がない。つまり、AMDは6コアのデスクトップCPUには、Intelのように高マージンで売る戦略を取らない。下落した4コアCPU価格の延長の価格を設定したことになる。

AMDの45nm K10ファミリのダイサイズ
PDF版はこちら

●今までのAMDデスクトップCPUにない巨大なダイ(半導体本体)

 しかし、Thubanのダイ(半導体本体)は300平方mm台中盤と、PC向けCPUとしては最大級のサイズだ。通常、このクラスのダイサイズのCPUは、サーバー専用であり、デスクトップCPUにはもたらされない。ダイが巨大である分、CPUの製造コストが高いからだ。Intelの6コア Core i7-980X(Gulftown)が240平方mmであることと比較すると、その差は歴然だ。もちろん、Gulftownは32nmプロセスなので、ダイはよりコンパクトになる。なぜ、AMDはダイの大きな6コアをここまで低価格にできたのか。

AMD、Intelの6コア比較
PDF版はこちら

 理由は明瞭だ。儲けられるところでは儲けるからだ。AMDは6コアのダイをサーバー向けの6コア製品と12コア製品(2ダイ)としてすでに投入している。そちらは高いプライスタグで、比較的高マージンを確保する。そのため、6コアのダイも、サーバーとデスクトップの両方を合わせたダイ当たりのASP(平均販売価格:Average Selling Price)は、AMDにとって悪くない数字だろう。

 純粋な製造コストと照らし合わせるなら、AMDはこれでも十分に利益を上げられる。250平方mm前後のダイであっても現在は製造コストは100ドルを楽に切る。350平方mm近いダイでも、100ドルを大きく越えるコストにはならないだろう。ただし、数量が出ないと、設計やマスクなどのコストを償却し切れない。その点がハイエンドCPUの難しいところだが、AMDは1つのダイをサーバーとデスクトップにまたがせることで、その問題を軽減している。

 ちなみに、AMDは発表会で、ゴールデンウィーク中のPhenom II X6の供給数量に自信を持っていると説明した。業界関係者によると日本市場だけでハイエンドSKUでも3K(3,000個)クラスの供給体制を整えていると言う。ハイエンドCPUの巨大ダイのCPUにしては、出だしの数量が多いのは、サーバー向けにかなり前から供給を行なっているからだ。製造プロセスも、すでにかなり成熟している45nmプロセスだ。また、市場シェアの面で厳しい状況にあるAMDは、製造委託を行なっているGLOBALFOUNDRIESの製造ラインにも十分な空きがあると見られる。

AMD CPUダイサイズ移行図
PDF版はこちら

●まだ未成熟なPhenom II X6のターボモード

 6コアである点を除けば、Phenom II X6の技術で目立つポイントは、「ターボモード」をサポートしたことだ。ターボモードでは、マルチコアCPUの一部のCPUコアがアイドル状態になった時など、CPU内外の条件の変化に応じて、アクティブ状態のCPUコアの動作周波数をアップする。現在、CPUの動作周波数の最大の制約となっているのは、TDP(Thermal Design Power:熱設計消費電力)だが、ターボモードを使うと、TDPまたはシステムの冷却能力の枠内で、安全にCPUコアの動作周波数を上げることができる。

 Intelは45nm版Core 2(Penryn:ペンリン)以来ターボモードを採用している。AMDは当初はターボモードを高く評価していなかったが、Phenom II X6では取り入れた。

 今回の転換で重要な点は、AMDもターボモードを積極的に実装して行くのかどうか。その答えは、おそらくイエスだ。32nmプロセスCPU世代では、AMDは強力にターボモードを推進するだろう。実際、AMDの32nm世代の新マイクロアーキテクチャ「Bulldozer(ブルドーザ)」では、強力なターボモードを備えると言われている。

 現状のPhenom II X6のターボモードは、Intelの初期のターボモードと似ている。ターボモード対応のPhenom II X6では、基本のスペックの最高周波数より1ビン上のターボモード周波数ポイントが設定されている。Phenom II X6 1090Tの場合、ベース3.2GHzに対してターボ周波数は400MHzアップの3.6GHzだ。通常モードでは3.2GHzが動作の上限だが、ターボモードに入った時は3.6GHzが上限になる。ターボモードに遷移したCPUコアは、OSがCPUの電力を管理するインターフェイス「Pステイト」を1ビンスライドさせる。それによって、Pステイトが最上位の時に、ターボ周波数に達するようになる。

 Intel CPUのターボモードとの大きな違いは、ターボモードへの遷移を3コア単位で行なうこと。典型的なパターンでは、3コアがアイドル状態になった時に、他のビジーな3コアがターボモードに遷移して周波数が1ビン上がる。これは、1コア単位でターボモードに遷移できるIntel Nehalem系の実装とはかなりふるまいが異なる。3コア粒度で自由度が狭いAMDの方が原始的に見える。

AMDのTurbo Core技術

●32nm世代で飛躍する可能性が高いAMDのターボモード

 AMDがこうした実装にした理由は、コントロールロジックをできるだけ単純にするためと推定される。と言っても、このレベルの制御にはそれほど複雑なロジックが必要なわけではない。そのため、この実装は、AMDのターボモードが後から追加された機能であり、まだ付け焼き刃的な段階にあることを示している可能性が高い。

 それに対してIntelは、ターボモードを重要技術と位置づけて、CPUマイクロアーキテクチャを更新する毎に実装を強化している。現在の、Nehalem(ネヘイレム)世代CPUでも、ターボモードは大幅に強化された。Nehalemでのターボモードのポイントは3つ。(1)パワー制御ユニット「PCU(Power Control Unit)」によるハードウェア制御、(2)パワーゲーティングによるアイドルCPUコアの電力の削減によるターボモードのヘッドルームの増加、(3)PCU制御による柔軟なトリガーによるターボモードへの遷移。Intelは次のSandy Bridge(サンディブリッジ)でもさらにターボモードを強化する。

 では、AMDはターボモードにどう取り組んで行くのだろう。冒頭で書いたように、おそらくAMDはターボモードを急発展させて行く。理由は3つ。(1)まず、ターボモードがCPUのトランジスタをほとんど増やすことなく、特定条件下のパフォーマンスアップを得られる便利なテクニックだからだ。今のターボモードの問題は、ソフトウェアが活かしきれない点にあるが、将来、ソフトウェア側の対応がより進めば、ターボモードから得られる利点はさらに大きくなるだろう。(2)次は、マルチコア化が進めば進むほどターボモードの有効性が高まること。多くのコアを有効に働かせるためには、仕事のないアイドル状態コアを停止し、その分、アクティブコアを忙しく働かせた方がいい。ターボモードはそうした現状に合っている。(3)最後にターボモードは省電力機構と表裏一体の関係にあり、省電力を強化すれば、ターボモードを支える基盤が強化されること。

 そして、AMDは32nmプロセス世代のCPUで、省電力機能を大幅に強化する。つまり、より進んだターボモードのための下地が32nmでできあがる。

●32nm AMD CPUが備える強力なデジタル電力モニタ

 AMDは、今年(2010年)2月に開催された半導体回路設計の学会ISSCC(IEEE International Solid-State Circuits Conference)で、32nm SOIプロセスの「K10(Hound)」系CPUコアの概要を明らかにした。このコアは、来年(2011年)の前半に投入されるメインストリームPC向けCPU「Llano(リャノ)」のコアとして使われると見られる。AMDは、この32nm版のK10系コアで省電力関係の機能の拡張にフォーカスした。省電力フィーチャの面では、32nmのK10系コアは、45nmまでのコアとは全く別モノになる。これは、同じ32nmプロセスで製造される次世代パフォーマンスCPUアーキテクチャ「Bulldozer(ブルドーザ)」にも共通するだろう。

32nmのK10コア
PDF版はこちら

 では、具体的には、ターボモードに関連する省電力機能は、AMDの32nm CPUでどのように強化されるのか。まず、CPUに電力モニタ回路を内蔵して省電力機能をハードウェアできめ細かく制御できるようになる。また、パワーゲーティングによってCPUコア単位での電力カットを行なう。つまり、IntelがNehalemでやったようなことを、AMDは32nm世代で実現する。

 AMDの32nm版CPUのデジタル電力モニタ回路は、CPUコアの各部の電力消費をモニタして、最適な電力制御を短レイテンシで行なう。Nehalemの場合と同じで、CPU内部にハードウェア実装されているため、制御のレイテンシが短く、きめ細かな制御ができる。ただし、モニタの方式は、Nehalemとは大きく異なっている。

 AMDの32nm版CPUでは、CPUコアの各部の特定のポイントのスイッチングキャパシタンスを測定して電力の見積もりを行なう。Intelが採っているような、サーマルセンサーによるダイ温度測定や電流量といった従来の手法は採らなかった。AMDでは、CPUコアの95ものポイントをサンプルすることで、誤差2%以内という極めて高精度の電力見積もりが可能になるという。サンプリングは各サイクル毎ではなく、一定時間置きに行なうため負担は少ないという。

 AMDの32nm CPUでは、高精度のデジタル電力モニタユニットによって、非常に精度の高い電力制御が可能になると推定される。そのため、ターボモードも安全マージンを少なくとって、より高い周波数に遷移させることも原理的に容易となる。また、NehalemやSandy BridgeのPCUと同様に、熱処理上のヘッドルームを見つけて、細かくブーストすることも可能になる。

●パワーゲーティングでCPUコア単位の電力オフを実現

 AMDは、32nmで採用するデジタル電力モニタの特許「US Patent Application 20090259869 SAMPLING CHIP ACTIVITY FOR REAL TIME POWER ESTIMATION」を申請している。この特許の発明者であるAMDのSamuel Naffziger氏は、元Hewlett-PackardのPA-RISCのアーキテクトであり、AMDに移る前はIntelのItanium系CPUのアーキテクトを長く務めていた。Naffziger氏が開発したIntelのIA-64 CPU「Montecito(モンテシト)」は、Nehalemより先に電力モニタ&制御ユニットを内蔵していた。Intelから人材とともに技術も流れている。

 Nehalemはパワーゲーティングによってアイドル状態のCPUコアへの電力供給を完全にストップする。それによって、リーク電流を大幅に削減し、CPU全体での電力消費を減らす。そのため、アクティブ状態のCPUコアは、従来より使えるTDPの枠が増え、ターボ時に、より高い周波数に移ることが可能になった。

 パワーゲーティングを使うAMDの32nm CPUでも、それと同じことが原理的に可能になる。AMDの32nm版K10では、パワーゲートリングが、CPUコアとL2キャッシュの回りを囲うように設置されている。これによってCPUコア+L2のブロック毎に、電力をON/OFFできる。ただし、Intel CPUはパワーゲーティング時にCPUのステイトを保持するための「C6 SRAM」を持っているが、AMDはISSCCでの発表を見る限りそうしたメモリを持っていない。そのため、パワーゲートオフからの復帰レイテンシが長いと予想される。ただし、これは次のBulldozer系CPUでは改善されているかもしれない。

 32nm世代のAMD CPUの強力な省電力機能を見ると、この世代のAMD CPUが高度なターボモードを備える可能性が高い。Phenom II X6はその露払いとなるのかもしれない。

BulldozerアーキテクチャとK10アーキテクチャ
PDF版はこちら

32nmのパワーゲーティングの順序
PDF版はこちら

AMDデスクトップCPU移行図
PDF版はこちら