後藤弘茂のWeekly海外ニュース

モバイル向けの省電力機能を強化したPenryn




●イスラエルとサンタクララの共同開発

Penrynのウェハ

 Intelは、45nmプロセス世代のCPU「Penryn(ペンリン)」では、マイクロアーキテクチャの大幅な改良は避け、パイプラインに影響の少ない部分だけの拡張に留めた。また、IntelのShmuel (Mooly) Eden(ムーリー・エデン)氏(Vice President, General Manager, Mobile Platforms Group, Intel)は「Penrynでの改良は素晴らしいが、それは、あくまでも限定された"美容整形手術"のようなものだ。全てを再アーキテクチャする、“心臓手術”のような大きなものではない。大きな変更はNehalemで行なわれる」と示唆した。そのため、Nehalemでは、Core Microarchitecture(Core MA)の弱点である、命令フェッチとデコード回りが改良され、より性能の向上が見込める可能性が高いことが見えてきた。

 実際、IntelのCPUアーキテクチャのロードマップでは、Penrynとその次の新マイクロアーキテクチャCPU「Nehalem(ネハーレン)」の時間差は非常に小さい。流れを見ると、Penrynは中継ぎで、Nehalemが次の本命となることがよくわかる。

 ちなみに、Core Microarchitecture(Core MA)の最初のCPU「Core 2 Duo(Merom:メロン)」は、Pentium Mを開発したIntelイスラエルで設計された。IDFで公開されたPenrynは、イスラエルと米サンタクララの開発チームの共同開発だという。サンタクララはPentiumやItaniumの開発を行なったチームだ。そして、次のNehalemは、Pentium Pro/Pentium 4を開発した米オレゴンのヒルズボロが担当している。イスラエルチームは、効率が高く低消費電力のCPUを開発する、モバイルのエキスパートだ。

CPUとアーキテクチャのロードマップ(※別ウィンドウで開きます)
PDF版はこちら

拡張されるCore Microarchitecture(※別ウィンドウで開きます)
PDF版はこちら

Penrynファミリーと今後の展開(※別ウィンドウで開きます)
PDF版はこちら

●LPIAへの応用が期待されるC6ステイト

 モバイルCPUの開発を主軸にするIntelイスラエルは、Penrynでも、モバイル向けの改良に力を注いだ。モバイル利用時で威力を発揮するアイドル時の省電力機能と、低TDP(Thermal Design Power:熱設計消費電力)時の高クロック化だ。

 目立たないが、Penrynでの電力制御機構の改良は大きい。Penrynでは、新たな省電力モード「Deep Power Down C6」が加わった。C6では、従来の省電力モードと比べて、大幅にコア電圧を下げる。そのため、CPU全体のアイドル時の電力消費を大幅に下げることが可能になった。C6は、アイドル状態の多いアプリケーションの使用時などにバッテリ駆動時間を伸ばす効果がある。

 Penrynでの省電力ステイトへの遷移は、これまでのCPUと若干異なっている。

 (1)まず、CPUコアがアイドルに入ると、コアクロックの供給が停止され「C1」「C2」ステイトに入る。この動作は、Core Duo(Yonah:ヨナ)の時からCPUコア毎に行なえるようになっている。片方のCPUコアが先により深いCステイトに入っていて、もう片方のCPUコアが遅れてC1/C2に入る場合もありうる。その場合は、高い方のCPUコアに合わせて、CPU全体のステイトが遷移する。

 (2)次にCPUコアのL1データキャッシュがフラッシュされL2キャッシュに書き出される。これはYonahでも実装されていたが、さらに、Penrynでは両CPUコアのステイトも同様にセーブされる。この段階でCPUコアはどちらも「CC6」ステイトに入りPLLもストップされる。CCは、CPUコア単位のCステイトで、Yonah以降のIntel CPUで使われている。以前はこの状態でCPUコアはCC4だったが、PenrynではCPUステイトがセーブされたことでCPUコアはCC6に入る。ただし、PenrynでもCPUコア単位の電圧制御はできないので、この状態ではCPUコアの電圧はCPU全体のコア電圧と同じだ。

 (3)さらに2つのCPUコアのアイドル状態が続くと、Penrynは「Deeper Sleep C4」ステイトに入り、コア電圧Vccは、キャッシュのデータ内容を維持できる限界レベル(Cache sustain)に下がる。

 (4)次に、Yonah以降のCPUは「Dynamic Smart Cache Sizing」で、L2キャッシュをライン毎にオフする。L2キャッシュエリアは、メインメモリに書き戻され次々にフラッシュされる。最後にはL2が完全に空になり、全L2キャッシュがパワーOFFされる。

 Meromまでの場合は、ここでCPU全体が「Enhanced Deeper Sleep DC4」ステイトに入り、電圧が下がった。このDC4時のコア電圧が、CPUコアのステイトを保持できるレベルだ。しかし、Penrynでは、CPUコアのステイトがセーブされているため、さらにもう1段階電圧を下げることが可能になった。

 (5)これがPenrynの「Deep Power Down C6」ステイトだ。CPUコアがCC6ステイトで揃い、L2キャッシュが完全にフラッシュされた段階で、CPU全体がC6ステイトに入ることが可能になる。C6ステイトでは電圧はDC4よりさらに下がり、L1キャッシュもOFFされ、CPU全体の消費電力がミニマムになる。ただし、その分、アクティブステイトへの復帰レイテンシは長くなる。CPUコアのステイトを復帰させなければならないからだ。ただし、この操作は基本的にはCPU側で行なうため、BIOSによる補助は必要がないという。

 このC6ステイトは、PC向けCPUでも有効だが、おそらく、UMPC向けの「LPIA(Low Power Intel Architecture)」プロセッサで、より有効性が高い。LPIAの方がアプリケーションタイプから、C6ステイトが有効なケースが多いと推測されるからだ。そのため、次期LPIAである「Silverthorne(シルバーソーン)」では、C6を実装すると推測される。

Deep Power Down Technology(※別ウィンドウで開きます)
PDF版はこちら

●PenrynのTDPが35Wへと上がった理由

 モバイルプラットフォームでの通常電圧版Penrynは、2006年前半まではTDPが29Wになるとされていた。しかし、現在、PenrynのTDPは現在は35Wが予定されているようだ。見かけ上は、Penrynの消費電力が見積より6W上がった、つまりクロック当たりの消費電力が予定より上がってしまったように見えるが、じつはそうではない。むしろその逆で、同じ熱設計のマシンの上で、Penrynのクロック向上のヘッドルームが上がったことを意味している。

 TDPの制約は、CPUのダイ(半導体本体)の温度の指標であるジャンクション温度とシステムの熱設計に関連する。

 2006年、Intelが顧客に行なった説明では、Penrynの29Wは、熱設計的にはMeromの35Wと同等とされていたという。それは、Penrynの電力密度がMeromよりかなり高くなると見積もられていたためだ。

 ダイが小さくなれば、それだけ電力密度が高くなる。電力密度が高いと、一定の排熱効率のケースで、Meromより低いTDPでPenrynのホットスポット部分(命令デコーダや浮動小数点演算ユニットであることが多い)のジャンクション温度(Tj)が100度に達してしまう。

 そのため、IntelはPenrynのTDPをMeromより低く設定せざるをえなかった。つまり、Penrynが29Wだったのは低TDPだったというより、Meromより熱設計の制約がきついため、PenrynではTDPを低く設定する必要があったということだ。

 ところが、Penrynの電力密度は1年前のプレシリコン時の見積りより若干低くなることになった。Penrynのダイサイズ(半導体本体の面積)はプレシリコン時の見積より、数%大きくなっており(103平方mm→107平方mm)、それも影響していると見られる。

 Penrynの電力密度は、ダイがより大きくCPUコアの回路密度が低いMeromよりは必ず高くなる。しかし、当初の見積では、Meromの1.4倍の電力密度だったのに対して、現在は1.28倍程度に下がっているという。その分、ホットスポットの温度が規定値を超える限界が高くなった。つまり、より高いTDPでも許容できるようになった。

 さらに、IntelはPenrynのジャンクション温度(Tj)のスペックも変更したと言われる。IntelのモバイルCPUのジャンクション温度は通常100度に設定されている。しかし、Penrynの通常電圧版では105度と、より高いジャンクション温度に設定されたようだ。105度でも問題がないと検証ができたと推測される。

 そのため、同じ排熱機構なら、Penrynはジャンクション温度が高い分、Meromよりより高いTDPに設定ができる。ジャンクション温度と筺体内温度の差が、システムのサーマルバジェットだからだ。ただし、LV(低電圧)版とULV(超低電圧)版のジャンクション温度は100度のままだという。

 では、こうした変更の結果、何が予測できるのか。答えは簡単だ。それは、モバイル版のPenrynのクロックが、当初の予定より高くできるということだ。つまり、同じ熱設計のシステムに、より高TDPのCPUを押し込むことができる。6W分、クロックを高める余裕が出たことになる。45nmプロセス自体が、低リーク電流(Leakage)でクロック向上の幅があることを考えると、モバイル版Penrynのクロックを、さらに引き上げることができるはずだ。

 こうして見ると、PenrynはモバイルCPUとしては魅力的であることがわかる。Intelは、現在はNehalemがモバイルにも投入されるとしている。しかし、もしNehalemの消費電力が予想よりも高く、モバイルに適していなかった場合には、再び軌道修正がなされ、デスクトップがNehalem、モバイルがPenrynといった平行状態になる可能性もあるかもしれない。

CPUダイサイズとアーキテクチャ移行図(※別ウィンドウで開きます)
PDF版はこちら

45nmプロセス世代のPenrynファミリー(※別ウィンドウで開きます)
PDF版はこちら

□関連記事
【4月20日】【海外】全面改良ではなく、部分改良に留まったPenryn
http://pc.watch.impress.co.jp/docs/2007/0420/kaigai353.htm
【4月19日】【IDF】Penrynベンチマークセッションレポート
http://pc.watch.impress.co.jp/docs/2007/0419/idf06.htm
【4月18日】【元麻布】着々と進む45nmプロセスとクアッドコアへの道
http://pc.watch.impress.co.jp/docs/2007/0418/hot478.htm

バックナンバー

(2007年4月23日)

[Reported by 後藤 弘茂(Hiroshige Goto)]


【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp ご質問に対して、個別にご回答はいたしません

Copyright (c) 2007 Impress Watch Corporation, an Impress Group company. All rights reserved.