ニュース

Intel、ファンレスPCを目指したCore Mプロセッサ

~3~5Wの低消費電力を実現。搭載製品は年末登場

 Intelは8月11日(現地時間)、14nmプロセスの次世代プロセッサ「Core M」プロセッサ(開発コードネーム:Broadwell-Y、ブロードウェル-ワイ)の概要を明らかにした。Core Mは、ファンレスのタブレット、2-in-1デバイスを設計するのに必要な3~5Wという低消費電力で動作し、かつ現行製品の第4世代Coreプロセッサ(開発コードネーム:Haswell)に比較してIPC(サイクルあたりの命令実行)が5%ほど改善し、内蔵GPUエンジン数が20%ほど増加するなど性能面も強化されている。

 Core Mは、Intelが他社に先駆けて量産化に成功した14nmプロセスに基づいた製品で、すでにオレゴン州にある同社の開発工場のD1Xで量産されており、今後、アリゾナ州に所有するFab42、アイルランドのダブリン近郊に建設したFab24へと生産を拡大していく。

 すでにOEMメーカーへの出荷も開始しており、今年(2014年)の年末商戦にはCore Mを採用したファンレスのタブレット、2-in-1デバイスなどが市場に登場する見通しだ。

ファンレスタブレットをCoreプロセッサで実現

 Intelのプロセッサ開発を統括する立場にあるプラットフォームエンジニアリング事業部担当副社長のラニ・ボーカー氏によると、「Core Mを開発する上で我々が最初に決めた目標は、Coreプロセッサの性能を持ちながらファンレスのシステムを実現するということだった」という。

 これまでのIntelのCoreプロセッサの歴史を振り返れば、この意味は大きい。従来、IntelのPC向けプロセッサは、常にどこがメインストリームのボリュームになるのかを予測し、そこに最適化して設計されてきた。まずは、そのターゲットとなる製品の定義を行ない、それ以外の製品はその派生品として作られる。

【図1】Intelのプロセッサのメインボリュームの歴史(筆者作成)

 例えば、2012年にリリースされた第2世代Coreプロセッサ(Sandy Bridge)の場合、TDPが35Wの製品が最も採れるように設計されており、それ以外の製品、例えばTDPが17Wになるような薄型ノートPC向けや、デスクトップPC向けの65W以上の製品などは派生品として、生産された中から選別されたダイが使用される。Intelのように大規模に生産しているメーカーの場合はこうした製造方法が最も合理的だからだ。

 だからこそ、メインのボリュームをどこに設定するかは、CPU設計時に非常に重要な命題となる。デスクトップPCが市場のボリュームの中心だった時には、それが65Wに設定されていたし、ノートPCの時代にはそれが25~35Wに設定されていた。

 2013年にリリースされた第4世代Coreプロセッサの場合は、このメインボリュームゾーンが、TDP 15Wに設定されていた。これは、IntelがUltrabookが市場のメインストリームになると考えていたことの表れだ(ただし、Haswellではダイのバリエーションが非常に多いので、厳密に言えばこれに当てはまらないものもある)。

 では、Core Mはどうなのか、それを端的に示しているのが、冒頭で紹介したボーカー氏の発言だ。Core Mは、ファンレスのタブレットや2-in-1デバイスを実現することをゴールとして設定された。逆に言えば、それ以上のTDPを持つようなノートPC向け製品やデスクトップPC向け製品は派生品ということだ。

 Coreプロセッサをファンレスが要求されるタブレットにもたらすにはどうしたらよいか、それを最優先してIntelが設計した初めてのCPUがCore Mということだ。

CPUの内部実行エンジンの改良によりIPCは5%の改善

 Intelフェロー兼プラットフォームエンジニアリンググループSoCアーキテクチャ部長のステファン・ジョルダン氏によると、Core MもTICK-TOCKモデル(新マイクロアーキテクチャと微細化プロセスが交互に新製品で採用されること。TICKが微細化されたプロセス、TOCKが新しいマイクロアーキテクチャであることを意味している)で、TICKに該当する製品となる。つまり、基本的には2013年投入されたHaswellのマイクロアーキテクチャを、14nmプロセスに縮小しものである。実際、プロセッサの内部構造は、Sandy Bridge以降引き継がれている、CPU/GPU/PCI Express/メモリコントローラなどが専用のリングバスで結ばされているという構造に変化はない。

 ただし、近年のIntelのTICKに相当する製品は、単純に同じマイクロアーキテクチャを新しいプロセスに乗せただけのモノではなくなってきており、一定の改良が加えられているのが通例となっている。今回のCore Mも同様で、CPU、GPUにそれぞれ改良が加えられている。

【表1】Haswell-YとBroadwell-Yの比較
Haswell-YBroadwell-Y
製造プロセスルール22nm14nm
コア数/スレッド2C/4T2C/4T
GPUIntel内蔵グラフィックスGen7.5Intel内蔵グラフィックスGen8
グラフィックス20EU24EU?
グラフィックスAPIDirect3D 11.1/OpenGL4.0/OpenCL1.1Direct3D 11.2/OpenGL4.3/OpenCL 1.2、2.0
PCHLynx Point-LPBroadwell-PCH(WildcatPoint-LP)
TDP(SoC)11.5WHaswell-Yの半分以下
SDP(SoC)4.5~6W3~5W?
パッケージサイズ(幅×奥行き×高さ)24×40×1.5mm16.5×30×1.04mm

 ジョルダン氏によれば、CPUに関しては基本的な構造(デュアルコアCPU、キャッシュ容量)などに関しては基本的にはHaswell-Yと同じだが、以下の点で実行エンジンの効率が改善されているという。

  • アウトオブオーダースケジューラの拡張、ストアからロードへの先渡しの高速化
  • より大きなL2 TLB(1Kから1.5Kエントリーへ増加)、新しい専用1GBページL2 TLB(16エントリ)
  • セカンドTLBページハンドラ
  • より高速な浮動小数点乗算(5サイクルから3サイクルへ)、Radix-1,024分割、より高速なベクタ収集
  • アドレス予測の改善
  • 特定の暗号化アクセラレーション命令の改善
  • より高速な仮想マシン切り替え

 これらの改良によりHaswellに比べてIPCが5%改善されているという。

Core Mのプロセッサの改良点を示すスライド(出典:Intel)

GPUの実行エンジンは20%、サンプラーは50%の増加で処理能力が向上

 GPUに関しても、従来世代に比べて20%の実行エンジンの増加、50%のサンプラースループットの改善、さらにジオメトリ、Zバッファ、ピクセルフィルなどの処理を行なう際の性能を引き上げるマイクロアーキテクチャの改良を行なっている。ジョルダン氏によればその構造の改良は「ラフに言って2スライスが3スライスになると考えてもらっていい」とのことで、EUが20%増え、サンプラーが50%増えているという。その言葉から推測するとおそらく下記のような構造になっていると考えることができる。

【図2】Intelが公開した資料から作成したHaswell世代とBroadwell世代のGPU構造

 HaswellのGT2(Intel HD Graphics 4600/4400、開発コードネーム)を内蔵しているダイでは2スライス、GT3(Intel Iris Graphics、Intel HD Graphics 5000)を内蔵しているダイでは4スライスとなっている構造になっていた。これに対して、Broadwell-YのGPUでは3スライスになっており、EUの具体的な数こそ公開されなかったが、20%増えるとのことなので、おそらく24のEUが内蔵される形になると推測される。となると、1つのスライスに8つのEU+サンプラーというのが3つあると考えると計算が合うことになる。

 なお、今回Intelはタブレット向けとなるBroadwell-Yだけを公開したので、Haswell世代で言うところのGT2の相当の構造だと考えられる。ほかの構成は公開しなかったものの、OEMメーカー筋の情報によれば、BroadwellにはほかにもBroadwell-U(Ultrabook用)、Broadwell-H(A4サイズノートPC用)、Broadwell-K(自作PC用の倍率アンロック版)が用意されており、そちらにはGT3を内蔵したダイが用意されていると予想される。そちらはGT2の3スライスの倍の6つがあると想定されるので、合計で48EUとなる可能性が高い。

 このほかの点も強化されている。ソフトウェアAPIはDirect3D 11.2、OpenGL 4.3、OpenCL 1.2/2.0に対応するなど強化され、ビデオ再生の処理を行なうVideo Quality Engineのスループットが倍になりビデオ再生時の表示品質が強化。Sandy Bridge世代から搭載されているビデオエンコードエンジン(Quick Sync Video)に関しても、GPU内部の処理能力が上がったことにより向上している。

 なお、Broadwellのディスプレイ出力エンジンは従来と同じく3パイプで、ディスプレイ出力の仕様としては4K出力に対応している。ただし、これは全部のSKUがそうだというわけではなく、Core Mに関しては2,560×1,600ドットが最高の解像度になる。これはそうしたディスプレイ出力を上げれば、消費電力が増えてしまうのとトレードオフになるため。ただし、OEMメーカーが消費電力が上がることを覚悟の上で実装をするのであれば、出力することも不可能ではない。このあたりは、実際の製品を待つ必要があるだろう。

 このほか、CPU/GPUのマイクロアークテクチャのさらなる詳細については、9月にサンフランシスコで行なわれるIDFにおいて公開される予定。今回発表されたCore M以外の製品や、GT3にeDRAM付きがあるのかなどに関してはそこで明らかになりそうだ。

Broadwellの内蔵GPUの強化点を説明するスライド、EUが20%増え、サンプラーのスループットが50%向上する(出典:Intel)
Broadwellの内蔵GPUの強化点、メディア周りでも強化点が多数ある(出典:Intel)

14nmプロセスに移行することで、Haswell比でダイサイズが63%に

 今回明らかにされた概要を見る限り、Broadwellのマイクロアーキテクチャは、TICK-TOCKのうち、1世代前のマイクロアーキテクチャが微細化された新しいプロセス上に展開され、CPUのIPC改善とGPUの内部構造が改良されたということで、TICK+と表現するのが妥当だろう。

 だが、Broadwellの真価はそこではない。冒頭でも述べたように、IntelはCore MをCoreプロセッサの処理能力を保ちながらファンレスのタブレットを実現するための製品と位置付けており、その最大の特徴はSoC全体の消費電力が前世代に比べて圧倒的に小さくなっていることだ。

 Intelは、ファンレスにできるシステムの消費電力を調査し、8~10mm厚で10.1型のディスプレイを持つシステムを実現するには3~5W程度の消費電力を実現する必要があると判断した。ただし、ここでいう消費電力はTDPではなく、現在IntelがSDP(Scenario Design Power)と呼ぶ、ある特定の利用モデル化における消費電力という考えるのが正しい(ただし、今回Intelはこの3~5WがSDPであるのかそうではないのかを明確にはしなかった)。

Intelの調査によるファンレスに必要なSoCの消費電力。ディスプレイサイズと薄さにより消費電力の枠は変わってくるが、10.1型のディスプレイで8~10mm厚のタブレットを設計するには3~5Wの消費電力になるSOCが必要と結論づけた(出典:Intel)
処理が常に続いているような時でも性能が低下しないそうした設計が必要だと結論付けられた(出典:Intel)

 ジョルダン氏はそうした低消費電力を実現するためには、「プロセッサに対して負荷が連続してかかった時に、何も最適化されていないプロセッサの場合には著しい性能低下が発生してしまう。そこで電力性能比を最大化することでそうしたシーンでも性能を維持できる、そんな製品を目指した」と述べ、以下のような点で性能を犠牲にせずに電力効率を改善する工夫をしていると説明した。

  • プロセスの微細化
  • 小型新パッケージの採用
  • パワーマネージメント機能の進化
  • SoCレベルでのさらなる消費電力

 Broadwellの生産には14nmプロセスが利用される。仮に同じダイのまま(つまりHaswellの回路をそのまま14nmへ乗せた場合)には50%のサイズへ、今回のBroadwellのように機能が拡張(主にGPUの拡張)が入った分を考慮に入れても63%のダイサイズへと削減されているという。また、いわゆるリーク電流は従来世代に比べて2分の1になっているほか、トランジスタ性能が10~15%向上、さらには動作可能な下限電圧が10%ほど引き下げられていることなどにより、一般的なプロセスの微細化の場合よりも2倍の電力削減が実現されているという。

14nmプロセスのメリット。Broadwellでは14nmプロセスに最適化することで通常の微細化に比べて2倍の電力削減が実現できている(出典:Intel)

 Broadwell-Yでは、薄型で軽量のタブレットへ実装されることを前提に設計されてきたため、パッケージも従来のHaswell-Yに比較して小型/薄型になっている。従来のHaswell-Yのパッケージが24×40×1.5mm(幅×奥行き×高さ)であったのに対して、新しいBroadwell-Yでは16.5×30×1.04mm(同)と、より小型(実装面積50%減)かつ薄型(30%減)のパッケージサイズを実現している。OEMメーカーは基板サイズを従来のCoreプロセッサ向け製品に比べれば25%削減することが可能になり、かつ薄型にすることが可能になる。

 この小型パッケージサイズを実現するため、キャパシタなどを別のサブ基板に実装し、それを3Dで実装した3DLモジュールという仕組みを採用している。これはパッケージの底面側に3DLサブ基板を実装し、マザーボード側に穴を空けることでそこにはめ込む形で高さを稼ぐ工夫だ。CPUのパッケージの高さを削減できるので、基板全体の高さを削減できるというメリットがある。

 また、Haswellで導入されたFIVR(ファイバー、Fully Integrated Voltage Regulator、CPUダイ上に統合された電圧変換器のこと)に関しても第2世代に進化しており、より効率の良い電圧供給などが可能になっている。

Broadwell-Yでは新しい小型パッケージを導入することで、実装面積で50%削減、厚さは30%削減を実現している(出典:Intel)
高さの実現に貢献しているのは3DLモジュール。基板側の穴とあわせて装着することで、SoCパッケージの高さを削減できている(出典:Intel)

省電力機能の進化やSoCにMCM実装されているPCHが進化

 省電力面での改善点としては省電力管理の進化が上げられる。まず1つ目にはTurbo Boost機能の安定性が強化されている。通常Coreプロセッサでは、数段階に分けてクロック周波数が上がるが、Turbo Boostが有効になった最初に一時的にクロック周波数がかなり上がる時間の安定性が向上した。例えばOSの起動時やアプリケーションの起動時など、CPUのクロック周波数を一時的に引き上げてユーザーの体感速度を改善できる。その上で、素早く処理を終えて、CPUを通常の周波数やアイドルに落とすことで消費電力を減らせるようになる。

 もう1つのユニークな改善点として、デューティーサイクルと呼ばれるCPUやGPUのクロック周波数が、電圧下限近くにまで落ちた時に、これまでよりも効率よく制御するデューティーサイクルコントロールという機能が追加されていることだ。

 一般的なプロセッサは、CPU/GPUの電圧と周波数が連動している。周波数が上がれば上がるほど、駆動電圧も引き上げなければならない。半導体の電力は駆動電圧の2乗×周波数に比例して大きくなるので、電圧を下げることはCPU/GPUの消費電力を下げることに大きな意味がある。

クロック周波数が下がってきたところではそれ以上電力を下げるのが難しいが、デューティーサイクルスロットリングという仕組みを利用することで、ブロックごとオン、オフを行なう(出典:Intel)
GPUではデューティーサイクル管理をGPUドライバと連携して行なうことで、GPUがアイドル状態にある時の消費電力を削減する(出典:Intel)

 しかし、一般的に周波数を下げると言っても下限があり、周波数を下げても電圧が効率よく下がらない課題がある。Broadwellではこの下限電圧が、14nmプロセスの恩恵により下げられているのだが、デューティサイクルコントロールの機能により、下限に近付いた時は、一時的にCPUやGPUのクロック周波数をブロックごとオフにしたり、再びオンにしたりということを繰り返すことで、さらなる消費電力低下が可能になっている。ジョルダン氏によれば、GPUに関してはこの制御をハードウェアだけでなく、GPUのドライバとも協調して行なっているという。

 また、Broadwell-Yは、従来製品となるHaswell-Yなどと同じように、PCHと呼ばれるI/Oコントローラがプロセッサ基板上にMCM(Multi Chip Module)により実装され、SoCとして実装されている。ジョルダン氏によれば、このBroadwell用の新しいPCHは完全な新設計のチップになっているという。Intelは今回の発表の中ではこのPCHの開発コードネームなどを明らかにしなかったが、開発コードネームWildcat Point-LPで知られるPCHだと思われる。

 さらに新機能が2つ追加される。1つ目はオーディオDSPが新世代エンジンへと変更され、処理に利用されるSRAMの容量が増え、処理能力が向上している。これにより、オーディオの後処理の品質が向上したり、音声認識による起動機能(Wake on Voice)の実装、と消費電力の減少を実現。もう1つは、PCI Express SSDをネイティブでサポートすることで、システムの応答性などを改善することが可能になる点だ。

 新PCHは、従来のHaswellに採用されていたLynx Point-LPと同じ32nmプロセスで生産されるが、物理設計などが見直され、細かく電力を切れるようになったりすることで、20%のアクティブ電力の削減と25%のアイドル電力の削減が実現される。PCHの改良も、BroadwellのSoC全体での消費電力の削減に大きく貢献する。

Broadwell-Yで導入される新しいPCHでは、新オーディオエンジンやPCI Express SSDへのネイティブ対応などが目玉機能となる(出典:Intel)

OEMメーカーへ出荷済み、年末商戦には搭載タブレット/2-in-1デバイスが登場

 ジョルダン氏によれば、こうした諸々の改善により、Broadwell-YはHaswell-Yと比較してパッケージ実装面積は50%になり、30%薄くなり、TDPは2分の1になり、そして60%低いアイドル時消費電力を実現しており、9mmを切るような薄型のタブレットを設計することが可能になるという。

 14nmプロセスは、22nmプロセスの時の立ち上がりに比べると遅いが、第3四半期中には22nmの立ち上がり時とほぼ同じレベルの歩留まりを実現する見通しだという。COMPUTEX TAIPEIで明らかにされたように、搭載されるタブレットや2-in-1デバイスの登場は今年の年末商戦になるというスケジュールは変更ない。例年は、9月上旬にドイツで行なわれるIFA、その次の週にサンフランシスコで行なわれるIDFで、搭載製品がOEMメーカーからお披露目されることが多く、おそらくそこでOEMメーカーから魅力的なCore M搭載タブレットや2-in-1デバイスなどが公開されることになるだろう。

(笠原 一輝)