笠原一輝のユビキタス情報局

Intelの開発責任者に聞く、Skylake開発秘話

Intel 副社長 兼 クライアント開発事業部 事業部長 シャロミット・ワイス氏。右手(写真左)がSプロセッサ、左手(写真右)がYプロセッサ(Core m)

 IntelがIFAの期間中に発表したSkylakeこと第6世代Coreプロセッサは、14nmプロセスルール世代の新しいマイクロアーキテクチャを採用した製品として注目を集めている。CPUの内部実行効率が改善されているほか、GPUが第9世代(Gen9)のGPUへと進化し、新しくGT4という72EUの実行エンジンを持つモデルが追加されているほか、GT3以上には全てeDRAMが搭載されるようになっている点が大きな進化ポイントとなる。

 Intel 副社長 兼 クライアント開発事業部 事業部長のシャロミット・ワイス氏は「Skylakeの開発は4年前から始めた。その時にはU/H/Sを考えて開発したが、その後市場の要求から4.5WのYプロセッサを追加することにした」と述べ、Skylakeの開発の途中で若干の軌道変更を行なったことを明らかにした。ワイス氏によれば、当初は性能に振っていたSkylakeの設計はその段階で大きく変更され、省電力と性能のバランスを採る方向に振られたのだと明らかにした。

 またワイス氏はSkylake世代では採用されなくなったFIVR(Fully Integrated Voltage Regulator)について「性能とのトレードオフで落としたが、将来性能と両立するようになれば再度採用したい」と述べ、将来世代のCPUでFIVRを搭載する可能性があると示唆した。

Skylakeの開発が始まった当時、Yプロセッサのニーズはなかった

 IntelがリリースしたSkylakeには、4種類が用意されている。それがYプロセッサ(Core mブランド、タブレット)、Uプロセッサ(薄型ノートPC)、Hプロセッサ(高性能グラフィックスのH、主にフルサイズノートPC)、Sプロセッサ(デスクトップ)の4種類となる。

Intelが発表したSkylakeの4つのファミリ(出典:インテル株式会社)

 Skylakeの特徴は、1つのCPUアーキテクチャを元に、4.5WのYプロセッサ(Core m)から、91WになるSプロセッサまでをカバーできることだ。一見すると、Broadwell時代と同じに見えるかも知れないが、Broadwell時代にはSプロセッサがなく、Hプロセッサまでとなっていた。しかし、マーケティング上のニーズから急遽Broadwell-C(当初はBroadwell-K)と呼ばれる製品が今年(2015年)の6月のCOMPUTEX TAIPEIで追加されたが、これはHプロセッサのダイから派生した製品であって、デスクトップ用のSプロセッサとして専用に作られたものではない。

 ワイス氏によれば、Skylakeの開発がスタートした4年前当時には、実はYプロセッサの計画はなかったという。「Skylakeを開発した当初、Ultrabook用のU、デスクトップ用のS、高性能グラフィックス用のHという3つのファミリの計画があった。実際にプロジェクトを走らせていると、4.5Wでかつ高性能な製品が欲しいというニーズが出てきた。そこで、高性能とローパワーの両方を両立させる設計に変更した。これはチームにとっては大きな変化だった」と説明する。4年前と言えば、2011年になるがまだUltrabookの計画が言われ始めた頃で、つまりその当時にはCoreプロセッサを利用してタブレットを作るという考え方はなかったことになる。

 実際、IntelがYプロセッサの計画を、OEMメーカーに伝え出したのは2012年に入ってからで、最初の製品が2013年のCESで発表された第3世代Coreプロセッサ(開発コードネーム:Ivy Bridge)のYプロセッサで、TDPは13W、SDPで7Wという製品だった(Yプロセッサの最初の製品の記事はこちら)。その後、第4世代Coreプロセッサ(開発コードネーム:Haswell)ではTDPで11.5W、SDP 4.5Wという製品だった。いずれの製品もTDPから想像するに、元々は15WのUプロセッサをベースにして、選別品として作られた可能性が高い。実際Intelは時々こういう手段を使っており、古くはモバイルPentium IIIの時代のULV(Ultra Low Voltage)版がその手法で作られていた。

 これに対して、Haswellの微細化版となるBroadwellでは、微細化版と言いつつも、実際にはかなり手が入れられているため、より低いTDPが実現可能になった。Core Mで、TDP 4.5Wで動作することが可能になっている。これが本当のYプロセッサであり、実際OEMメーカーからも薄くて軽い新しいMacBookのようなノートPCや2-in-1デバイスなどが登場している。

 以上がYプロセッサの歴史だが、そのYプロセッサがOEMメーカーに通知され始めたのが2012年ということになるので、おそらくその辺りで大きな設計変更、つまりTDP 4.5Wをターゲットにした設計が意識され始めたのだろう。

高性能で低消費電力が実現できた秘密はファイングレインパワーコントロール

 その設計変更時か、それ以前からあったかは不明だが、Skylakeに搭載されている省電力機能は非常に強力だ。ワイス氏は「Skylakeの設計で最も大変だったのは性能と電力のトレードオフだ。トランジスタを増やせば性能は上がるが、同時に電力も増える。そこで、数々の省電力テクニックを利用して性能を損なわずに省電力を実現している。例えば、ファイングレインパワーコントロール、SpeedShift Technology、デジタルPLLなどがその例となる」と述べ、数々の省電力技術が、Skylakeが性能を犠牲にせずに省電力を実現できている大きな理由だとした。

 ファイングレインパワーコントロールは「1つの大きな部屋に1つの大きなエアコンで冷やそうとすると非常に効率が悪い。しかし、それぞれを部屋に区切ってエアコンで冷やせば効率が良い。ファイングレインコントロールでは、その上でさらに人がいる部屋だけを冷やすという考え方。トランジスタのうち、本当に必要な部分だけを動かし、それ以外はオフにする。これにより効率の良いコントロールをする」とのこと。つまり、従来のCPUなどでは、アイランドごと(例えばCPUコアとかGPUとか、メモリコントローラごと)にオン、オフを細かく制御いたが、それをさらに推し進めてトランジスタ単位でかなりこまめにやっているということだろう。

 また、Speed Shift Technologyは、以前の記事でも説明した通り、第4世代Coreプロセッサ(Haswell)/第5世代Coreプロセッサ(Broadwell)世代では、Cステート(ACPIで規定されているCPUのアイドル時の状態のこと)と呼ばれる電力削減にフォーカスが当てられていたが、Skylake世代ではPステート(ACPIで規定されているCPUがアクティブ時の状態のこと)の削減が実現されている。Speed Shift Technologyは、従来のSpeedStep Technologyに代わる技術で、従来はOS側がコントロールしていたPステートの省電力管理の機能をCPUに内蔵されているPCU(Power Control Unit)、つまりハードウェアが直接管理するというものだ。これにより、CPUの負荷に応じてより細かな処理が可能になるので、より高度なPステートでの電力管理が可能になるのだ。また、PLLはデジタルになっており、消費電力が少ないだけでなく、アナログPLLと同じ周波数を生成することが可能だ。

 こうした工夫により、Skylakeでは前世代となるBroadwellを上回る性能を実現しながら、同じTDPの枠を実現しているし、平均消費電力は下がっている。

FIVRはこの世代とは性能とのトレードオフで採用せず、だが将来の採用は否定せず

 その一方、犠牲にしなければならないものもあった。Skylakeには、Haswell/Broadwellに搭載されていたFIVR(Fully Integrated Voltage Regulator)は搭載されていない。FIVRはCPUのオンダイに搭載されているVR(電圧変換機)で、CPUの各部分(CPU、GPU、システムエージェント、メモリコントローラなど)の供給する電圧を、FIVRが変換して供給する。これによりマザーボード側のCPUへの電圧変換機を無くすことができ、より細かくCPU各部に供給する電圧を細かく調整できるので、システム全体の消費電力を少なくすることができる。

 このFIVRがSkylakeには搭載されていない理由は「Skylakeのデザインをするに当たり、FIVRが省電力であることは分かっていたが、性能面ではインパクトがあると判断した。このため、我々はVRを外に出すことに決めた。将来的にFIVRと性能が両立できる時が来れば検討したいと思っているが、それは今ではない」という。逆に言えば、FIVRを使わなくても省電力が実現できる自信があったからこそ決まったということだ。

 ただ、FIVRではなくなり、マザーボード側でVRを実装することで、マザーボード側でさまざまな工夫ができることは、OEMメーカーには腕の見せ所ということになる。例えば、オーバークロックなどはFIVRに比べればマザーボード側からのコントロールできるパラメータが増えるため、より機能を増すなど、OEMメーカー側の工夫で可能になる。この点は差別化ポイントがなくなって苦しんでいたマザーボードメーカーにとっては朗報だ。

 なお、将来的にFIVRを再度採用することを否定しなかった。つまり、将来のCPUでは再びFIVRを採用する計画があるからだと考えられる。OEMメーカー筋の情報によれば、Intelは、来年に実質Skylake RefreshとなるKabylake、再来年に10nmプロセスルールに微細化されたCannonlake、さらにその先に10nm世代の新アーキテクチャ版となるIcelakeを計画している。IntelはこのIcelake世代で、再びFIVRを採用する予定だという。

 このIcelakeは米国オレゴン州のヒルズボロで開発されているCPUだ。IntelのCPU開発チームは複数あり、ヒルズボロとイスラエルのハイファのチームが交互に新アーキテクチャの製品を開発している。Sandy Bridge(2011年、第2世代Coreプロセッサ)/Ivy Bridge(2012年、第3世代Coreプロセッサ)はハイファのチームが、FIVRを使っていたHaswell(2013年、第4世代Coreプロセッサ)/Broadwell(2015年、第5世代Coreプロセッサ)はヒルズボロのチームが設計し、今回インタビューしたワイス氏が率いるハイファのチームはFIVRを利用しないSkylakeとその後継製品(KabylakeとCannonlake)を開発している。それがヒルズボロ開発の製品に戻るIcelakeでは再びFIVRになるというのは、何かの偶然なのだろうか……。

Skylakeのパッケージ、VRはCPUには内蔵されておらずマザーボード上にある

CPU性能は2.5倍、GPU性能は30倍なのはなぜなのか

 最後に個人的に気になってた話を聞いてきたのでそれを紹介して、まとめとしたい。IFA開幕前に行なわれた、Intelの記者会見で、Intel 上席副社長 兼 クライアント・コンピューティング事業本部 本部長のカーク・スコーゲン氏は「2010年の製品に比べるとCPU性能で2.5倍、グラフィックス性能に至っては30倍と大きく向上している。その一方で消費電力が削減されたことで、バッテリ駆動時間は3倍になっている。現在、5年以上前に購入されたPCは全世界で10億台あるとされており、それらを買い替えるのにいい時期になった」と、買い替え時であることをアピールした。

 これを見て「アレッ」と思った人はいないだろうか。CPUは2.5倍にしかなっていないのに、GPUは30倍になっているのだと。実はそうなのだ、ここ数年、IntelのCPUの性能は劇的には伸びていない。5年間で2.5倍なら、毎年同じ割合で性能が向上すると仮定すると、年平均約1.2倍になる。それに対してGPUは30倍だから、年平均で約2倍となる。

【11時23分訂正】記事初出時、倍数の計算が誤っておりました。お詫びして訂正します。

 実はそれが意味するところを理解するには、IntelがIDFで公開した、Intelの5年間のグラフィックスの進化についての2枚スライドを見れば一目瞭然だ。

IntelがIDFで公開した内蔵GPUの進化の歴史(出典:Technology Insight:Next Generation Intel Processor Graphics ArchitectureCode Name Skylake、David Blythe Intel Fellow and Director of Graphics Architecture, Intel Corporation)
Broadwellまでのダイの比較、世代が新しくなる毎にEUが増え、GPUのダイに占める割合は大きくなっている(同上)

 Intelが2010年にリリースしたCoreプロセッサ(実質的に第1世代、Arrandale/Clarkdale)でIron LakeというGPUをオンパッケージで搭載している。これが43GFLOPSで、Skylakeの内蔵GPU(Gen9)では1,152GFLOPSなので、約26倍となる。ただし、Skylakeのこの数字は、最上位モデルのIrisではなく、Intel HD Graphics 530での結果なので、Irisにすれば約30倍ということだろう。

 2枚目のスライドで分かるように、GPUの割合は世代が進むにつれて大きくなる一方だ。例えば、Sandy Bridgeでは12EUだった演算器は、最新のSkylakeでは標準グレードとなるGT2でも24EUと倍になっている。また、Haswell世代ではGT3が導入され、クアッドコア+GT3(40EU)の組み合わせは、GPUがダイの半分近くを占めるようになっていたり、Broadwell世代のクアッドコア+GT3(48EU)、Skylake世代ではさらにGT4(72EU)ができたので、その比率は上がっている。それに対してCPUは、ずっとデュアルコアないしはクアッドコアのままだ。

 率直な疑問としてこれをワイス氏にぶつけてみた。ワイス氏は「IntelにとってSandy Bridgeは最初のGPU統合CPUだった。GPU性能に関してはまだまだ十分ではなかった。もっともっとGPU性能をという声がたくさんあり、世代毎にGPUの性能を強化してきた。それに対してCPUコアの側は競争上の観点でも十分に性能が実現できており、進化で良いと判断した」と述べた。

 シンプルに言えば、CPUに関しては唯一の競合他社であるAMDのそれと比較して十分なリードがあり、特に強化する必要は無いと判断したが、GPUに関してはAMDの内蔵GPUだけでなく、AMD、NVIDIAの単体GPUを含めて性能を上回る必要があるとIntelのアーキテクト達は考えた結果ということだろう。このため、CPUは2.5倍しか向上していないが、GPUは30倍の性能向上を果たすという状況になった。

 ハイエンドユーザーとしては、もう少しCPUの性能も上がるようにCPUコアを増やすとかしてくれると嬉しいのだけどなと思うのだが、省電力の時代にはそれも致し方ないところなのかもしれない。なんとか、次のハイファデザインの新マイクロアーキテクチャ(7nm世代の新マイクロアーキテクチャになる可能性が高い)がそうなるといいなと思ったことをこの記事のまとめとしたい。

(笠原 一輝)