後藤弘茂のWeekly海外ニュース

AMDが12nmプロセスの第2世代Ryzenファミリを正式発表

第2世代Ryzenファミリ

 AMDが、第2世代のRyzen CPU「2nd Gen AMD Ryzen Desktop Processor」ファミリーを発表した。コードネームは「Pinnaple Ridge(ピナクルリッヂ)」で、CPUコアが「ZEN+」となる。

 AMDは、第2世代Ryzenを「Ryzen 7」と「Ryzen 5」の2つのブランド層で投入する。「Ryzen 7 2700X/2700」と、「Ryzen 5 2600X/2600」だ。性能は、Ryzen 7 2700Xで最大クロックが従来の4.1GHzから4.3GHzへと引き上げられた。AMDはお買い得感を高めるために、プレミアムクーラー付きで329ドルにて市場に投入する。

IntelのCore i7 8700Kに対して性能/価格面での優位を打ち出すAMD
Intelに対しては、クーラーつきで価格面でのアドバンテージを強める
性能、フィーチャ、プラットフォームを拡張する第2世代Ryzen

AMDのRyzenファミリが全て2000番台へと移行

 Ryzenは、すでにAPU(Accelerated Processing Unit)版Ryzenから、型番が2000番台になっているが、Pinnacle Ridgeの投入によって、CPU版Ryzenも2000番台になる。

 CPU版とAPU版の両Ryzen 2000番台に共通するのは、ターボ制御の「Precision Boost 2」などが新バージョンになったこと。つまり、CPUを制御するマイクロコトローラの制御の面で2000番台は共通する。

第2世代Ryzen CPUの投入でフルラインナップが2000番台のRyzenとなった

 しかし、APU版のRyzenである「Raven Ridge」と、今回の第2世代Ryzen(Pinnacle Ridge)には、半導体チップとして大きな違いがある。

 最大のポイントは、従来の14nmプロセスから、12nmプロセスへと製造プロセス技術を移行、性能/電力を引き上げたことだ。第2世代Ryzenは、AMDで初の12nmプロセスチップであり、NVIDIAのVolta(ボルタ)と同じく、12nm世代プロセッサとなる。

 その反面、第2世代Ryzenでは、ZEN CPUコア自体の拡張は、今回はほとんど行なっていない。キャッシュアクセスレイテンシは低減されているが、CPUコア内部はほとんど変わっていない。

 今回の第2世代RyzenのCPUコアは、「+」コアであり、CPUコアの世代が変わる「ZEN2」コアではない。拡張は、すでに触れたPrecision Boost 2のような、CPUの制御の面の方が大きい。

コア内部のマイクロアーキテクチャはZEN世代のまま

 第2世代Ryzenのポイントはどこにあるのか。AMDのKevin Lensing氏(Corporate Vice President & General Manager, Client Compute Business Unit Computing and Graphics Business Group, AMD)は次のように説明する。

 「第2世代Ryzenにおいて、大きな変更はプロセス技術と、ファームウェアによる(CPU内の)マイクロコントローラ(によるCPUの制御)の変更だ。12nmプロセスについては、性能と電力の利点を活かしている。また、ファームウェアについては、膨大な変更を行なっている。

 しかし、アーキテクチャ面では、ZENマイクロアーキテクチャの基本的な部分は変えていない。次の『ZEN2』は全面的なアーキテクチャ改良だが、今回は『ZEN+』であり、アーキテクチャの変更は小さい。しかし、重要な改良もある。キャッシュレイテンシの短縮で、IPC(Instruction-per-Clock)も向上している」

 実際AMDは、第2世代Ryzenにおいて、ZENのマイクロアーキテクチャにはほとんど手を加えていない。命令スケジューリングやバッファの拡張といった、CPUのマイナーチェンジ時によく行なわれる、相対的に小規模なアーキテクチャ拡張も行なっていないという。

 マイクロアーキテクチャに手を入れると、どこかに問題が発生する可能性があるので、開発期間の短縮を第一に考えて、据え置いたとも考えられる。その意味では、第2世代Ryzenの本質は、プロセス技術の改良版だ。

 ただし、Ryzenの弱点だったキャッシュアクセスレイテンシについては、ZEN+コアで改善されている。アクセスサイクル時間の比較では、L1レイテンシは最大13%、L2レイテンシは最大34%、同CCX内のL3レイテンシは最大16%低減されている。

 この数字は、レイテンシをCPUクロックサイクルで比較したものではなく、レイテンシ時間の比較だ。しかし、レイテンシサイクル自体も、特にL2での低減が顕著だ。L2のレイテンシサイクルが、17サイクルから12サイクルへと下がったことがわかる。

キャッシュアクセスレイテンシ時間の比較。L2レイテンシの低減はレイテンシサイクルの低減が大きく影響している

12nmプロセスとファームウェアによってターボ性能がアップ

 ZENのマイナーチェンジ版の位置づけがZEN+の第2世代Ryzenだが、12nmによる、性能/電力の改良とフィーチャの拡張の効果も大きい。

 動作周波数の上限は4.35GHzに引き上げられ、全CPUコアのオーバークロックでも4.2GHzに達する。さらに、CPUコアのブースト制御は「Precision Boost 2」となり、2から7コア時でもブーストされるようになった。

 従来のRyzenと比べると、12nmプロセスによって同クロック時の駆動電圧は50mV下がった。そのため、従来のRyzenに対して、同クロック時でも電力消費は抑えられ、同消費電力なら性能が向上している。

 AMDは、Ryzen 7 2700と1700の比較では、同等の電力時に16%も性能が向上するとしている。また、Ryzen 5 1600Xと2600Xの比較では、同クロック時の電力は11%も低減しているとする。

第2世代Ryzenにおける12nmプロセスの利点
12nmプロセスによって、同じ電力なら性能が上がり、同じ周波数なら電力が低減する
AMDは、対Intelの14nmプロセスでも12LPの性能/電力の利点があると指摘

 加えて第2世代Ryzenでは、ターボ制御が大幅に向上している。Ryzenは、CPU内部に省電力電力やターボを制御するマイクロコントローラを搭載している。第2世代Ryzenでは、このマイクロコントローラを制御するファームウェアが大幅に改良された。

 Ryzen CPUの動作周波数をブーストする「Precision Boost」は、従来の1000番台Ryzenでは、1コアまたは2コアがアクティブだった場合に、アクティブコアの動作周波数をブーストしていた。それ以外の場合はベースクロックに落ちるため、3~7コアでは周波数ブーストが効かない。

第2世代Ryzenではブースト制御を大幅に拡張

 それに対して、第2世代RyzenのPrecision Boost 2では、3コア以上がアクティブなケースでも、リニアに動作周波数がブースト制御される。そのため、3コア以上で性能がガクっと落ちることがなく、最適な動作周波数へとブースト状態が保たれる。加えて、12nmプロセスによって、同電力時でも従来より動作周波数がアップする。

 また、Ryzen 7 2700Xについては、TDP(Thermal Design Power: 熱設計消費電力)枠が従来の95Wから105Wへと引き上げられた。そのため、全CPUコアがアクティブであってもブーストが効くケースが出るため、実効性能は大幅に向上する。

 Precision Boost 2の制御方法自体は、APU版Ryzenと同じだが、12nmプロセスとプラットフォームのために、より高性能へと振れたのが第2世代RyzenのPrecision Boost 2だ。

スレッド数に従ってリニアにブースト周波数が変化するPrecision Boost 2
従来のPrecision Boostと比較すると、ブーストが適用されるワークロードタイプの幅が広がる

 またZENコアでは、冷却能力に応じてCPUの動作周波数をPrecision Boostの動作周波数以上にブーストする「XFR(Extended Frequency Range)」が導入されている。第2世代Ryzenでは、これも拡張されてXFR 2となった。全コア動作のヘビーなマルチスレッドシナリオでも、全コアブーストが効くようになった。

ヘビーマルチスレッドシナリオでもブーストされるXFR2

第2世代Ryzenを支えるGLOBALFOUNDRIESの12nmプロセス

 第2世代Ryzenで、AMDは12nmプロセスを採用した。しかし、12nmのPinnacle Ridgeのダイ(半導体本体)は、14nmのSummit Ridgeのダイと、ダイサイズやトランジスタ数の面で変わらない。

 プロセスノードの数字は14から12へと小さくなったのに、ダイサイズが変わらないのはなぜなのか。そこには、12nmプロセスというプロセスノードに特有の事情がある。

各社のプロセス技術ロードマップ

 一言で言えば、AMDは12nmプロセスを、14nmプロセスの性能/電力改良版として使っている。12nmプロセスでの、もう1つの利点である、スタンダードセルライブラリを切り替えることで、ダイサイズを縮小する手法は使っていない。

 「我々が行なったのは、プロセス技術の進歩の利点をそのまま活かすことだ。ファブでの12nmプロセスのフローでRyzenを走らせた。しかし、スタンダードセルライブラリは変更していない。我々のライブラリの中で、(プロセスに対する)最適化を行なっただけだ。だから、第2世代Ryzenでも、ダイサイズとトランジスタ数がこれまでと変わらない」とAMDのLensing氏は説明する。

 AMDが採用した、GLOBALFOUNDRIESの12nmプロセスは、GLOBALFOUNDRIESが「今年(2018年)前半にリスク生産を開始する」と昨年(2017年)9月にアナウンスしたプロセスだ。AMDは、12nmプロセスで先んじて本格量産に入ったことになる。これは、AMDがGLOBALFOUNDRIESの12nmを牽引するパートナーとして選ばれたことを意味する。

 じつは、GLOBALFOUNDRIESには2つの12nmプロセスがある。高性能コンピューティング向けのFinFETトランジスタの「12LP」プロセスと、IoTにフォーカスしたFD-SOIの「12FDX」プロセスだ。この2種のプロセスは、同じ12nmのプロセスノード名を冠していても、全く異なる。AMDがRyzenに採用するのは12LPの方だ。

 通常は、プロセス名にLPがつけば「Low Power」の略だが、GLOBALFOUNDRIESの12LPの場合は異なる。LPは「Leading-Performance」の略で、性能を抑えたプロセスではないことをGLOBALFOUNDRIESは示している。

 もっとも、GLOBALFOUNDRIESは、12nmで車載とRF/アナログ向けにフォーカスした機能も加えるとアナウンスしており、性能と低電力の両方向に向けた位置づけだ。

GLOBALFOUNDRIESの12nmプロセスの位置づけ

12nmプロセスの実態

 GLOBALFOUNDRIESは、12LPプロセスの発表時に、14nmプロセスに対して、最大で15%の回路密度の向上と、最大で10%以上の性能向上を謳っていた。また、GLOBALFOUNDRIESは、12LPプロセスを同社の14LPPプロセスのプラットフォーム上でビルドしたと説明していた。

 実際、12LPでは、プロセスの基本的なフィーチャサイズは、14LPPと変わらないと見られている。プロセス的には14LPPの改良版プロセスに、12nm相当に回路密度を高めることができるオプションを用意したのが12LPプロセスだ。

 これは、TSMCの12nmプロセスが、同社の16FFCプロセスの改良版であることと似ている。TSMCの12nmプロセスでは、「ターボブースト」とTSMCが呼ぶ性能/電力の改善が図られている。

 加えてTSMCは、スタンダードセルライブラリに、セルハイトが低い6T(6トラック)セルを用意。セル設計上の工夫でセル面積を縮小する「Design-Technology Co-Optimization (DTCO)」を組み合わせることで、実質的に回路密度を高める方法を提供している。

 より小さなスタンダードセルとDTCOの組み合わせによって、12nmプロセス相当に回路密度を高めることができるというのが、12nmというプロセスノード名の根拠となっている。

セルハイトとDTCOによるスタンダードセルサイズの縮小の例

 とはいえ、実際には、高性能なチップではセルハイトの低いスタンダードセルを使うことは難しい。NVIDIAもTSMCの12nmプロセスを採用したものの、実際には6Tセルではなく7.5Tセルを使っていると言われる。

 その場合、12nmは単純に16/14nmプロセスの改良版として、性能/電力の向上版として使われる。AMDの第2世代RyzenにおけるGLOBALFOUNDRIESの12nmプロセスも、ほぼ同様だと見られている。

 まとめると、GLOBALFOUNDRIESやTSMCの“12nm”と呼ばれるFinFET系プロセスには2つのポイントがある。

 1つは、16/14nmのプロセス改良版であること、もう1つは、オプションの6TスタンダードセルやDTCOを組み合わせることによるダイ縮小が可能であること。第2世代Ryzenは、プロセスの性能や電力の改良の利点だけを使っている。

 12LPは、14LPPをベースとしているため、IPの物理的な設計の変更も少なくて済む。また、成熟した14nmプロセスがベースなので、立ち上がり時期の歩留まりの不安も少ない。

 AMDは、12LPを使うことで、液浸7nmプロセスのZEN2までの中間期の性能をブーストした。次のステップは、真のプロセス移行とアーキテクチャ拡張で、さらに大きなジャンプとなる。