後藤弘茂のWeekly海外ニュース
AMDが12nmプロセスの第2世代Ryzenファミリを正式発表
2018年4月19日 22:00
AMDが、第2世代のRyzen CPU「2nd Gen AMD Ryzen Desktop Processor」ファミリーを発表した。コードネームは「Pinnaple Ridge(ピナクルリッヂ)」で、CPUコアが「ZEN+」となる。
AMDは、第2世代Ryzenを「Ryzen 7」と「Ryzen 5」の2つのブランド層で投入する。「Ryzen 7 2700X/2700」と、「Ryzen 5 2600X/2600」だ。性能は、Ryzen 7 2700Xで最大クロックが従来の4.1GHzから4.3GHzへと引き上げられた。AMDはお買い得感を高めるために、プレミアムクーラー付きで329ドルにて市場に投入する。
AMDのRyzenファミリが全て2000番台へと移行
Ryzenは、すでにAPU(Accelerated Processing Unit)版Ryzenから、型番が2000番台になっているが、Pinnacle Ridgeの投入によって、CPU版Ryzenも2000番台になる。
CPU版とAPU版の両Ryzen 2000番台に共通するのは、ターボ制御の「Precision Boost 2」などが新バージョンになったこと。つまり、CPUを制御するマイクロコトローラの制御の面で2000番台は共通する。
しかし、APU版のRyzenである「Raven Ridge」と、今回の第2世代Ryzen(Pinnacle Ridge)には、半導体チップとして大きな違いがある。
最大のポイントは、従来の14nmプロセスから、12nmプロセスへと製造プロセス技術を移行、性能/電力を引き上げたことだ。第2世代Ryzenは、AMDで初の12nmプロセスチップであり、NVIDIAのVolta(ボルタ)と同じく、12nm世代プロセッサとなる。
その反面、第2世代Ryzenでは、ZEN CPUコア自体の拡張は、今回はほとんど行なっていない。キャッシュアクセスレイテンシは低減されているが、CPUコア内部はほとんど変わっていない。
今回の第2世代RyzenのCPUコアは、「+」コアであり、CPUコアの世代が変わる「ZEN2」コアではない。拡張は、すでに触れたPrecision Boost 2のような、CPUの制御の面の方が大きい。
コア内部のマイクロアーキテクチャはZEN世代のまま
第2世代Ryzenのポイントはどこにあるのか。AMDのKevin Lensing氏(Corporate Vice President & General Manager, Client Compute Business Unit Computing and Graphics Business Group, AMD)は次のように説明する。
「第2世代Ryzenにおいて、大きな変更はプロセス技術と、ファームウェアによる(CPU内の)マイクロコントローラ(によるCPUの制御)の変更だ。12nmプロセスについては、性能と電力の利点を活かしている。また、ファームウェアについては、膨大な変更を行なっている。
しかし、アーキテクチャ面では、ZENマイクロアーキテクチャの基本的な部分は変えていない。次の『ZEN2』は全面的なアーキテクチャ改良だが、今回は『ZEN+』であり、アーキテクチャの変更は小さい。しかし、重要な改良もある。キャッシュレイテンシの短縮で、IPC(Instruction-per-Clock)も向上している」
実際AMDは、第2世代Ryzenにおいて、ZENのマイクロアーキテクチャにはほとんど手を加えていない。命令スケジューリングやバッファの拡張といった、CPUのマイナーチェンジ時によく行なわれる、相対的に小規模なアーキテクチャ拡張も行なっていないという。
マイクロアーキテクチャに手を入れると、どこかに問題が発生する可能性があるので、開発期間の短縮を第一に考えて、据え置いたとも考えられる。その意味では、第2世代Ryzenの本質は、プロセス技術の改良版だ。
ただし、Ryzenの弱点だったキャッシュアクセスレイテンシについては、ZEN+コアで改善されている。アクセスサイクル時間の比較では、L1レイテンシは最大13%、L2レイテンシは最大34%、同CCX内のL3レイテンシは最大16%低減されている。
この数字は、レイテンシをCPUクロックサイクルで比較したものではなく、レイテンシ時間の比較だ。しかし、レイテンシサイクル自体も、特にL2での低減が顕著だ。L2のレイテンシサイクルが、17サイクルから12サイクルへと下がったことがわかる。
12nmプロセスとファームウェアによってターボ性能がアップ
ZENのマイナーチェンジ版の位置づけがZEN+の第2世代Ryzenだが、12nmによる、性能/電力の改良とフィーチャの拡張の効果も大きい。
動作周波数の上限は4.35GHzに引き上げられ、全CPUコアのオーバークロックでも4.2GHzに達する。さらに、CPUコアのブースト制御は「Precision Boost 2」となり、2から7コア時でもブーストされるようになった。
従来のRyzenと比べると、12nmプロセスによって同クロック時の駆動電圧は50mV下がった。そのため、従来のRyzenに対して、同クロック時でも電力消費は抑えられ、同消費電力なら性能が向上している。
AMDは、Ryzen 7 2700と1700の比較では、同等の電力時に16%も性能が向上するとしている。また、Ryzen 5 1600Xと2600Xの比較では、同クロック時の電力は11%も低減しているとする。
加えて第2世代Ryzenでは、ターボ制御が大幅に向上している。Ryzenは、CPU内部に省電力電力やターボを制御するマイクロコントローラを搭載している。第2世代Ryzenでは、このマイクロコントローラを制御するファームウェアが大幅に改良された。
Ryzen CPUの動作周波数をブーストする「Precision Boost」は、従来の1000番台Ryzenでは、1コアまたは2コアがアクティブだった場合に、アクティブコアの動作周波数をブーストしていた。それ以外の場合はベースクロックに落ちるため、3~7コアでは周波数ブーストが効かない。
それに対して、第2世代RyzenのPrecision Boost 2では、3コア以上がアクティブなケースでも、リニアに動作周波数がブースト制御される。そのため、3コア以上で性能がガクっと落ちることがなく、最適な動作周波数へとブースト状態が保たれる。加えて、12nmプロセスによって、同電力時でも従来より動作周波数がアップする。
また、Ryzen 7 2700Xについては、TDP(Thermal Design Power: 熱設計消費電力)枠が従来の95Wから105Wへと引き上げられた。そのため、全CPUコアがアクティブであってもブーストが効くケースが出るため、実効性能は大幅に向上する。
Precision Boost 2の制御方法自体は、APU版Ryzenと同じだが、12nmプロセスとプラットフォームのために、より高性能へと振れたのが第2世代RyzenのPrecision Boost 2だ。
またZENコアでは、冷却能力に応じてCPUの動作周波数をPrecision Boostの動作周波数以上にブーストする「XFR(Extended Frequency Range)」が導入されている。第2世代Ryzenでは、これも拡張されてXFR 2となった。全コア動作のヘビーなマルチスレッドシナリオでも、全コアブーストが効くようになった。
第2世代Ryzenを支えるGLOBALFOUNDRIESの12nmプロセス
第2世代Ryzenで、AMDは12nmプロセスを採用した。しかし、12nmのPinnacle Ridgeのダイ(半導体本体)は、14nmのSummit Ridgeのダイと、ダイサイズやトランジスタ数の面で変わらない。
プロセスノードの数字は14から12へと小さくなったのに、ダイサイズが変わらないのはなぜなのか。そこには、12nmプロセスというプロセスノードに特有の事情がある。
一言で言えば、AMDは12nmプロセスを、14nmプロセスの性能/電力改良版として使っている。12nmプロセスでの、もう1つの利点である、スタンダードセルライブラリを切り替えることで、ダイサイズを縮小する手法は使っていない。
「我々が行なったのは、プロセス技術の進歩の利点をそのまま活かすことだ。ファブでの12nmプロセスのフローでRyzenを走らせた。しかし、スタンダードセルライブラリは変更していない。我々のライブラリの中で、(プロセスに対する)最適化を行なっただけだ。だから、第2世代Ryzenでも、ダイサイズとトランジスタ数がこれまでと変わらない」とAMDのLensing氏は説明する。
AMDが採用した、GLOBALFOUNDRIESの12nmプロセスは、GLOBALFOUNDRIESが「今年(2018年)前半にリスク生産を開始する」と昨年(2017年)9月にアナウンスしたプロセスだ。AMDは、12nmプロセスで先んじて本格量産に入ったことになる。これは、AMDがGLOBALFOUNDRIESの12nmを牽引するパートナーとして選ばれたことを意味する。
じつは、GLOBALFOUNDRIESには2つの12nmプロセスがある。高性能コンピューティング向けのFinFETトランジスタの「12LP」プロセスと、IoTにフォーカスしたFD-SOIの「12FDX」プロセスだ。この2種のプロセスは、同じ12nmのプロセスノード名を冠していても、全く異なる。AMDがRyzenに採用するのは12LPの方だ。
通常は、プロセス名にLPがつけば「Low Power」の略だが、GLOBALFOUNDRIESの12LPの場合は異なる。LPは「Leading-Performance」の略で、性能を抑えたプロセスではないことをGLOBALFOUNDRIESは示している。
もっとも、GLOBALFOUNDRIESは、12nmで車載とRF/アナログ向けにフォーカスした機能も加えるとアナウンスしており、性能と低電力の両方向に向けた位置づけだ。
12nmプロセスの実態
GLOBALFOUNDRIESは、12LPプロセスの発表時に、14nmプロセスに対して、最大で15%の回路密度の向上と、最大で10%以上の性能向上を謳っていた。また、GLOBALFOUNDRIESは、12LPプロセスを同社の14LPPプロセスのプラットフォーム上でビルドしたと説明していた。
実際、12LPでは、プロセスの基本的なフィーチャサイズは、14LPPと変わらないと見られている。プロセス的には14LPPの改良版プロセスに、12nm相当に回路密度を高めることができるオプションを用意したのが12LPプロセスだ。
これは、TSMCの12nmプロセスが、同社の16FFCプロセスの改良版であることと似ている。TSMCの12nmプロセスでは、「ターボブースト」とTSMCが呼ぶ性能/電力の改善が図られている。
加えてTSMCは、スタンダードセルライブラリに、セルハイトが低い6T(6トラック)セルを用意。セル設計上の工夫でセル面積を縮小する「Design-Technology Co-Optimization (DTCO)」を組み合わせることで、実質的に回路密度を高める方法を提供している。
より小さなスタンダードセルとDTCOの組み合わせによって、12nmプロセス相当に回路密度を高めることができるというのが、12nmというプロセスノード名の根拠となっている。
とはいえ、実際には、高性能なチップではセルハイトの低いスタンダードセルを使うことは難しい。NVIDIAもTSMCの12nmプロセスを採用したものの、実際には6Tセルではなく7.5Tセルを使っていると言われる。
その場合、12nmは単純に16/14nmプロセスの改良版として、性能/電力の向上版として使われる。AMDの第2世代RyzenにおけるGLOBALFOUNDRIESの12nmプロセスも、ほぼ同様だと見られている。
まとめると、GLOBALFOUNDRIESやTSMCの“12nm”と呼ばれるFinFET系プロセスには2つのポイントがある。
1つは、16/14nmのプロセス改良版であること、もう1つは、オプションの6TスタンダードセルやDTCOを組み合わせることによるダイ縮小が可能であること。第2世代Ryzenは、プロセスの性能や電力の改良の利点だけを使っている。
12LPは、14LPPをベースとしているため、IPの物理的な設計の変更も少なくて済む。また、成熟した14nmプロセスがベースなので、立ち上がり時期の歩留まりの不安も少ない。
AMDは、12LPを使うことで、液浸7nmプロセスのZEN2までの中間期の性能をブーストした。次のステップは、真のプロセス移行とアーキテクチャ拡張で、さらに大きなジャンプとなる。