後藤弘茂のWeekly海外ニュース

GPUのメモリを18Gbpsまで引き上げる「GDDR6」の概要をSamsungとSK hynixが発表

後藤弘茂 (Hiroshige Goto)

2018年2月15日 06:00

SamsungとSK hynixが異なる実装のGDDR6を発表

　今年(2018年)はGDDR6の年となる。データ転送レートは最大で18Gbps、高性能GPUクラスのx384インターフェイスならメモリ帯域は864GB/sとなる。メモリ帯域だけなら、これまでのHBM2(まだ広帯域化が続いている)に匹敵する。ミッドレンジGPUのx256インターフェイスで16Gbpsでも、帯域は512GB/s。グラフィックス向けのGPUのメモリ帯域は、ここへ来てさらにジャンプすることになりそうだ。

　GPUのメモリは、ハイエンドGPU向けのHBM系と、高性能GPU向けのGDDR系に2分されつつある。高コストだが最大メモリ帯域と低消費電力が売り物のHBMに対して、GDDRはメモリ帯域と電力では不利ではあってもコストが低い。そのため、今後もGDDRメモリはGPUやゲーム機、ネットワークプロセッサ、ニューラルネットワークプロセッサ、そのほかのメニイコアといった、そこそこのコストで広帯域を必要とするデバイスでは使われて行くと見られる。

DRAMのメモリ帯域と転送レート
PDF版はこちら

　もちろん、GPUでも、HBMに熱心なAMDと、HBMはほぼGPUコンピューティング向けと割り切っているNVIDIAといった違いがある。しかし、今後もしばらくは、両メモリ規格が併存することは間違いがない。GDDR系メモリは、現在はGDDR5が主流で、Micron TechnologyからGDDR5Xが投入されたが、それほど浸透しておらず、今後は次世代の「GDDR6」へと移行が進むと見られている。

　米サンフランシスコで開催されている半導体の国際会議ISSCC(IEEE International Solid-State Circuits Conference)では、DRAMの3強のうちのSamsungとSK hynixからGDDR6の技術が発表された。同じGDDR6であっても、2社でアプローチが異なり、性格が異なる製品となっている。

　具体的には、SK hynixのGDDR6はシングルダイで8Gb容量、データ転送レートは16Gbpsの22nmプロセス。SamsungのGDDR6はデュアルダイで16Gb容量、データ転送レートは18Gbpsの10nmクラスプロセス。

　Samsungの16Gbという大容量は、ミッドレンジ以下のグラフィックスというより、もっと大容量を求めるアプリケーションを意図しているように見える。実際、現在は広帯域メモリがHPC(High Performance Computing)やディープラーニングに浸透したことで、大容量化が求められている。そうした流れに沿ったGDDR製品となっている。

メモリアクセス粒度を一定に保つGDDR6

　GDDR5は8～9Gbpsでデータ転送レートが頭打ちとなっている。GDDR6はその後継として規格化されたメモリだ。当初は、広帯域メモリはスタックドのHBMへと移行する可能性があると言われていたが、コスト面からそうならず、GDDR6が登場することになった。ポストGDDR5では、12Gbpsを達成するGDDR5Xもあるが、メモリアクセスグラニュラリティがGDDR5より大きくなるため、汎用性は低いという。

Samsungの発表したGDDR規格のDRAMの学会発表の転送レート

Samsungの発表したGDDR5、GDDR5XとGDDR6のデータ転送回りのスペックの違い

SK hynixが示したGDDR5、GDDR5XとGDDR6のフィーチャの違い

　GDDR6が従来のGDDR系メモリと大きく異なるのはメモリチャネルの構成だ。GDDR5/GDDR5Xでは、標準ではダイあたりX32の1メモリチャネル構成(実際にはX16の1チャネルにも構成できる)となっている。それに対して、GDDR6は、X32を2つのチャネルに分割したX16の2チャネル構成となっている。このチャネル構成は、モバイルDRAMのLPDDR4とよく似ている。

　チャネルを分割した最大の理由は、メモリアクセスグラニュラリティを従来のGDDR5と同等に抑えるためだという。GDDR5はメモリアクセスのバーストレングス(BL)が8で、X32のインターフェイスであるため、メモリからフェッチするデータの粒度が32-byte(256-bit)となっている。

　GDDR6では、バーストレングスが16と倍になるが、インターフェイスがX16に半減するため、データの粒度はGDDR5と同じく32-byteにとどまる。このデータ粒度はプロセッサ側のキャッシュラインサイズとも密接に関連するが、GPUの場合は32-byteが望ましいとされている。このデュアルチャネルアーキテクチャが、GDDR6のキーとなっている。

Samsungは2個のダイでGDDR6を構成

　Samsungは、GDDR6をスプリットダイ方式として実装したことを発表した。つまり、GDDR6規格のDRAMを、2個のダイで構成している。具体的には、GDDR6デュアルチャネルの2つのチャネルをそれぞれ1個のダイに実装。X16の1チャネルを備えたダイを2個で、1個のGDDR6チップを構成するようにした。各ダイがX16の1チャネル構成だ。それに対して、SK hynixは、1個のダイに、2つのチャネルを実装している。ダイはX16の2チャネル構成だ。

　Samsungは、これ以前にも、LPDDR4とLPDDR4Xをスプリットダイで設計している。つまり、2チャネルアーキテクチャのDRAMは、スプリットダイとして設計するのがパターンとなっている。LPDDR4では、歩留まり向上が大きな理由として挙げられていた。SamsungのGDDR6は16G-bit容量と大きいため、これもダイを分割すると歩留まり上では有利となる。しかし、Samsungはそれ以上に高速化のための工夫だと説明した。

　具体的には、スプリットダイとすることで、ペリフェラルからのデータバスとパワーラインの配線、パッケージ上の配線を短く最適化する。データバスディレイやIRドロップを減らし、パッケージ配線でのクロストークを低減するという。Samsungの18Gbpsという高転送レートの実現にはスプリットダイアーキテクチャも寄与している。

Samsungのスプリットダイアーキテクチャ

クロッキングで大きく異なる2社

　GDDR6のデータ転送レートは、JEDEC(半導体の標準化団体)の当初のロードマップでは16Gbpsとなっていた。今回、ISSCCではSK hynixが16Gbpsのチップを発表したが、Samsungは18Gbpsを発表している。GDDR5の転送レートは最終的に9Gbpsに達しているので、倍速のGDDR6で18Gbpsをターゲットとしたようだ。

　従来のGDDR5では、X16(16本のデータライン)を1個のフォワードクロック「WCK」でドライブしていた。GDDR6では、X8(8本のデータライン)に対して1個のWCKとなり、クロックディレイとスキューを最小にしている。つまり、1チャネルに2個のWCKラインが配置される形となる。

SamsungによるWCKとX8の対応の説明

SK hynixによるWCKとX8の対応の説明

　Samsungは、データ転送レート18Gbpsを達成するために、クロッキングを改良した。DDR(Double Data Rate)で18Gbpsの転送レートを実現するために9GHzのWCKを実現する。そのために、従来のPLLベースのクロッキングではなく、PLLレスのクロッキングを行なっていると説明した。これは、DRAMの製造プロセスでは、PLL自体がノイズ源となるからで、高転送レートではダイレクトのクロッキングを行なうという。

SamsungのPLLレスクロッキング

　SamsungにはオプショナルでPLLモードもあり、PLLモード時にはQDR(Quad Data Rate)となり、16Gbpsを4GHzのWCKで駆動する。ちなみに、GDDR6規格では、ベンダーによってDDR(Double Data Rate)とQDR(Quad Data Rate)のどちらかのデータレート方式を選ぶようになっており、Samsungはコンフィギュラブルに実装したと見られる。SK hynixはDDRを選んでおり、データ転送レートはWCKクロックの2倍となっている。

SamsungのPLLオンとPLLオフの違い

　SK hynixはWCKディストリビューションが2系統のパスになっている。「HF(High Frequency)」モードと「LH(Low Frequency)」モードだ。HFパスがCMLタイプで、LFパスがCMOSタイプとなっており、LFモード時には低クロック時のWCKディストリビューション電力を大幅に低減することで省電力化を図るという。

SK hynixのWCKパス

Samsungは10nm台のプロセスでGDDR6を製造

　SK hynixのGDDR6はシングルダイで、22nmプロセス。8G-bit容量でダイサイズは69.9平方mmとなっている。対してSamsungのGDDR6は、デュアルダイで10nmクラスプロセス(Samsungは10nm台のプロセスをこの呼称で総称している)。8G-bit容量の1チャネルのダイの面積が47.9平方mmで、このダイが2個で1個の16G-bit GDDR6となる。