【後藤弘茂のWeekly海外ニュース】DDR4の後退で延命されるDDR3は低電圧化へ

■後藤弘茂のWeekly海外ニュース■

DDR4の後退で延命されるDDR3は低電圧化へ

●メインストリームのDDR3は1,866Mbpsで打ち止め

　Intelとメモリ業界は、PC市場では次世代メモリDDR4の普及を緩やかなペースで行なう。PCへの浸透が始まるのは2014年頃からで、本格的にDDR3に置き換わり始めるのは2015年までずれ込む見込みだ。それまでは、DDR4はサーバーメモリに留まる。つまり、PCメモリは、あと3年はDDR3が主流の時代が続く。DDR2からDDR3への移行時にも予想より時間がかかったが、DDR3からDDR4への移行はそれ以上に時間がかかる。DDR3時代は、非常に長引く見込みだ。

DRAMロードマップ(PDF版はこちら)

　では、長期間に渡りPCを支えるDDR3はどこまで高速になるのか。実は、DDR3の高速化も緩慢なペースでしか進まない。例えば、Intelの場合はPCでサポートするDDR3メモリの転送レートは1,333Mbpsから1,600Mbpsに上がり、次のステップで1,866Mbpsをサポートする。しかし、Intelの標準サポートのDDR3の転送レートは、そこで打ち止めとなる。Intel Developer Forum(IDF)のメモリセッションでメモリロードマップの説明を行なったGeof Findley氏(SrManager, Platform Memory Operation, Intel)は次のように説明する。

　「DDR3では転送レートは、おそらく1,866Mbpsが最高速になる。JEDECでは2,133Mbpsも議論しているが、それはハイエンドデスクトップのようなパフォーマンスセグメントのみのサポートで、Extreme Memory Profile(XMP)のみになるだろう。コモディティメモリとしては、1,866Mbpsが最高だろう」。

　通常のメモリ価格で入手できるメインストリームのメモリは1,866Mbps止まりとなりそうだ。また、IntelなどCPUベンダー側の公式サポートも、そこに留まる。

Intelのメモリロードマップ(IDF 2011から)

●高速化に一定の限界があるDDR3メモリ

　DDR3では1,866Mbpsまでしかメインストリームではサポートしない理由は、DRAM側の事情もある。現在の高速DRAMは、内部メモリセルから1アクセスに複数データを読み出す「Prefetch」手法を使うことで、メモリコアとインターフェイスの速度のギャップを埋めている。例えば、DDR3はPrefetch8テクニックを使い、8nビットのデータを1クロックで読み書きすることで、メモリコアの動作速度の8倍のバス転送レートを可能にしている。下のチャートがその関係を示した図だ。Prefetch4のDDR2に対して、Prefetch8のDDR3は、同じメモリコアの速度で、2倍の転送レートを実現できる。また、メモリコア自体も、ゆっくりとしたペースだが高速化しているため、転送レートの上限も上がりつつある。


DDRのPrefetchアーキテクチャ(PDF版はこちら)	DRAMセルとIOの周波数の関係(PDF版はこちら)

　しかし、メモリコアはそれほどは速くできない。そのため、DRAMのバスを高速化しすぎると、メモリコアが追従できない。つまり、高速品は、歩留まり(スピードイールド)が限られてしまう。

DDR DRAM転送レート(PDF版はこちら)

　DDR3については、おそらく多くのメーカーで1,866Mbps程度までが充分な歩留まりを確保できる限界に近いと推測される。2,133Mbpsはスピードイールドがやや限られるため、ある程度高価格で、数量が限定されると推測される。2,133Mbps以上は、基本的にはDDR4の速度領域となる。

　ちなみに、上のチャートではDDR4はPrefetch 8nとしている。これはバンクグルーピングによって異なるバンクへの並列アクセスを行なうことで、アクセス粒度をPrefetch 8相当に減らすためだ。実質はメモリコアに対してPrefetch 16相当の帯域のアクセスを行なうと推定される。

　メモリアクセスの粒度が大きくなると、一度にCPUやGPUから読み書きするメモリ量が大きくなる。しかし、プロセッサ側が必要とするデータの粒度は、特定のアプリケーション以外は大きくならない。そのため、メモリアクセス粒度が大きくなると、CPUからのアクセスでムダが生じてしまう。DDR4のバンググルーピングは、そうしたムダを防ぎ、高速なDRAMインターフェイスを効率的に使わせるための技術だ。

　この手法は、RambusのMobile XDR DRAMのMicro-threadingと基本的には同じような手法だと推測される。Wide I/Oも同様に1チップで4チャネル分のアクセスを同時に行なうことで、メモリアクセス粒度を下げている。異なるバンクへの並列アクセスでメモリ粒度を下げる手法は、高速メモリ時代の標準的な手法になるようだ。ただし、こうした技術は特許が絡む場合が多いため、DDR4のバンクグルーピングもすんなり行くかどうかはわからない。

●低電圧版のDDR3Lと超低電圧版のDDR3UL

　4～5年で2倍と、緩やかなペースでしか進まないメインストリームDRAMの高速化。その代わり、新しい要素としてDRAMの低消費電力化が始まっている。JEDECはDDR3の低電圧版「DDR3L」を規格化し、普及が始まっている。そして、IntelもサーバーCPUで低電圧版のDDR3Lのサポートを進め、来年(2012年)からはノートPCでもDDR3Lのサポートを始める。メモリ搭載量の多いサーバーと、バッテリ駆動のモバイルは、どちらもDRAMの電力を下げる意味が大きい。

　通常のDDR3が1.5V駆動であるのに対して、DDR3Lは1.35V駆動で90%に低電圧化した。電圧は電力消費に二乗で効くのでアクティブ電力は理論値で80%程度に下がる。下のJEDECのスライドでは、同じ転送レートなら、通常電圧版より80%かそれ以下に電力が下がっている。JEDECはさらに、電圧を1.25Vに落とした「DDR3UL(DDR3Uと呼ばれることもある)」も推進している。こちらはさらに十数%電力が下がる。

DRAM電圧と電力に関するJEDECの資料

　実際の製品では、もう少し異なる。下のHynixのスライドがわかりやすい。DDR3Lではアクティブ時のIDD0やIDD1では80%台の電力に、スタンバイ時のIDD2Nなどでも80%近くに下がり、スタンバイ時のセルフリフレッシュのIDD6でも90%程度には下がっている。DDR3ULはさらに十数%下がる。これを見ると、DDR3Lでは、動作時だけでなく、スタンバイ状態のメモリの電力も減ることがわかる。これは、バッテリ駆動のノートPCにとっては、駆動時間が延びることを意味する。

DDR3の電圧と電力に関するHynixの資料

●DDR3時代が長引くためプロセスの微細化が進む

　DDR3で低電圧の派生規格が次々に登場している背景には、DDR3の製造プロセス技術の進歩がある。DDR3はSamsungの80nmプロセスから生産がスタート、各社とも70nmプロセス台までには最初の世代の1Gb品の量産チップを揃えた。そこから60nm台、50nm台、40nm台と経て、現在は2Gb品を30nmプロセスで生産しつつある。つまり、プロセス技術では80nm→7xnm→6xnm→5xnm→4xnm→3xnmと進展しており、20nmプロセス台にも到達しようとしている。

　ちなみに、DRAMのプロセス移行はここ2年で加速している。これは、NANDフラッシュメモリのプロセス微細化が過去2年加速されたことと関連している。DRAMとNANDの兼業メーカーは、NANDに先端プロセスを投入し、そのプロセスを次のフェイズでDRAMへと振り分ける場合がある。NANDの微細化はいったん鈍化したのが、競争により再び加速しており、それがDRAMにも波及していると見られる。

DRAMのプロセス技術と容量世代ロードマップ(PDF版はこちら)

　DDR3が80nmから2xnmまで幅広いプロセス世代で製造されるのは、DDR3がそれだけ長く続いているからだ。つまり、DDR4世代への移行が遅れたことで、DDR3はプロセスの微細化が進み、副次的に電圧を下げることも容易になっている。また、同電圧時でも、微細化で若干は電力が下がる。DDR3の低電力化は、移行の遅れとのトレードオフの関係になっている。


プロセスルールによる電力低下(Hynix)	Samsungは50nm台から20nm台で65%削減できるとする

　ちなみに、微細化が進む分だけチップのダイサイズは小さくなっている。旧来のDRAMダイは80平方nm前後からがPC向けの量産サイズだったが、今はそれをはるかに下回るサイズとなっている。ダイが小型化した理由は、DRAM価格の低迷が延々と続いており、製造コストをできる限り低くしないと利益を出せないからだ。

　現状ではDDR3のスポット価格は主力の2Gb品で1ドル前後、1Gb品で60セント前後となっている。通常はここまでダイが小さくなれば、倍容量品がビット単価で下回り、DRAMダイの容量世代の移行が始まる。しかし、現在は、PCの搭載メモリの大容量化の圧力が低いために、DRAMの容量世代の移行もなかなか進まない状況にある。こうした状況で、DRAMベンダーはDDR3はプロセス微細化の利点を、DDR3Lなど低電圧版の派生で出そうとしている。また、逆にDDR3派生品の開発にエンジニアリングリソースを割かれていることは、DDR4が遅れる原因の1つになっているとJEDECでは説明している。

●価格とスピードがトレードオフとなるDDR3L

　DDR3Lのトレードオフはスピードと価格だ。DDR3Lの転送レートは通常電圧版のDDR3と比べて、同じプロセス世代で1グレード分落ちるとされている。通常電圧版DDR3で1,600Mbpsが主流の現在はDDR3Lは1,333Mbpsが、通常電圧版で1,866Mbpsが主流になってきた段階ではDDR3Lは1,600Mbpsがメジャーになるとされている。ただし、高速品を前倒ししているメーカーもある。

　DDR3Lは、DDR3と基本的には同じダイを使った製品だ。DDR3から低電圧駆動時の特性が仕様に合うものを選別している。SamsungはDDR3Lでは、セルフリフレッシュ電流IDD6の値を下げることができるダイを選別しなければならず、そのため、若干の価格アップがあると説明している。それでも、量産効果の大きいDDR3と同ダイであるため、DDR3とは異なるダイのLPDDR2/LPDDR3より低価格になると言う。

　DDR3Lは、DDR4までのつなぎの規格という色彩も強い。DDR3ULよりもさらに低い1.2Vで駆動し、DDR3よりすぐれた低電力フィーチャを備えるDDR4は、DDR3Lに対して同転送レート時に低電力になる見込みだからだ。