RDF-J 2007レポート
RambusはXDRの4倍速でTB級伝送を目指す
会期:11月28日~29日 会場:セルリアンタワー東急ホテル(東京都渋谷区) 高速メモリインターフェイス技術の開発企業である米Rambusの日本法人ラムバスは、半導体メモリシステムの開発者向け技術フォーラム「ラムバス デベロッパ フォーラム ジャパン 2007」(RDF-J 2007)を開催した。ラムバスは高速メモリインターフェイスを継続して開発してきた企業で、RDF-Jでは高速メモリインターフェイス技術に関する最新情報を披露することが恒例となっている。 今回のRDF-J 2007では、次々世代の高速メモリインターフェイス技術「Terabyte Bandwidth Initiative」を発表するとともに、28日の午後に記者会見を開催した。記者会見の模様はすでに報じられているので、本レポートではRDF-J 2007の関連講演を中心に、「Terabyte Bandwidth Initiative(以下はTBIと略記)」の姿をなるべく詳しく紹介する。 TBIを一言でまとめてしまえば、「ピン当たり16Gbpsでデータを入出力する技術」となる。2007年時点で入手できる最も高速な半導体メモリ「XDR DRAM」は、ラムバスが開発した高速インターフェイス技術「XDR(eXtreme Data Rate)」を採用している。ピン当たりのデータ転送速度は4.0Gbpsである。2008年にはデータ転送速度を4.8Gbpsに高めたXDR DRAMが量産されるものの、XDRの代表的なデータ転送速度は4.0Gbpsなので、TBIはXDRの4倍の速度を目指していることが分かる。 XDRを現行世代の高速メモリインターフェイスとすると、次世代は「XDR2」インターフェイスである。標準的なデータ転送速度はピン当たり8.0Gbpsで、XDRのちょうど2倍である。XDR2技術の概要は2005年のRDF-Jで発表された。TBIを「次々世代」と呼んだのは、XDRとTBIの間にXDR2が存在するからである。TBIはXDR2からみると、XDRからXDR2への進化と同様に、データ転送速度を2倍に向上させる技術に相当する。 TBIに準拠したDRAMは、最大で32bit幅のデータバスを備える。XDR/XDR2 DRAMのデータバスは最大で16bit幅なので、データバス幅はTBIで2倍に広がることになる。TBIに準拠したDRAM(TBI DRAM)を16個並べることで、1TB(1,024GB)/secのデータ転送速度を実現する構想である。すなわち32bit(4B)×16Gbps×16個で1,024GB/secだ。ちなみに同じ1,024GB/sのデータ転送速度を実現しようとするとXDR DRAM(16bit幅、4.0Gbps)では128個のDRAMが、XDR2 DRAM(16bit幅、8.0Gbps)では64個のDRAMが必要になる。 ラムバスによると、TBIのような超高速メモリインターフェイスを必要とするのは、グラフィックスプロセッサや据置き型TVゲーム機などである。両者が使用してきたメモリインターフェイスの速度は、2005年までの10年間で50倍~100倍と急激に増えた。現在のグラフィックスプロセッサは128GB/sec、TVゲーム機は25GB/sec~50GB/secでメモリとデータをやり取りしている。将来はそれぞれ、500GB/sec以上、300GB/sec以上を要求するようになると、ラムバスは予測する。
「TBI」の基本的な設計思想は、既存のインフラストラクチャをなるべく活かして高速化を図ることにある。TBIの実装に必要な配線層数は4層で、標準的で安価なプリント基板を利用できる。信号配線に必要な層数は2層である。あとの2層は1層が電源面、もう1層が接地面となるのだろう。ボード設計者からみると、極めて標準的な配線層数である。気になるのは配線長の制限だが、その点は情報が入手できていないのでご容赦願いたい。 今回のRDF-J 2007および記者会見では、TBIには少なくとも3つの新しい要素技術を導入することが明らかになった。それは(1)FDMA(Fully Differential Memory Architecture)、(2)Flex Link C/A(Command/Address)、(3)32X Data Rateである。 「FDMA」は、データ入出力信号、コマンド入力信号、アドレス入力信号のすべてを差動伝送する技術のこと。XDR/XDR2ではデータ入出力信号は差動伝送しているが、コマンド入力信号とアドレス入力信号はシングルエンド伝送であり、データ信号よりもゆっくりと伝送している。ここを差動伝送に変更することで、データ入出力信号と同じ速さで伝送できるようになる。「Flex Link C/A」は、コマンド/アドレス(C/A)入力信号を2ピンのシリアルリンクで伝送する技術のこと。コントローラとメモリをポイントツーポイントで接続する。「32X Data Rate」は、システムクロックの32倍の速度でデータを伝送する技術のこと。システムクロックは500MHzである。1クロックサイクルでデータとコマンド/アドレス(C/A)の両方を32bitずつ、送受信できる。 これらの要素技術の中で既存のDRAM技術とかなり違っているのが、「Flex Link C/A」である。ラムバスのDRAMインターフェイスではコマンド信号とアドレス信号をリクエスト信号にまとめて伝送している。XDR DRAMのリクエスト信号入力は12ピンあり、パラレルに信号を入力する。これが「Flex Link C/A」では2ピンになり、シリアルに信号を入力する形式に変わる。1サイクルのシステムクロック(2ns)で32bitのリクエストパケットをコントローラからメモリに送信する。 「Flex Link C/A」はポイントツーポイント接続なので、1個のDRAMには最低でも1個のC/Aシリアルリンクを割り当てる必要がある。一方で複数のC/Aシリアルリンクと1個のDRAMを接続しても構わないので、接続するDRAMメモリ全体の記憶容量や1回にアクセスする記憶容量(グラニュラリティ)などを柔軟に選択できる。
ラムバスはRDF-J 2007の展示会場に、TBIのデモボードを出品し、ピン当たり16Gbpsのデータ伝送を実現してみせた。1個のコントローラチップと、2個のメモリチップを搭載したボードである。2個のメモリチップで32bit幅のバスを構成しており、64GB/secの伝送を実行した。またFlex Link C/Aに内蔵したFlexPhase技術によって伝送遅延時間を自動的に調整する様子を示していた。 試作したボードのシステム構成をもう少し詳しく述べると、コントローラ側は4リンクのFlex Link C/Aと32bit幅のデータ(DQ)リンクを搭載し、メモリ側は1リンクのFlex Link C/Aと16bit幅のDQリンクを搭載する。といっても実際にはコントローラやDRAMなどは入手できない。そこで、シリコンの半分をコントローラ回路、残り半分をメモリ回路としたテストチップを設計、製造した。このテストチップを3個、デモボードに搭載している。3個の中で1個がコントローラチップであり、残りの2個がメモリチップである。コントローラチップはコントローラ回路だけを動かし、メモリ回路は外部と接続しない。メモリチップはメモリ回路だけを動かし、コントローラ回路は外部と接続しない。目的別に1個のチップを使い分けた。 ラムバスは過去、高速インターフェイスを実現する数多くの要素技術を開発しており、開発済みの要素技術の積み重ねによってデータ転送速度を高めてきた。TBIに関する発表では3種類の要素技術を紹介していたが、XDR2インターフェイス向けに開発している技術もTBIには組み込まれると予想する。出力信号の低周波側の利得を意図的に抑えて高周波側の信号ひずみを抑える技術「Transmit Equalization」、コントローラとメモリの間の遅延時間を動的に補正する技術「Adaptive Timing Ajustment」などである。 いずれにせよ、2nsというわずかな時間で32bitのデータを伝送することは容易ではない。1bitに62.5psしか割り当てられないのだ。ラムバスは記者会見で、TBIの製品化を3年~5年後と述べていた。XDR DRAMが製品化され、システムに採用されるペースを見ていると、3年後というのはいささか早すぎるように思える。5年後あるいはその先、というのが実際のところではないだろうか。 □Rambusのホームページ (2007年11月30日) [Reported by 福田昭]
【PC Watchホームページ】
|