福田昭のセミコン業界最前線

Samsungの高速SSD技術「Z-SSD」と専用フラッシュ技術「Z-NAND」の正体

Samsung Electronicsが2018年1月30日に製品化を正式発表した高速SSD「Z-SSD」の外観。ヒートシンクを取り外した状態 ※Samsungのニュースリリースから

 最大手NANDフラッシュメモリベンダーであり、最大手のSSDベンダーでもあるSamsung Electronicsが、高速SSD技術「Z-SSD」と専用NANDフラッシュメモリ技術「Z-NAND」技術の内容を一部、明らかにした。

 この2月(2018年2月)に米国サンフランシスコで開催された国際学会「ISSCC」で、「Z-SSD」用コントローラ技術と「Z-NAND」技術の概要を発表した(講演番号20.2)。

隠されてきた「Z-SSD」と「Z-NAND」の正体

 「Z-SSD」技術と「Z-NAND」技術は、2016年8月にフラッシュメモリ業界のイベント「FMS (Flash Memory Summit)」でSamsungが初めてアナウンスした(Intel-Micron連合の3D XPointメモリに対抗するSamsungの「Z-NAND」技術参照)。

 Z-SSDは、NANDフラッシュメモリを搭載する通常のSSDに比べ、アクセスの遅延時間(レイテンシ)が短いことを特徴とする。FMSでは性能を比較してZ-SSDの優位性を強調していたものの、記憶容量や定量的な性能諸元、実現技術などは明らかにしなかった。

 その後、Samsungが2016年9月に韓国ソウルで主催したSSDのイベント「Samsung SSD Global Summit 2016」で、Z-SSDの試作品を展示するとともに、製品を想定した性能諸元を提示した。石井氏のイベントレポート(Samsungが3D XPoint対抗の次世代SSD「Z-SSD」を展示参照)によると、Z-SSDの記憶容量は1TB(ユーザー領域は800GB)、型名は「SZ985」、専用コントローラの開発コード名は「Phoenix」、シーケンシャルアクセスのスループットは、読み出しと書き込みともに最大3.2GB/s、4KB単位のランダム読み出し性能は最大750,000IOPS、4KB単位のランダム書き込み性能は最大160,000IOPSである。

 さらに、Samsungが2017年6月に日本の東京で主催したSSDのイベント「2017 Samsung SSD Forum Japan」でも、同様の展示を実施した(Samsung、NANDやSSDの動向や企業での活用事例を紹介参照)。

 続いて、2017年8月開催の「FMS 2017」でもSamsungは、Z-SSD(SZ985)の4KB単位のランダム読み出し遅延時間(レイテンシ)が15μsと極めて短いことや、コストを下げた第2世代のZ-NAND技術を開発中であることなどをキーノート講演で公表した。

Z-NAND技術とV-NAND技術(Samsungの3D NANDフラッシュ技術)の性能比較。Z-NANDはV-NANDに比べ、読み出し遅延時間が15分の1に短くなっているという ※FMS 2017のキーノート講演でSamsungが示したスライドから
Z-NAND技術とV-NAND技術(Samsungの3D NANDフラッシュ技術)の比較(続き)。縦軸は読み出し遅延時間、横軸はコスト。第1世代のZ-NAND技術(1st Z-NAND)に比べ、第2世代のZ-NAND技術(2nd Z-NAND)はコストが下がっている ※同上
Z-NAND技術によるSSD(Z-SSD)と、TLC方式のNANDフラッシュ技術による、SSDの読み出し遅延時間(レイテンシ)の比較。Z-SSDは15μs以下のレイテンシを達成できるとする。通常のSSDの5.5分の1に短くなる ※同上

Z-SSDの容量は800GBと240GB、書き込みの長期信頼性が高い

 そして今年(2018年)の1月30日にSamsungは、Z-SSDの製品化を正式に発表した。

 型名は「SZ985」であり、過去にアナウンスした名称と変わらない。フォームファクタはHHHL (Half-Height Half-Length)、入出力インタフェース(IO)は、物理IOがシングルのPCIe 3.0を4レーン、論理IOがNVMeバージョン1.2である。

 記憶容量は800GBと240GBの2種類。エンタープライズ向けである。800GB品のランダム読み出し遅延時間は16μs、ランダム読み出し性能は750,000IOPS、ランダム書き込み性能は170,000IOPS。

 特筆すべきは、書き込み長期信頼性の高さで、1日当たりの全容量書き込みが30回(30DWPS)で、5年間の寿命を保証する。平均故障間隔(MTBF)は200万時間である。

 Samsungはニュースリリースで、Z-SSDとその関連技術を国際学会「ISSCC」で発表すると予告した。2018年2月12日~14日に開催されたISSCCでSamsungは、Z-SSDのコントローラ技術を講演で説明するとともに、併設のミニ展示会でZ-SSDをデモンストレーションした。

Z-SSD製品「SZ985」のおもな仕様 ※Samsungが発行した同製品のカタログから
Z-SSDの外観と概要。バッファとして1.5GBのLPDDR4 SDRAMを搭載している ※ISSCC 2018でSamsungが講演したスライドから
国際学会ISSCC2018のミニ展示会に出品されたZ-SSD(右側の黄色い付箋紙が貼ってあるボード)。実動デモで、従来のSSDと比べて読み出し遅延時間が短いことをアピールしていた ※2018年2月13日午後5時30分ころ(米国太平洋時間)筆者撮影

読み出しアクセスが極めて高速な「Z-NAND」技術

 ISSCCの講演で、SamsungはZ-SSDの中核技術であるZ-NAND技術の一部を明らかにした。

 Z-NANDは、ワード線積層数が48層の3D NANDフラッシュ技術によって、シリコンダイ当たり64Gbitの記憶容量を実現している。

 同じ48層の3D NANDフラッシュ技術とTLC(3bit/セル)方式の組み合わせ(従来技術)では、シリコンダイ当たりで256Gbitの記憶容量を実現しているので、Z-NAND技術では記憶容量が4分の1に減っていることが分かる。

 そしてZ-NAND技術では、メモリセルアレイのアクセスが速い。メモリセルアレイと入出力バッファの間の遅延時間(レイテンシ)で比較すると、48層の従来技術は読み出し動作時に45μs、書き込み動作時に660μsであるのに対し、同じ48層のZ-NANDは、レイテンシが読み出し動作時にわずか3μsと15分の1に、書き込み動作時に100μsと6分の1以下に短くなっている。

従来の3D NANDフラッシュ技術(Samsungが開発してきたV-NAND技術)とZ-NAND技術の比較。tRは読み出しレイテンシ(メモリセルアレイからデータを出力バッファに転送するまでの時間)、tPROGは書き込みレイテンシ(入力バッファのデータをメモリセルアレイに書き込むまでの時間)である ※ISSCC 2018でSamsungが発表した論文から

 これらのことから、過去に外部から指摘されていた、Z-NAND技術はV-NAND技術のSLC(1bit/セル)バージョンである、ということはほぼ間違いないと見られる。ただしSamsungは、V-NAND技術がSLC技術であるとは公式には述べていない(明言を避けている)ので、注意されたい。

 ここで浮かぶ素朴な疑問は、なぜZ-NANDの記憶容量は原理的にはV-NANDの3分の1であるにも関わらず、実際の容量は4分の1とさらに小さくなっているかだ。

 この食い違いには、いくつかの理由が考えられる。

 最も単純な説明は、Z-NANDはメモリセルアレイがV-NANDに比べて小さくなって64Gbitになっている、つまり、シリコンダイが小さいというものだ。Samsungはシリコンダイ面積を公表していないので、この可能性は残る。

 ただし、シリコンダイ全体を再設計して製造するとなると、かなりのコスト増加が避けられない。また64Gbitギリギリに近い物理アレイだと、誤り訂正(ECC)機能の内蔵が必要になってくる。ECCは速度を損なうので、あまり良い手法とは言えない。

 もう1つの説明は、メモリセルアレイの設計は共用しているが、周辺回路は設計を変更しているというものだ。

 Z-NANDのもう1つの特徴に、ページサイズが4分の1(4KB)あるいは8分の1(2KB)と小さいことがある。周辺回路を変更しないと、これは実現できない。そして、物理的には256Gbitの3分の1に相当する容量の85Gbitを搭載しているものの、その中で64Gbitだけを実際に使う、という手法である。

 64Gbitだけを使うと、不良ビットを排除することと、性能の高いビット(具体的には性能の高いページ)だけを選別するという、2つの効果が見込める。ECCを内蔵せずに済むので、性能の劣化が起きないという利点もある。筆者は、こちらの可能性が高いと考える。

SSDの読み出し遅延時間を5分の1に短縮

 SamsungはISSCCの講演で、SSDの読み出し遅延時間を構成する要素を6つに分類し、そのなかでNANDフラッシュメモリが関連する要素の比率が大きいことを示した。

 6つの要素とは、ホストがコマンドを発行してコントローラに伝えるまでの時間、コントローラでアドレスを変換する時間、コントローラがNANDフラッシュメモリにコマンドを伝えて、メモリセルアレイに読み出しをかけるまでの時間、コマンドを受け取ったNANDフラッシュメモリがメモリセルアレイからデータを出力して、コントローラが受け取るまでの時間、受け取ったデータをコントローラが検証するための時間、コントローラがホストにデータを転送する時間である。

 PM963の場合、ホストとコントローラがデータをやり取りするために必要な時間が8.5μs、コントローラ内部でデータを処理する時間が15μsであるのに対し、コントローラがNANDフラッシュメモリとデータをやり取りするために必要な時間は53μsと大きい。読み出し遅延時間は合計で76.5μであり、その約7割を占める。

 NANDフラッシュメモリとコントローラでデータをやり取りするために必要な時間(tMedia)は、メモリセルアレイからページデータ(4kBのデータ)を出力バッファに読み出すための時間(tR)と、出力バッファからデータをコントローラまで転送する時間(tDMA)にわけられる。大きな割り合いを占めるのはtRで、「PM963」SSDの場合は45μsに達する。またtDMAは8μsである。

 高速SSD技術のZ-SSDでは、専用NANDフラッシュ技術のZ-NANDによって、tRを3μsと大幅に短縮した。さらに、tDMAを4μsと半分に縮めることで、tMediaを7μsと7分の1以下に低減した。具体的には4kBの読み出しを2kBずつの2チャンネルで並行して読み出すことで、tDMAを2分の1に短くしている。

 加えて、ホストとのやり取りおよびコントローラ内部の処理を短くすることで、全体の読み出し遅延時間を15.9μsと約5分の1に短縮した。

SSDにおける読み出し遅延時間(Total Read Latency)の比較。上は従来のSSD製品「PM963」の場合。下はZ-SSDの場合 ※国際学会ISSCC 2018でSamsungが講演したスライドから
開発したZ-SSD用コントローラのシリコンダイ写真。製造プロセスはFinFET。加工寸法やシリコンダイ寸法などは公表していない ※同上

ベンチマークでZ-SSDの優位性を強調

 このほかISSCCの講演では、いくつかのベンチマークを使ってZ-SSDの優位性を強調していた。

 総合性能は「PCMark 8」のストレージ関連の結果を示した。エンタープライズのアプリケーションでは、データベース性能を「PostgreSQL TPC-C」(データベース管理システム)と「RocksDB」(キーバリューストア)、キャッシング性能を「Fatcache Twemperf」、リアルタイム分析の性能を「PageRank」によってそれぞれ、数値を比較した。

「PCMark 8」ベンチマークの結果。左が従来のSSD、中央は相変化メモリ(PRAM)使って試作したSSD(非売品)、右がZ-SSD ※ISSCC 2018でSamsungが講演したスライドから
エンタープライズ向けアプリケーションの性能ベンチマーク結果。左上がデータベース管理システム(DBMS)、右上がキーバリューストア、左下がキャッシング、右下がリアルタイム分析である。いずれも左が従来のSSD、中央は相変化メモリを使って試作したSSD、右がZ-SSD ※同上

Optane SSDとZ-SSDは基本性能がほぼ同じ

 Samsungが開発したZ-SSDと競合するのは、Intelの高速SSD「Optane SSD」だろう。

 エンタープライズ向けのOptane SSD製品「DC P4800X」と、Z-SSD製品「SZ985」を比較すると、そのことがよく分かる。基本性能が非常に似通っているのだ。

Optane SSDとZ-SSDの比較 ※IntelとSamsungの公表資料を基に筆者がまとめたもの

 もちろん、細かな違いはある。Optaneは読み出しと書き込みに性能差がないのに対し、Z-SSDは読み出しが速く、書き込みがやや遅い。

 さらには、Z-SSDの書き込みレイテンシが16μsという数値は、やや不可解である。なぜならば、ISSCCでSamsungは、Z-NANDの内部における書き込みレイテンシが100μsだと説明しているのだ。100μsが間違いでないのであれば、Z-SSDの書き込みレイテンシ16μsは明らかにおかしい。この矛盾の理由は、今のところ、不明だ。

 いずれにせよ、Optaneのほかに高速なSSD製品が登場してきたのは、良いことである。Z-SSDには、コンシューマ向けへの展開を期待したい。