【Flash Memory Summit 2012】【SSD編】
安易なSSD導入がもたらす「猛毒」の正体

Flash Memory Summitの参加者登録受け付け所

会期:8月21〜23日(現地時間)
会場:米国カリフォルニア州サンタクララ
   Santa Clara Convention Center



 「Flash Memory Summit(フラッシュメモリサミット)」はフラッシュメモリとその応用に関するイベントである。フラッシュメモリの応用製品にはSSDやUSBメモリ、SDカード、組み込みストレージなどが存在するのだが、Flash Memory Summitでは特にSSD応用に関する議論が活発である。それも、クライアントSSDよりもエンタープライズSSDに対する関心が異様に高い。言い換えると、フラッシュメモリの応用分野で最先端を走っているのが、エンタープライズSSDなのである。

 エンタープライズSSDが注目される背景には、エンタープライズ向けストレージの市場が急速に伸びており、今後も成長すると予測されていることがある。それも、サーバーと対をなす従来のストレージではなく、ネットワークの向こう側にあるクラウドデータセンターのストレージ用途で大きな伸びが期待されている。

 エンタープライズ向けストレージは、入出力速度(IOPS)と遅延時間(レイテンシ)、記憶容量の違いによって複数の階層(Tier:ティア)に分かれている。IOPSが最も高く、レイテンシが最も短い最高性能の階層が「ティア0」である。エンタープライズSSDが登場する以前は、15,000rpmといった高回転型のエンタープライズHDDがティア0を担ってきた。

●クライアントSSDでもエンタープライズHDDよりも高性能

 このティア0階層において、SSDは圧倒的な性能差によってHDDから市場を奪い始めた。ハイエンドのエンタープライズSSDはもちろんのこと、ローエンドのクライアントSSDでもエンタープライズHDDに勝てるのだ。Flash Memory Summitの講演では、15,000rpmのSAS HDDとクライアントSSD(MLCタイプのNANDフラッシュメモリを使用)を比較し、SSDでは平均レイテンシが6.5分の1に減少するとともにIOPSが21倍に向上するとのベンチマーク結果が示されていた。

 そこで高価なエンタープライズSSDではなく、安価なクライアントSSDをエンタープライズ向けに導入する事例が起きており、場合によっては重大なトラブルを招いている。

 例えばクライアントSSDを4台ほど導入し、エンタープライズHDD4台と置き換えたとしよう。1台はCドライブでOSを格納し、3台はDドライブ(RAID 5)でログファイルの保存に使う。小規模なデータセンターでこのような置き換えを実行すると、入出力性能は大幅に高まり、ストレージが占有する体積は変わらない。将来の負荷増大に対して十分な備えができたように見える。

【お詫びと訂正】 初出時に1台はCドライブをRAID 0構成としておりました。これは講演スライドの記述をそのまま表記したものですが、1台でRAID 0はおかしいとの指摘を受け、RAID 0の表記を削除しました。

15,000rpmのSAS HDDとクライアントSSD(MLCタイプのNANDフラッシュメモリを使用)のベンチマーク結果。SSDベンダーであるSmart Storage Systemsの講演スライドより 小規模データセンターのサーバー構築例。Smart Storage Systemsの講演スライドより

●クライアントSSDに対する誤解

 ところが、1年を経過せずしてこのSSD導入は破綻する。SSDの書き換え寿命が尽きてしまうからだ。より厳密には、SSDが内蔵するMLCタイプのNANDフラッシュメモリが寿命に達してしまう。NANDフラッシュメモリのユーザーにとっては常識なのだが、SSDを導入するユーザーにとっては常識ではない。HDDには「書き換え寿命(Endurance:エンデュランス)」という概念は存在しないからだ。

SSDにはどのタイプのNANDフラッシュが最も適しているか。市場調査会社のIT Brand PulseがSSDのバイヤー(購入層)を調査した結果

 米国の市場調査会社がSSDの購入層を調査した結果によると、SSDにはどのタイプのNANDフラッシュが最も適しているかとの質問に対し、「知らない」を選択した者の割合は39.5%で最大多数を占めている。ちなみに、高性能と長寿命からSLCタイプが最適との回答は34.8%、低コストからMLCタイプが最適との回答が24.9%である。

 この調査結果から、SSD購入層の約4割はSLCタイプとMLCタイプの区別がついていないということが分かる。市場価格が低いのはもちろんMLCタイプのSSDなので、このグループの大半はMLCタイプのSSDを購入するだろう。

 MLCタイプのNANDフラッシュメモリを搭載したクライアントSSDをデータセンターに導入するとどうなるか。データセンターのサーバーはいろいろなタイプのアプリケーションを処理する。問題になるのは、アプリケーションによって読み出し(出力)と書き込み(入力)の比率が違うことと、データセンターサーバーは24時間365日間ノンストップで稼働することだ。クライアントSSDは基本的にはノンストップでの稼働を想定していない。このため、使うアプリケーションによっては、相当に短い期間でSSDの寿命が尽きてしまう。

240GBクライアントSSDをデータセンターのアプリケーションに使用したときの寿命。Smart Storage Systemsの講演スライドより

 Flash Memory SummitでSSDベンダーが示したのは、下記のような推定である。先ほどの4台構成の240GBクライアントSSDでアプリケーション別の寿命を試算した結果だ。Webサーバーの場合は読み出しが95%、書き込みが5%で読み出しが主体である。SSDの寿命は1.6年。書き込みの割合が5%とわずかでも、ドライブの寿命は1.6年であり、これはアプリケーションとしては寿命が相当に長い部類に入る。次にExchangeサーバーの場合である。読み出しの割合が67%、書き込みの割合が33%で、寿命は0.3年に過ぎない。4カ月も持たないことになる。最悪なのはSQLロギングで、100%が書き込み動作だ。なんと0.08年、わずか1カ月でドライブの交換が必要となる。

●平均故障間隔(MTBF)100万時間の白い嘘

 これらの寿命は一例であり、ケースバイケースで長くなったり短くなったりする。それよりも問題なのは「クライアントSSDのほとんどは製品仕様として寿命を明記していない」ことだろう。クライアントSSDの書き換え寿命は、ユーザーからは見えないのだ。つまり、使い方によっては、かなりの短い期間で製品の寿命がきてしまう、ということを意味する。

 それでは、クライアントSSDの製品仕様にしばしば見られる「平均故障間隔(MTBF)が100万時間」の表記はどのように解釈すればよいのだろうか。100万時間といえば、100年以上に換算する長さである。つまり平均的には100年間故障しないはずだ。

 その通りである。100年間故障しない。あるいは平均すると100年間に1回故障する。MTBFが100万時間とはその意味で正しい。ただし、MTBFは信頼性工学の用語で「偶発故障期間」だけに通用する指標である。つまり、SSDが正常に稼働している期間だけに通用する指標なのだ。SSDの書き換え寿命が尽き始める期間、信頼性工学の用語で「磨耗故障期間」と呼ぶ期間には、MTBFはもはや通用しない。

●エンタープライズSSDが規定する書き換え寿命
クライアントSSD(コンシューマSSD)とエンタープライズSSDの違い。STECの講演スライドより

 クライアントSSDとエンタープライズSSDでは、想定している用途が根本的に違う。クライアントSSDは1日の中で数時間だけ稼働し、書き込むデータの量もドライブ全体に比べるとわずかな割合である。スマートフォンやメディアタブレット、コンシューマ用ノートPCなどがクライアントSSDの適用領域だ。

 これに対してエンタープライズSSDは、24時間365日間ノンストップで稼働する。アプリケーションによっては、1日の間に1台のドライブ全体を何回も書き換えてしまうような膨大なデータを書き込む。OLTP(オンライントランザクション処理)やExchangeサーバー、Webサーバー、ロギング、データウエアハウスなどのアプリケーションでストレージの役目を果たす。

 そして何より、エンタープライズSSDの製品仕様には書き換え寿命が明記してある。「PBW(Peta Byte Write)」という指標で、どのくらいのデータ量を累積で書き込めるかを表す。例えば1PBWとあれば、1PB(1,000TB)のデータを累積で書き込める。東芝が2012年8月に発表したエンタープライズSSDの新製品「PX02AMF020」の仕様がちょうど1PBWで、「総書き換えデータ量」と表記されている。「PX02AMF020」の記憶容量は200GB(0.2TB)なので、ドライブ全体を5,000回ほど書き換えられることになる。

●エンタープライズSSD向けのNANDフラッシュ
NANDフラッシュメモリのタイプによる書き換え可能回数とコストの違い。Smart Storage Systemsの講演スライドより

 SSDの書き換え寿命とコストを大きく左右するのは、NANDフラッシュメモリである。SSDが搭載するNANDフラッシュメモリには大別するとSLC、MLC、eMLCの3つのタイプが存在する。

 SLC NANDフラッシュは1個のメモリセルに1bitを記憶するタイプであり、書き換え寿命が長い。シリコンダイでの書き換え可能回数は10万回に達する。ただし記憶容量当たりの価格は3つのタイプの中で最も高い。MLCタイプのおよそ3倍である。

 MLC NANDフラッシュは1個のメモリセルに2bit(あるいはそれ以上)を記憶するタイプであり、物理的にSLCタイプと同じシリコンダイで2倍の記憶容量を実現する。実際の価格差はもっと大きく、SLCタイプの3分の1くらいになる。ただし書き換え寿命はSLCタイプに比べると大幅に短い。書き換え可能回数は3,000回しかない。

 MLCタイプをエンタープライズSSDに使うのはかなり厳しいということで開発されたのが、eMLCタイプである。MLCタイプの書き換え可能回数を3万回に延ばしたNANDフラッシュで、記憶容量当たりの価格はMLCタイプの1.3倍とそれほど高くない。コストと寿命のバランスが良いことから、エンタープライズSSDにはかなり普及している。

●コントローラ技術で書き換え寿命を延ばす
NANDフラッシュメモリのタイプとアプリケーション。黄色がMLCタイプ、青色がeMLCタイプ、赤色がSLCタイプ。Smart Storage Systemsの講演スライドより

 エンタープライズSSDに載るNANDフラッシュのタイプをアプリケーションで区分けすると、書き込み主体のアプリケーションがSLCタイプ、読み書きが混在するアプリケーションがeMLCタイプ、読み出し主体のアプリケーションがMLCタイプとなる。

 コストを考えると、SLCタイプのSSDとeMLCタイプのSSDには、まだかなりの開きがある。そこでSSDベンダーは、MLCタイプあるいはeMLCタイプをベースに、NANDフラッシュ技術とコントローラ技術を組み合わせて開発することで、これまでSLCタイプがカバーしていた領域を低コストのMLCタイプSSDで置き換えようとしている。

 例えばSSDベンダーのSmart Storage Systemsは「EE:Endurance Enhanced」と呼ぶ技術によって書き換え可能回数が4万回を超えるNANDフラッシュを開発している。SSDベンダーのSTECも、同様の技術を開発中だ。MLCタイプに長寿命化技術を導入することで、eMLCタイプSSDの3倍を超える総書き換え容量を実現する。

 エンタープライズSSDは登場し始めたころ、MLCタイプの適用は困難だとされていた。SLCタイプのNANDフラッシュメモリだけがエンタープライズ用途に使えると考えられていた。それがコントローラ技術の開発とeMLCタイプの開発により、現在ではエンタープライズSSDにMLCタイプとeMLCタイプを搭載することが当たり前になっている。それはコスト低減の要求に応え続けてきた結果でもある。今後のSSDでは、コントローラ技術がますます重要になる。

MLCタイプでSLCタイプに近い書き換え可能回数を実現する「MLC Endurance Enhanced」。Smart Storage Systemsの講演スライドより MLCタイプSSDとSLCタイプSSDのギャップを埋める長寿命SSD。STECの講演スライドより NANDフラッシュのタイプによるSSDの総書き換え容量の違い。右端は長寿命化技術(Secret Souce)を導入したMLCタイプのSSD。STECの講演スライドより

(2012年 9月 6日)

[Reported by 福田 昭]