[an error occurred while processing the directive]

IRPSレポート

IBMがSRAM/DRAM不良の事例を公表

会期:3月26日~30日(現地時間)

会場:米San Jose McEnery Convention Center



 IRPS(International Reliability Physics Symposium)現地レポートの続きである。中日である3月29日(現地時間)には興味深い発表が多かった。ここでは前回のレポートで書ききれなかった講演を紹介しよう。

●同じボードにSRAMを2個搭載、その後1個だけに不良が発生

 半導体ユーザーである電子機器メーカーにとって、半導体デバイスの不良原因を突き止めることは手間のかかる作業である。不良解析では高い技術力を有するとされているIBMですら、例外ではない。今回のIRPSでは、IBMがSRAMとDRAMの不良を解析した事例を公表した(招待講演、講演番号3E.1)。

 公表した事例では、不良の原因はいずれもホットキャリアだった。ホットキャリアとは、MOSトランジスタの内部で高電界によってエネルギーを得たキャリア(電子あるいは正孔)を指す。ホットキャリアがゲート絶縁膜に飛び込むと、しきい電圧が変動し、MOSトランジスタの性能を劣化させたり、誤動作させたりすることがある。ホットキャリアは半導体ベンダーにとっては周知の現象であり、通常は起こらないと考えがちだ。にも関わらず、現在でもホットキャリア不良が起こっていることにIBMは注意を促した。

 さらに不良の原因を突き止める過程の複雑さを、IBMは説明した。まず、IBMが購入したSRAMの事例について解説した。

 不良が発生したSRAMは、製造技術としては枯れている0.35μm技術で製造したチップである。SRAMは、光ファイバ送受信用アダプタカードの両面に1個ずつ、合計2個搭載されていた。表面のSRAMはデータの管理用、裏面のSRAMはデータの出力用である。このアダプタカードは、2002年~2004年の間に10万を超えるシステムで導入された。

 アダプタカードで最初の不良が発生したのは、2004年夏のことである。調べると裏面のSRAMで不良が起きていた。IBMは、不良が起きたSRAMをアダプタカードから取り外し、SRAMベンダーに送付した。ところが最初の段階では、SRAMベンダーによる電気的テストではすべて良品となってしまった。

 そうこうしている間にも、アダプタカードの不良は増えていった。一部のアダプタカードでは、SRAMが間欠的な不良を示していた。間欠的な不良(intermittent failure)とは、不良が起きたり起きなかったりする状態を指す。不良解析を妨げる、厄介な現象の1つである。この段階でIBMはSRAMのパッケージ組み立て工程に何らかの問題があると考えたりしたものの、裏付けとなる証拠は存在しなかった。そして電気的なテストから、SRAMをアダプタカードから取り外したり、高温でベーキングしたりすると不良品の多くが回復することに気付いた。そしてイオン性の汚染あるいはホットキャリアといった、電荷の移動を伴う現象を疑うようになっていった。

 SRAMベンダーは不良解析により、不良が発生した個所を突き止めたものの、物理的な異常の発見には至らなかった。ここでIBMは、アダプタカードの電源電圧を変化させることで機能不全の始まりを検出できることを見い出した。良品では電源電圧を2.7Vに下げても正常に動作するのに対し、不良品では電源電圧を3.0V以上に上げないと正常に動作しなかったのである。さらに、SRAMの内部クロック回路が2系統ある中で、1系統のクロック信号だけが弱くなっていることを突き止めた。

 このことから、IBMは正常に動く回路と動作不良の回路ではMOSトランジスタのしきい電圧が違っているのではないかと考えた。同じSRAMチップで両者のしきい電圧を測定したところ、nMOSトランジスタのしきい電圧に大きな違いが生じていた。そして摂氏125度の高温ベーキングを不良品のSRAMに対して実施したところ、時間経過とともに正常動作に必要な電源電圧が低下し、良品の値に近付いていった。これらの証拠から、ホットキャリアが原因の不良であるとIBMは推定した。

 ここで突き止めるべき課題は、アダプタカードの裏面に実装されたSRAMにだけ不良が発生し、表面のSRAMには不良が発生しなかった理由に移行した。考えられる可能性は、欠陥に起因する不具合が入り込んだ(しきい電圧が変動しやすい)製造ロットの存在か、特殊な使い方(アクセス頻度や電圧ストレスなど)によって不良が加速されたかである。

 システムレベルのテスト結果は、欠陥の入ったロットの存在を示唆していた。しかしSRAMメーカーによるすべてのテスト結果を精査しても、そのような兆候は発見できなかったのである。そして使い方では、表面のSRAMと裏面のSRAMでは、大きな違いがあった。表面のSRAMは間欠的に動作しているのに対し、裏面のSRAMは常にアクセスされていたのである。このことは、裏面のSRAMだけに不良が発生した理由の説明になっている。

 そして最後の疑問は、IBMのシステムにだけ不良が発生した理由だとした。同じSRAMを使用していたにも関わらず、ほかのシステムベンダーでは不良が発生していなかったからである。この点についてIBMは詳しく触れていない。通常では使わない、特定の動作モードでSRAMを動かしていたと述べるにとどめた。

●DRAM搭載サーバーで出荷の2~3カ月後に不良が発生

 続いてDRAMの事例をIBMは説明した。不良が発生したDRAMは、当時としては最先端の0.10μm技術で製造したDDR SDRAMである。DDR SDRAMをDIMMの形で使用した。このDIMMは、2004年~2005年にミッドレンジサーバーに装着された。

 ミッドレンジサーバーが出荷されてから2~3カ月後、不良品がIBMに戻り始めた。不良が発生していたのは特定のモデル、特定のDIMM品番、特定のDIMMスロットに集中しているように見えた。IBMはDIMMを3~4社のDRAMベンダーから購入していた。そのうち、不良品となったDRAMはすべて、DRAMベンダー1社の製品に偏っていることに気付いた。

 DRAMベンダーによる不良解析の結果、特定の動作タイミングに関連して不良が発生していることが分かった。具体的には、行プリチャージ(row precharge)時間tRPが変動していた。不良は半導体チップ(ダイ)の同じ部位、同じ行アドレスで発生していた。

 そしてSRAMのときと同様に、不良が発生していたDRAMをDIMMから取り外すと、正常に動作するようになった。そこでMOSトランジスタのしきい電圧を測定することにした。DRAMベンダーはしきい電圧を測定する技量がなかったのか、あるいはしきい電圧の測定装置を保有していなかったのか。IBMの不良解析ラボに支援を求めてきた。

 しきい電圧の測定結果はIBMの技術陣を驚かせた。良品では570mVのしきい電圧が、不良品では2.52Vと5倍近くに上昇していたのだ。この結果は、不良品では大量の電荷(キャリア)がMOSトランジスタに注入されていることを示唆する。ホットキャリアが不良の原因と推定し、電圧ストレスなどの試験でそのことを確かめた。

 DRAMの不良解析では、ホットキャリアによる寿命の推定も実施した。不良が発生するまでの期間は、最悪条件で96日だった。実際のデータでは平均すると144日であり、推定値とよく一致した。

 また特定のアドレスにアクセスが集中するような使い方があったことと、DRAMベンダーによって寿命(tRPのズレによる不良発生までの期間)の最悪値に大きな違いがあることが分かった。そこでIBMはDRAMアクセスの仕組みを変更するとともに、DRAMベンダーにはホットキャリア対策を要請した。

□国際信頼性物理シンポジウム(IRPS)のホームページ(英文)
http://www.irps.org/
□関連記事
【3月31日】ケータイ電話用フラッシュメモリの不良をNokiaが解析
http://pc.watch.impress.co.jp/docs/2006/0331/irps03.htm
【3月29日】半導体の発展を支えたIRPSの44年
http://pc.watch.impress.co.jp/docs/2006/0329/irps02.htm
【3月27日】IRPS:国際信頼性シンポジウム前日レポート
http://pc.watch.impress.co.jp/docs/2006/0327/irps01.htm

(2006年3月31日)

[Reported by 福田昭]

【PC Watchホームページ】


PC Watch編集部 pc-watch-info@impress.co.jp
お問い合わせに対して、個別にご回答はいたしません。

Copyright (c)2006 Impress Watch Corporation, an Impress Group company. All rights reserved.