プロセッサやメモリなどの半導体チップが放射線を浴びると誤動作したり、故障したりすることは、少なからず知られている。米国で開催されている半導体チップの信頼性に関する国際学会「IRPS」や、放射線影響や放射線対策などに関する国際学会「NSREC」などでは毎年、放射線に起因する半導体の不具合や放射線対策技術などの最新報告が公表されてきた。前者は春、後者は夏の開催である。また欧州では毎年秋に、放射線が電子デバイスに与える影響を議論する国際学会「RADECS(RADiation and its Effects on Components and Systems)」が開催されてきた。このほかにも、より専門化した学会やワークショップなどが欧米では催されている。
これに対して日本国内では、放射線が半導体チップに与える影響や半導体ソフトエラーをテーマに公に議論するイベントはこれまで、ほとんど開催されてこなかった。この閉塞的な状況が最近になって少しずつ、打開されつつある。
昨年(2011年)の9月7~8日には「ソフトエラー(などのLSIにおける放射線効果)に関する第1回勉強会」と称するイベントが、京都工芸繊維大学で開催された。記者の知るかぎり、このようなイベントが国内で公に催されたのは初めてである。ただし、このイベントは発表内容を非公開と位置づけていた。
そして今年(2012年)の2月14日には、宇宙用半導体デバイスの開発企業であるHIRECが、「第1回半導体デバイスの放射線照射効果研究会」と称するイベントを主催した。HIRECはこのイベントを2012年の1月17日に同社のホームページで告知した。当初は100名前後の参加を見込んでいたが申し込みが殺到し、開催の約2週間前に相当する1月30日をもって受け付けを締め切ることになった。最終的に参加者は、200名を超す規模に膨れ上がった。参加料が無料とはいえ、大盛況といえる。会場となった東京・御茶ノ水の日本大学理工学部1号館の教室は、立ち見が出るほどだった。
記者は幸い、本イベントを取材し、なおかつ、非常に興味深かった講演の一部については講演スライドを公表する許可を得た。そこで本レポートでは、これらの講演の概要をご紹介する。繰り返しになるが、掲載するスライドは主催者であるHIRECと講演者のご厚意によって許可を得たものであることをお断りしておく。
●放射線の種類と物質との作用まずご紹介するのは、日本大学理工学部教授の高橋芳浩氏による講演である。「半導体デバイスの宇宙放射線効果基礎」と題するチュートリアル講演で、初心者にはきわめて有益であり、中堅技術者にとっても復習の意味で役に立つ内容だった。
高橋教授はまず、放射線にはどのようなものがあるかを説明した。放射線は大別すると、プラスまたはマイナスの電荷を有する荷電粒子線と、電荷を持たない非荷電粒子線に分かれる。荷電粒子線には電子(ベータ線)、陽電子、陽子(プロトン)、ヘリウムイオン(アルファ線)、重イオンがある。非荷電粒子線には電磁放射線(X線とガンマ線)、中性子線がある。
これらの放射線が物質(大気を含む、あらゆる気体、液体、固体)に入射すると、物質にエネルギーを与えながら進行する。放射線が物質にエネルギーをすべて与えると、放射線の進行が止まる。これが遮へいである。アルファ線と重イオン線は紙1枚で遮へいできるし、ベータ線はアルミニウムなどの薄い金属板で遮へいできる。これがガンマ線になると鉛板や厚い鉄板が遮へいに必要となり、中性子線に至っては鉄板を通過し、遮へいには水槽やコンクリートなどが使われるようになる。
放射線の種類 | 各種放射線を遮へいする物質 |
放射線は物質にエネルギーを与えながら進行することから、放射線が進む距離と失うエネルギーの関係を示す数値がきわめて重要である。この指標は「線エネルギー付与(LET:Linear Energy Transfer)」と呼ばれている。読み方は「エルイーティー」である。
LETの単位には、単位距離・単位密度当たりのエネルギー付与と、単位距離当たりのエネルギー付与がある。前者の単位は物質の種類に大きく依存しない値で、物質の種類が決まると後者の単位が使われる。
荷電粒子のビームが物質に入射した場合を考えると、荷電粒子は入射直後からエネルギーを失いながら少しずつ速度を下げていく。そしてある地点まで深く進行すると、急激にエネルギーを失い、進行を止める。このためLETは物質内の浅いところでは低く、深くなるにつれてあるところで急激に増加し、ピークを迎えてから急激に減少してゼロになる。このピークを「ブラッグピーク(Bragg Peak)」と呼ぶ。ブラッグピーク付近で荷電粒子の数は急速に減少する。
線エネルギー付与(LET:Linear Energy Transfer) | 荷電粒子の物質内進行によるLETの変化と粒子数の変化 |
●半導体チップの劣化と誤動作
放射線が半導体チップに入射した場合は、大きく分けると2つの変化が起こる。1つは「電離効果」であり、具体的には電子・正孔対の生成である。電離効果によって半導体チップはじわじわと劣化していく。あるいは、一時的な誤動作を起こす。前者はハードエラー(恒久的な故障)、後者はソフトエラー(一時的な故障)となる。もう1つは「変位損傷」であり、具体的には結晶欠陥の生成である。変位損傷によって半導体チップは特性が劣化する。
電離効果による作用は、より具体的には2つある。1つは「トータル・イオン・ドーズ(TID:Total Ionizing Dose)効果」あるいは「トータルドーズ効果」と呼ばれる作用で、半導体チップ内の絶縁膜中に電荷が蓄積されることによって電気的な特性が劣化していく。電気的特性の劣化は、先に説明したハードエラーを引き起こす原因となる。もう1つは「シングルイベント効果(SEE:Single Event Effect)」と呼ばれる作用で、半導体チップ内の半導体で電流が発生し、動作不良や誤動作などを引き起こす。この作用は、先に説明したソフトエラーを発生させる原因となる。
放射線が半導体に及ぼす影響 | 放射線による電離効果が半導体チップに与える作用 | 電離効果は絶縁体中での電荷蓄積と、半導体中での電流発生をもたらす |
フィールド酸化膜の電荷捕獲による影響 |
トータルドーズ効果は絶縁膜、より具体的にはゲート絶縁膜中に電荷が蓄積することによる、MOSトランジスタのしきい電圧(MOSトランジスタがオフからオンに変化するゲート電圧)の変化をもたらす。ただし最近の最先端チップはゲート絶縁膜がきわめて薄くなっている。このためゲート絶縁膜よりもフィールド絶縁膜(隣接するトランジスタを電気的に分離する絶縁膜)での電荷蓄積が相対的には大きな問題になってくると、高橋教授は指摘していた。
これに対してシングルイベント効果は、回路によって不具合のモードが違う。SRAMセルでは記憶データの反転が起こる。これは「シングルイベント・アップセット(SEU:Single Event Upset)」と呼ばれている。CMOSインバータ回路では過渡的な電圧変化が起こったり、ラッチアップが発生したりする。前者は「シングルイベント・トランジエント(SEE:Single Event Transient)」、後者は「シングルイベント・ラッチアップ(SEL:Single Event Latch up)」と呼ばれている。
半導体チップは微細化により、データを保持する電荷量が減少する。このため、不具合を引き起こすLETの値が下がる、すなわち放射線に弱くなる。これを高橋教授は、プール(データの電荷量)に石(荷電粒子)を手で投げた場合と、ビーカーに石を投げた場合の違いにたとえていた。プールはさざ波が立つ程度だが、ビーカーだと水が溢れてしまうし、場合によってはビーカーそのものが割れてしまう。
また最近の最先端チップではトランジスタの寸法がきわめて小さくなっているので、放射線が誘起する電荷が複数のメモリセルで収集されるようになってきた。このため、同時に複数のメモリセルのデータが反転する「マルチセルアップセット(MCU:Multi Cell Upset)」が発生していると述べていた。
●放射線の粒子が原子核に衝突もう1つの重要な作用である「変位損傷(DDD:Displacement Damage Dose)」効果は、高いエネルギーを有するイオンや中性子などが、原子核に衝突して原子核をはじき出すことで起こる。このはじき出しを「ノックオン(Knock on)」と呼ぶ。電気的ではなく、物理的な作用となる。
変位損傷は半導体デバイスの特性劣化を引き起こす。発光デバイスや太陽電池、バイポーラ素子などで劣化が起こる。MOSデバイスであるプロセッサやメモリなどでは、どちらかというと起こりにくい作用である。
なお変位損傷にも荷電粒子のLETに相当する指標がある。「非イオン化エネルギー損失(NIEL:Non-Ionizing Energy Loss)」と呼ばれており、単位密度・単位長さ(進行距離)当たりの非イオン化によるエネルギー損失と定義されている。読み方は「ニール」である。
変位損傷の概要。さまざまな結晶欠陥が発生する | 変位損傷による半導体デバイスの特性変化 | 非イオン化エネルギー損失(NIEL) |
●宇宙から地上に届く、さまざまな放射線
次にご紹介するのは、日立製作所横浜研究所の伊部英史氏による講演である。「自然界の中性子線に起因する半導体デバイスのシングルイベント」と題する講演で、中性子線を含めた宇宙から降り注ぐ放射線全般を解説するとともに、最近の半導体チップで起こりつつある(あるいは懸念される)ソフトエラーの不良モードを報告した。
放射線がシステムに入射してから障害に至るまで |
まず基本的な事柄だが、放射線が半導体チップに入射しても、すぐにシステムが障害を発生するわけではない。いくつかの段階を経て、障害に至る。言い換えると、障害の手前で止まることが少なくない。伊部氏は、放射線の入射からシステム障害に至るまでの経緯を階層化して示した。
始めに起こるのは、「フォールト(Fault)」である。これは過渡的な電圧変動であったり、スパイク雑音の発生であったりする。どのような影響を回路に与えるかは不明確であり、検出はきわめて難しい。次にフォールトの一部が「エラー(Error)」へと進む。これは明確な不良であり、SRAMやロジックなどのデータ反転に相当する。エラーは誤り検出・訂正回路(ECC回路)で検出し、修復できる。しかしエラーの一部には、修復できずにシステムの誤作動へと至るものがある。これが「障害(Failure)」である。こうなるとシステムの再起動や再実行、リコンフィギュレーションなどが必要となる。
宇宙から地上に降り注ぐ放射線には主に、中性子、陽子、電子、ミュー中間子(ミュー粒子)がある。いずれも半導体チップに突入すると、フォールトを発生する恐れがある。伊部氏はそのメカニズムを解説してくれた。
高エネルギーの中性子や陽子などが半導体のシリコンダイに突入すると、シリコンの原子核と衝突し、原子核を「励起核」と呼ばれるエネルギーの高い状態に変化させる。励起核はさまざまな種類のイオンを放出してエネルギーを失う。このとき放出されるイオン(2次イオン)には、水素やヘリウム、リチウムといった軽いイオンもあれば、マグネシウムやアルミニウム、ナトリウムといった重いイオンもある。これらの2次イオンがフォールトを起こす。
●CMOSデバイスのウイークポイント
ところで、プロセッサやメモリ、ロジックなどのデジタル半導体チップのほとんどは、CMOS技術で製造されている。CMOS製造技術の特徴の1つに、「ウエル」と呼ばれるn型半導体あるいはp型半導体で形成したバスタブあるいは井戸のような領域がある。イオン(アルファ線を含む)や電子(ベータ線)、ミュー粒子(マイナスの電荷を有する)などの荷電粒子は、このウエル領域で電荷を発生させる。発生した電荷がドレインに流入するとトランジスタの動作がおかしくなり、フォールトを発生する。ウエル内に大量の正孔が発生するとウエルの電位が上昇し、寄生バイポーラトランジスタ(例えばn型ドレインとp型ウエル、さらにその外側のn型ウエルでnpnバイポーラを形成する)をオンさせ、フォールトを起こす。
宇宙から地上(海面高度)に降ってくる放射線の種類とエネルギー、量(フラックス) | 宇宙から降ってきた高エネルギー粒子がシリコン原子核に衝突して2次イオンを放出する。この反応は「核破砕反応」と呼ばれる |
シリコン原子核から放出される2次イオンの種類とそのエネルギー | 荷電粒子がフォールトを発生させるメカニズム |
●微細化がソフトエラー耐性を弱める
ここで問題となるのは、微細化が進めば進むほど、同時にフォールトするノードが増え、同時にエラーとなる論理ノードやメモリセルが増加することである。微細化によってメモリセルは小さくなるので、記憶容量当たりでみるとエラーの発生率は下がる。しかし半導体チップの記憶容量やゲート数が増えるので、半導体チップ当たりのエラー発生率は微細化とともに上昇する。
伊部氏らの研究チームがSRAMのソフトエラーをシミュレーションした結果によると、半導体チップ当たりのソフトエラー発生率は130nm世代と比べると22nm世代では約7倍に増加する。またソフトエラーにしめるマルチビットエラーの比率は130nm世代では10%だったのが、22nm世代では50%に高まる。
さらに、ビット換算でエラーが発生する領域が、微細化とともに急速に広がっていく。58,000回と非常に数多くの核破砕を起こしたシミュレーションでは、130nm世代では100bit×100bitの領域にソフトエラー発生箇所が散らばっていた。これが22nm世代では、およそ1,000bit×1,000bitの領域に広がってしまう。
微細化がSRAMソフトエラーに与える影響 |
●解決済みだったはずの不良モードが蘇る
また恐ろしいのは、解決済みと思われていた不良モードのソフトエラーが再び、問題となってきていることである。例えばアルファ線ソフトエラーは、半導体チップにアルファ線への耐性を持たせることで終結したと考えられていた。具体的には、蓄積電荷量を確保することでアルファ線の耐性を高めていた。しかし最近では、微細化が進んだことで蓄積電荷量の確保が難しくなり、アルファ線に弱くなりつつある。
熱中性子線によるソフトエラー問題も再燃している。2000年ころに、平坦化プロセスでボロン(B)の材料を使っていたことから、中性子線とボロンが反応してアルファ線とリチウムイオンを発生させ、ソフトエラーを引き起こしていることが明らかになった。しかし平坦化プロセスがCMP(Chemical Mechanical Polishing)技術に換わったことでボロン入りの材料が使われなくなり、この問題は解決したと思われていた。実際130nm以降の世代では平坦化にCMPを採用したため、この問題は起こらなくなった。
ところが最近になって、ボロン入り材料を平坦化プロセスに使っていないのに熱中性子線でソフトエラーを起こすSRAMの存在が指摘されるようになった。金属配線や金属プラグなどのエッチング用ガスやCVD用ガスにボロンを含む材料が使われ、金属配線や金属プラグなどにボロンが混入したことが原因だと推定されている。
微細化でアルファ線ソフトエラーが再び問題になってきた | 熱中性子線によるソフトエラー問題の経緯。エッチングやCVDなどでボロン入りのガスが使われたことで、再び問題となってきた |
●現状の誤り訂正技術では対処できない
SRAMメモリセルアレイのレイアウトとソフトエラーの発生箇所(シミュレーション) |
このほか、SRAMの寄生バイポーラによるマルチビットエラーが微細化によって深刻になると伊部氏は指摘した。従来は1bitあるいは2bitの不良だったのが、130nm以降の世代では7bitものビットがほぼ同時に反転するモードが出現する恐れがある。現状の誤り訂正回路は、高信頼性仕様のマイクロプロセッサのSRAMキャッシュで2bit誤りの訂正と3bit誤りの検出がせいぜいである。7bitもの誤りには対処できない。システム障害を避けるには、別の工夫が必要となる
半導体チップは微細化により、基本的には放射線に弱くなっていく。宇宙からの放射線はかつては宇宙空間や航空高度などでの問題であり、地上での問題ではなかった。しかしすでに、宇宙からの放射線は地上の問題となりつつある。その代表が中性子線だ。このほかミュー粒子が、最先端チップに影響を与えている可能性がある。
また過去に発見して解決済みと考えられていた不良モードが、製造プロセスの変化で再び、現れるようになっている。研究会後に催された懇親会で、日本大学の高橋教授は「10年前には想像もしなかった現象が、現在では起こっている。10年後にどのような現象が起こるのかは想像もつかない」と述べていた。
倒しても倒しても、ソフトエラーという名前のゾンビやモンスターは蘇り、半導体を襲ってくる。一人称視点のシューティングゲームにおける「ナイトメア(悪夢)・モード」のようだ。ゲームと現実が大きく違うのは、現実には「イージー・モード」が存在しないことだろう。
伊部氏の講演のまとめスライド(1) | 伊部氏の講演のまとめスライド(2) |
(2012年 2月 20日)
[Reported by 福田 昭]