トピック

RAIDデータ復旧における緊急対応の最終解答。担当者が直面する突然のデータ消失の適切な対処法とは?

~デジタルデータリカバリーが明かす

データリカバリー事業部エンジニアグループ グループ長 柳田悟氏(左)、データリカバリー事業部エンジニアグループ 研究開発チーム 薄井雅信氏(右)

 RAID機器のトラブルには、決して行なってはならない「べからず集」が存在する。行なってしまうことで何のリスクがあるのか、対処法として具体的に何をすべきなのだろうか?

 RAIDは大量のデータを保管する為に欠かせない「システム」で、複数のドライブを束ねて使用される。RAIDが採用されている機器にはいくつか種類があるが、主にデータを冗長化するような安全性確保の目的で、NASのような小規模なものからデータセンター内のサーバーに至るまで、さまざま場面で企業活動を支えている。

 ただ、24時間365日連続稼働していれば、ハードウェアの劣化が早く、どれだけ丁寧に管理していても、壊れる時にはあっさり壊れる。導入してから数年に渡って問題なく動作していたNASやサーバーのようなRAID機器が、急にエラーメッセージを吐き出したり、アクセスできなくなったりといった状態がそれだ。

 特にシステム専任者がいない中小企業で、ある日突然このような状態に陥ると、対処法が分からず、右往左往することもしばしばだ。異常が見つからずデータの読み書きができるという事実に安心してしまい、手を打たずにそのまま使い続けることも。その結果、別のドライブまで壊れてデータが一切取り出せなくなり、業務の停止やデータの損失を招くなど、取り返しのつかない最悪の事態に陥ることもある。

 今回はRAIDの復旧について、データ復旧専門業者14年連続データ復旧国内売上No.1 の専門家であるデジタルデータリカバリーに詳しく聞いた。

RAID障害において、担当者が決して行なってはならない対応とは?

社内に保管されている無数のドナー用HDD。RAIDを構成するHDDの部品交換が可能なように、約7,000台以上のHDDが奥まで並んでいる

 RAIDは複数のドライブを束ねて運用しているだけに、一般的なHDDやSSDに発生する障害と比較してもデータ復旧の難易度は高い。そのためデータ復旧の業者を名乗っていても、対応できる業者とできない業者がある。RAID機器のデータ復旧に対応できると謳っている業者であっても、実際の技術力は天と地ほどの差があるのが実情だ。

 悲惨なのは、技術力の低いデータ復旧業者に依頼してしまい、RAIDの障害が悪化するケースだ。相見積を取って費用の安い業者に依頼したものの、時間をかけても復旧できずに障害が悪化した状態で返却。別の業者に再依頼することになり、時間や費用などのコストが格段に膨れ上がり、しかも復旧できなかったとなると泣くに泣けない。

 これに近いケースに、市販の復元ソフトを用いて自力でデータ復旧作業を行なった場合や、障害が発生したドライブを交換してリビルドを行なった場合でも、意に反して障害が悪化してしまうケースは少なくない。こうしたことから、RAIDのデータ復旧に関しては自らで解決しようとせず、技術力の高いデータ復旧業者に相談するというのが一番確実だ。

デジタルデータリカバリーのデータ復旧ラボ内に設置されているクリーンルーム。内部ではHDDを開封してのデータ復旧作業が行なわれている

 デジタルデータリカバリーは、こうしたRAIDのデータ復旧に豊富な実績を持つデータ復旧業者だ。

 RAID機器に関する累計相談件数が、13,000件を超える実績がある同社は、データの解析技術はもちろん、物理的な故障が発生している機器からのデータ復旧技術、さらにドライブを動かす核であるファームウェア復旧の技術力に強みを持つ。

 同社にはデータ復旧専門のエンジニアだけで約40名が在籍しており、国内外の最新技術およびラボ内のクリーンルームといった設備を駆使し、データ復旧作業に日々当たっている。その技術力と最新設備を駆使し、復旧率最高値は95.2%を誇っている。

デジタルデータリカバリーのデータ復旧ラボ。六本木ヒルズ内に構える国内最大級のラボには、圧倒的なデータ復旧の設備が備わっている

 社内のデータ復旧ラボでデータ復旧作業を行なう事で、緊急時にもエンジニア同士での連携が可能。「依頼の80%は48時間以内に復旧完了」できるのも頼もしい。さらに、法人限定で最短即日の無料出張診断サービスを行なっているので、データセンターや社内サーバーなど、社外に持ち出すのが困難なRAID機器の出張診断が受けられるのも大きな利点だ。

 初期診断はもちろん、初期診断を依頼するかの相談から見積もりまでは無料で行なっている。まずは連絡をして、状況を把握することから始められるのも心強い。

令和6年能登半島地震で実際に復旧依頼を受けた焼け焦げたHDD

 2024年1月に発生した令和6年能登半島地震では、石川県および富山県の自治体・地元企業を対象に、災害・事故の被災者へ無償でデータ復旧支援を現地で実施し、失われると取り返しのつかない貴重なデータの復旧に貢献している。TVなどのメディアで報じられたので、ご覧になった方も多いのではないだろうか。

事例1 : 他社が3カ月かけてギブアップしたRAID障害を8日で復旧完了

 そんな同社に、他社が復旧できなかったRAID機器のデータ復旧の事例を教えてもらった。

 まず1つは、2台のドライブでRAID 1を組んだWindows Serverに障害が発生したケースだ。使用歴は約10年にも及んでいたが、ある日突然警告音が鳴り響き、約10台の社内PCで共有していた販売管理ソフトが使用できなくなったという。

約10年間使用したRAID機器のデータ復旧。他社のデータ復旧サービスでは復旧ができなかった

 サーバーを診断した結果、ドライブの1つは中度の物理的損傷、もう1つは重度の物理的損傷だと判明し、中度の障害が発生していたドライブからデータ復旧を試みた。しかし、中に保存されているデータが最新ではないことが分かり、最終的に重度障害が発生しているドライブから復旧せざるを得なくなった。なぜこのようなことになったのだろうか。

 これは2台のうち、中度の物理的損傷が発生していたドライブが、5~6年も前から正常に動作しておらず、最近のデータが書き込まれることなく放置されていたためだという。つまり必要なデータは重度の損傷を受けたドライブの中にしかなく、そちらを復旧せざるを得なかったというわけだ。

デジタルデータリカバリーでは8日間でデータ復旧に成功した

  「RAIDの復旧では、このようにドライブによってデータの更新日が違っていることがよくあります。この事例はRAID 1の復旧事例ですが、たとえば4本のドライブで構成されるRAID 5だと、ドライブの1・2・3番で組んだ場合と、1・3・4番で組んだ場合で、更新日の違うデータが抽出されるといった具合です。

  今回のケースは、ドライブの1台目が壊れているのに気づかず使い続け、2台目が壊れた時に初めて復旧を依頼されたというケースですね。ですので、必要なデータのおおよその更新時期を事前に把握しておくのは復旧作業をするにあたって重要です」(柳田氏)。

データリカバリー事業部エンジニアグループ グループ長 柳田悟氏

 ちなみにこの事例では、同社に持ち込まれるよりも前にメーカー運営のデータ復旧サービスに申し込んだものの、3カ月経ってもデータを復旧できず、埃などの異物による故障が原因だとして返却されたのだという。

 ところが同社が診断を行なったところ、他社が作業を実施した形跡を発見。真の原因はファームウェアの損傷および磁気ヘッドの異常だった。ファームウェアの修復と磁気ヘッドの交換を同時に実施し、復旧完了にこぎつけるまで、わずか8日しかかからなかったという。

  「実はこのファームウェア損傷は特定のメーカーのHDDによく起きる症状で、弊社では障害の修復方法が確立されています。しかし、重度の磁気ヘッド破損が発生している場合は、この修復方法では症状が悪化することもあります。物理障害の復旧技術について研究開発を行なっていないと、このような復旧難易度の高い障害を復旧することは難しいです。」(薄井氏)。

データリカバリー事業部エンジニアグループ 研究開発チーム 薄井雅信氏

 ところでこの事例は、必要なデータを別のメディアに吸い上げるのではなく、サーバー自体を元通り起動できるようにしてほしいという顧客からの要望があった。同社が「環境復旧」と呼ぶ、RAID機器の動作環境を復旧する作業は、壊れたOSやファイルシステムの修復を行なう必要があることから、単純なデータ復旧に比べ、難易度は桁違いに高いという。

正常なHDD(左)とHDDの記録面に傷が入っているHDD(右)

  「通常のデータ復旧では、データを99.99%ほど抽出できれば完全なデータが取り出せるのに対し、データ復旧から動作環境の復旧まで必要な場合はほぼ100%のセクターのコピーを取ってクローンを作成しても、起動できない場合があります。

  そのような場合はOSを構成しているファイルのどこに破損があるかを見つけ出し、ファイルシステムともども論理的な修復を行なうのですが、他社にはそうした技術がありません。ですので他社さんが仮に3カ月以上の日数をかけて物理障害を取り除けても、最後のOS修復の時点でつまずき、環境復旧はできなかったはずです」(柳田氏)。

 たとえRAID機器の製造元のメーカーであっても、障害発生時のデータ復旧のノウハウがあるとは限らず、デジタルデータリカバリーでは知られていて当然の禁じ手を行なってしまい、RAID機器の障害を悪化させてしまうこともある。この事例は最終的に同社の技術力の高さによって救われた格好で、RAID障害における業者選びの重要性を示すエピソードと言える。

事例2 : メーカー保守サービスでは対応不可、10年以上前のNASからデータを復旧

 続いての事例は、メーカーの保守サービスが切れてしまったRAID機器からデータを復旧した事例だ。

 機器は、4台組のRAID 5のサーバーで異常を知らせるランプが2個点灯し、OSの起動ができない状態だった。

メーカの保守サービスでは対応できなかった事例。データ復旧だけでなく業務利用できる状態に復旧を希望

 この事例では、サーバーが10年以上も前の古い機器だったため、メーカーの保守サービスはすでに期限が切れていた。

 メーカーへデータ復旧を依頼したところ、ドライブがSCSIのSAS(Serial Attached SCSI)という種類の中でも古いものだったため、交換用の部品も在庫がなく、データ復旧作業を断られ、同社に持ち込まれたのだという。

データリカバリー事業部エンジニアグループ 研究開発チーム 薄井雅信氏

  「これはドライブがSASだったという特殊な事例ですね。10年以上前の機器ですので、メーカーでも部品交換用のドナーを見つけることができずに対応してもらえなかったというご相談も多々あります。メーカーも復旧業者も、SASというだけでお断りというケースは少なくありませんが、弊社はSASよりも規格が古いSCSIにも対応しており、物理障害の修復やクローン作成も支障はありません」(薄井氏)。

 同社での検証の結果、SASのドライブに物理障害は見られず、4台のドライブのうち2番が論理的に壊れていることが判明したため、2番を抜いた1・3・4番でRAID 5を再構築してデータを抽出。その後、先ほどの事例と同じく、動作環境ごと元に戻す環境復旧を実施したという。その具体的な手順については、柳田氏から説明してもらった。

データ復旧から動作環境の復旧技術まで持ち合わせているため、デジタルデータリカバリーが実際にわずか5日で復旧完了した

  「動作環境の復旧でよく行なうのは、限りなく正常に近い状態、この事例だと1・3・4番のドライブでRAID 5を組んだイメージを作成し、弊社の仮想環境で起動して動作をチェックします。そして必要に応じてOSやファイルシステムも修復して、RAIDを組んだイメージをさらに直したイメージを作ります。

  これと並行して元の機器に別のドライブを入れてRAIDを構築し、箱だけは完全な機器を作った上で、修復したイメージを流し込み、最終調整を行なって完成に至ります。弊社では、ただデータを復旧するだけでなく、1人1人のお客様のご要望に合わせて対応しています。」(柳田氏)。

事例3 : 熊本県の「7月豪雨」の土砂崩れ被害で水没したRAIDからデータを復旧

熊本県の「7月豪雨」の土砂崩れ被害で実際に同社に依頼された機器

 最後に紹介するのは、冒頭でも触れた同社の災害支援の一環で行なわれたデータ復旧の事例だ。2020年に熊本県で発生した豪雨が原因で、河川の氾濫や土砂災害が発生。それにより水没してしまったNASや外付けHDDを始めとする30数台ものドライブからデータ復旧を行なったというものである。対象の機器は、通電すら困難だった機器はもちろん、水没したHDDやデータ記録面(プラッタ)に多数の傷が入っていたものもあったという。

HDDには土砂や水などが混入している。復旧以前に、そのままでは起動すらできない状態だった

  「被害に遭ったデバイスの中で、優先的に取り組まなくてはいけなかったのが、1台2TBのドライブを6台組み合わせたRAID 6のNASです。ドライブによっては水分はもちろん土砂が内部に侵入してしまっており、プラッタへのダメージも甚大でした。そのため磁気ヘッドを交換しつつ、並行してファームウェアの修復を実施することでドライブのクローン作成を行ない、なんとか復旧を完了させることができました」(薄井氏)。

 同社では10名ものエンジニアを投入し、土砂を取り除く地道な作業に始まり、スクラッチ加工技術や多数の交換用ドナーを用いた部品交換などの物理障害への対応、さらに水没したドライブから部分的に取り出したデータと水没していないドライブのデータを組み合わせるといった試行錯誤を重ね、データの抽出に至った。

 このうち「スクラッチ」と呼ばれる、HDDのデータの記録面に傷がついてしまう障害からの復旧は、東京都から経営革新優秀賞を受賞しており、また部品交換のスピーディさは、同社が常時保有している約7,000台もの交換用ドナーHDDがあってのものだ。

  「これらのケースでは通電は一切行なわず、中に水が侵入しているという前提のもとで開封診断を実施しました。このRAID 6を始め30台前後のドライブがあったのですが、午前10時から機器の取り出し及び開封診断を開始し、すべての開封診断が終了したのが午後6時と、ほかのお客様の機器も対応しながらすべての開封診断をわずか8時間で終えることができました」(薄井氏)。

 これだけ多くのドライブの開封診断を、わずか1日で完了させられることからも、緊急性の高い事案に対する、同社の対応力の高さが見て取れる。24時間365日の受付を行なっている事業者は決して多くなく、一日も早く業務を復旧させなくてはいけない法人にとっては、実に心強い存在と言えよう。

緊急時のRAID復旧、担当者が取るべき対応の最終回答は……?

データリカバリー事業部エンジニアグループ グループ長 柳田悟氏

 今回取り上げた3つの事例から、最初から技術力の高い業者に相談しなかったことで、復旧までに時間や費用などのコストが必要以上にかかっていることが一目瞭然である。

 デジタルデータリカバリーは、緊急時のRAID機器からのデータ復旧について、下記のように述べた。

  「緊急時にRAID機器からデータを復旧したい場合、まず第一に最初から技術力の高い業者に相談する事が重要です。技術力が低い業者に依頼して状態が悪化することで、復旧できたはずのデータも復旧できなくなるケースがあります。

  もう一点、緊急時のスピード復旧に対応可能なデータ復旧業者に相談してください。データ復旧業者によって、復旧完了までのスピードに大きな差があるため、同じ症状の機器でも1日2日で復旧できる業者もあれば、数カ月かかっても復旧できない業者もあります。なるべく早く解決したいときは、技術力とスピードを兼ね備えた業者に依頼をしてください」(柳田氏)。

 ちなみに他社で復旧不可能と診断された機器が同社に持ち込まれ、復旧に成功したケースは、RAID以外の機器も含めれば、2016年6月から現在までに合計7,000件を超えるという。中には4社もの業者に断られた機器のデータ復旧に成功したケースもあるというから、技術力の高さがうかがえる。

令和6年能登半島地震の被災者を対象に無償でデータ復旧支援を行なった様子。現地で実施期間内にデータ復旧が完了した事例もあったそう

 そんな中、同社が令和6年能登半島地震で被災地に赴いて行なったデータ復旧支援は、同社にとっても初めての取り組みだったとのことだが、水没や焼損に遭ったドライブなど、難易度の高いデータ復旧に自ら取り組み、実際に現地でデータ復旧を複数完了させている点は、同社の高いスキルと、データ復旧にかける信念を表していると言っていい。

 今後もしRAIDを始めとしたデータ復旧の必要性に迫られた場合は、デジタルデータリカバリーへ相談して、その技術力の一端に触れてみてはいかがだろうか。

データ復旧.com【デジタルデータリカバリー】|復旧率95.2%のデータ復旧・復元サービス
https://www.ino-inc.com/