インタビュー
» 2011年08月19日 17時00分 UPDATE

HDD障害のプロに聞く:故障で“病院送り”になるRAID製品はどんなものが多い?

前回「夏場に起きやすいHDD障害」の傾向と対策について日本データテクノロジーに話を聞いたが、今回は具体的にどういった製品が持ち込まれているのかまで踏み込んでみた。

[後藤治,ITmedia]

 データサルベージ企業の日本データテクノロジーによれば、夏に起きやすいHDD障害の1つとして、落雷による停電が挙げられるという。特にパリティ計算中のRAIDシステムで“瞬断”(落雷の影響などで送電ルートを切り替える際に電圧が瞬間的に下がる)が起きると、非常に高い確率で論理障害が発生する。これを避けるためには、UPSなどを利用するのが手だ(参考記事:「夏場に起きやすいHDD障害、その傾向と対策」)。

 もっとも、こういった対策は、実際に障害が発生してデータが失われるまで、その重要性について真剣に考えない人は多い。企業の場合はともかく、機能の追加や強化ではない“予防策”に出費するのを避けがちな個人利用の場合はなおさらだろう。6月以降、同社には、RAID復旧の依頼が問い合わせが相次いでいるという。できるだけUPSを利用し、リビルドに失敗しても被害を最小に食い止められるよう、きちんとバックアップを取ることをおすすめしたい。

どんな製品が持ち込まれるのか

og_ogid_001.jpg 日本データテクノロジー データ復旧事業部の西原世栄氏

 さて、日本データテクノロジーには実際にどういったRAID製品が持ち込まれているのだろうか。ここでメーカーや製品名まで挙げてしまうといろいろな問題もありそうだが、あえて踏み込んでみた。答えてくれたのは、RAID復旧チームに所属する論理障害のスペシャリスト、西原世栄氏だ。

 2011年1月から8月までに同社へ持ち込まれたRAID製品で目立っていたのは、バッファローの「TeraStation」と「LinkStation」、アイ・オー・データ機器の「LANDISK」、また、企業向けのサーバ製品として、デルの「PowerEdge」や、日本HPの「ProLiant」、IBMの「xSeries」などだったという。

 ただし、これがそのまま“壊れやすい”ということを意味するわけではないようだ。西原氏は「特に家庭用のバッファローとアイ・オー・データ機器の製品が多いのは、販売台数や出荷台数が多いからだと思います」と語っている。当然のことながら、使っているユーザー数が多ければ、それだけ故障で持ち込まれる機会も増える、というわけだ。

 取材前に「これだけは買ってはいけない。HDD障害のプロが語るRAIDシステムの選び方」というタイトルを思い浮かべていた記者としてはやや拍子抜けな回答だが、各製品で壊れ方に傾向があるとのことなので、詳しく聞かせてもらった。

og_ogid_002.jpg 日本データテクノロジーに持ち込まれることが多い「TeraStation」と「LANDISK」

 まずはバッファローの「TeraStation」と「LinkStation」。これらは市場に出回っている数が非常に多く、ユーザー層も初心者から上級者まで幅広いため、壊れ方は多岐に渡る。例えば、ユーザーの単純な操作ミスやファームウェアアップデートの失敗による障害が多いのもこの製品の特徴だ。「特に初心者の方は不要なファームウェアアップデートは行わないほうがいいかもしれません」と西原氏は指摘する。

 ちなみに、4ドライブ構成のTeraStationよりも2ドライブのLinkStationのほうがデータ復旧は容易としているが、ユーザーが無理に復旧させようとして手を加えてしまったものでない限り、いずれにしても「多少PCが詳しい方では難しいですが、私たちの手にかかればほぼ100%近い確率」で復旧が可能という。

 実際、2011年に入庫したTeraStationとLinkStationは、100件前後を西原氏が担当したが、復旧できなかった案件は1件もない。西原氏以外にもエンジニアはいるが、そのエンジニアたちが対応したものも含め、100%近く復旧に成功している。こう聞くと、「実は簡単なんじゃないの?」と思ってしまうが、内部でIDE接続されている古いTeraStationや、逆に最新のモデルでは、それぞれソフトウェアRAIDの組み方が違うため、これまで多くの障害を見てきた経験がないと復旧は簡単ではないらしい。

 一方、アイ・オー・データ機器の「LANDISK」もバッファロー製品とほぼ同様の傾向を持っており、壊れ方は多岐に渡る。ただし、製品によっては暗号化機能があり、これが復旧を難しくするケースもある。特にUSBキーとハードウェアで暗号化(AES 256ビット)する「HDL-GTR」シリーズは、RAIDシステムに論理障害が発生した場合、データ復旧は非常に難しく、実際に他社のデータ復旧企業から断られたものが、日本データテクノロジーに回ってくることが多いという。

 ちなみに、HDL-GTRシリーズの具体的なサルベージ方法は「企業秘密」で、社内でも西原氏ともう1人だけしか知らない「トップシークレット」扱いになっている。西原氏は「復旧のしやすさを考えると、暗号化はおすすめしません」と語っているが、2011年度はこうしたケースでも復旧率100%を達成しており、こうした技術力の高さが、復旧件数で業界トップに立つ日本データテクノロジーの基盤になっているといえそうだ。

企業で利用されるサーバの復旧

og_ogid_003.jpg RAIDシステムの復旧では、パリティの位置からディスクの順番を特定して単一ボリュームの状態に戻し、それから必要なデータをサルベージしていく。パリティやストライプされているサイズなどは、メーカー、ファイルシステムごとに特性があり、これまでの経験をベースにすることで復旧作業の時間を大幅に短縮できるという

 一方、PowerEdgeやProLiant、xSeriesの依頼が多いのは、よりデータの重要性が高い法人用途のためだと推測される。これらのケースでは、ファイルシステムやストライプのサイズなどが特殊な場合が多く、通常よりも難易度が高い作業になることが多い。

 例えば、パリティ2重のRAID 6で組まれた日本HPの製品などは、運用時の信頼性が高い半面、パリティの使い方が特殊で、復旧という視点で見ると非常に時間がかかってしまう。もっとも、同社はこれまでの経験から、ある程度はパターンを絞って復旧までの手順を簡略化することができ、「もちろん、多少PCが詳しい方やデータ復旧を専門にしている企業でも普通は復旧できません。弊社は日本一の依頼件数をこなしているので、エンジニアが経験を積み、技術のスキルをあげる環境が整っています。ですので、こういったケースでも問題なく復旧できるのです」(西原氏)と胸を張る。

og_ogid_004.jpgog_ogid_005.jpg RAIDシステムの復旧は、緊急を要する法人からの依頼が多い。メーカーごとの特性をどれだけ蓄積しているかで復旧までの時間を短縮できるため、経験がそのまま技術力の高さにつながる

 逆に西原氏は、RAID障害が起きた際に復旧しやすいよう、いくつかの注意点をアドバイスしてくれた。まず、よくあるのが、保守の期限が切れたまま運用しており、社内の担当者がRAID構成すら分かっていない場合だ。基本的にRAID構成が分からなくても復旧は可能というが、大幅に作業時間を短縮できるため、一刻も早くデータを取り戻したい場合は、どういった状況で運用されていたのかといった情報が重要になる。

 また、保守に頼るのも場合によってはデメリットがあるという。例えば、システムが故障して保守の指示通りに初期化してしまいデータが消えた、といった事例がかなり多いと西原氏は指摘する。「ユーザーとメーカーで保守の考え方が異なる場合が多いようですね。メーカーは、故障したときの第一声でリカバリしてください。リカバリしたら動きます、と言いますが、ユーザーが欲しいのはデータです。そうした食い違いで、メーカー保守によってデータが消えてしまうことがかなり多い印象です」。

 そして何よりも重要なのは、障害が発生した際に自分でどうにかしようとするのではなく、すぐに専門企業へ依頼することだ。

 西原氏は「一般的に難しいといわれるRAIDのデータ復旧ですが、無用に人の手を加えて中がぐちゃぐちゃにされていない限り、非常に高い確率で復旧することは可能です。データの重要度によっては、すぐに私たちのような専門の企業に依頼してくださるのがいいと思います」と語り、「ただし、技術がないのに成功報酬でやりたがる業者や、明らかに金額が安い業者には注意してください。なぜなら、そういった業者に頼んでいろいろいじられてしまったような案件は、結果的に復旧するのが非常に難しくなる場合があるからです。そうなる前に是非1度、まずは弊社にご相談ください」と付け加えた。

Copyright© 2016 ITmedia, Inc. All Rights Reserved.