RAID復旧失敗を予防するHDDの全領域チェック

ALL
スポンサーリンク

LinuxでHDDの全領域のアクセスチェックの方法です。
HDDをRAID構成で運用している場合、ディスク障害で復旧させようとしても失敗することがあるのですが、これを回避できます。

復旧の際、通常はアクセスされないHDDの領域にアクセスします。
ところが、その時になって初めて、復旧に必要な領域も壊れていることが発覚し、復旧できずに青ざめることになります。
パソコン鳥も一度、これで失敗しました。

下記サイトでも説明のように、事前に、定期的にHDDの全領域チェックをすることが必要です。
でないと、いざという時になってHDDが壊れていることに気付くことになります。

[運用編]RAIDだからと安心してはいけない | 日経 xTECH(クロステック)

RAID構成を採ると「データが失われることはない」と過信しがちだが,(中略)「実際には復元できないケースがある」
ミラー領域やパリティ領域はほとんどアクセスされないので,「いざアクセスしようとしたときに壊れていた」という事態になることがあるからだ。

https://support.express.nec.co.jp/care/techinfo/ConsistencyCheck.html

通常運用中にアクセスされない部分に不良ブロックが内在する状態でディスク故障(DEAD)が発生した場合、(縮退運用中やリビルド中に不良ブロックがはじめて検出され)正常にデータを復旧することができずにデータ損失やシステムダウンなどの二次障害に発展する危険性があります。

さて、LinuxでHDDの全領域のアクセスチェックの方法です。

badblocks コマンドを使います。
Ubuntu, CentOSともに使えます。

次のように -sv オプションを付けて、対象のHDDのデバイスを指定します。
全領域の読み込みチェックです。
HDDへの書き込みはありません。

badblocks -sv /dev/sdb

実行すると、進行度合い(%)が表示されます。

Checking blocks 0 to 156249999
Checking for bad blocks (read-only test):  48.73% done, 17:45 elapsed.

チェックが完了すると、次のように表示されます。
0 bad blocks found. と表示されていればOKです。

Checking for bad blocks (read-only test): done
Pass completed, 0 bad blocks found. 

コメント

  1. ジュリ より:

    Vogel様、私くしはMiniToolのジュリと申します。
    申し訳ございませんが、おサイトを訪ねたいただいて、ごメールアドレスを見なかったので、コメントにご連絡しなければなりません。
    おサイトに弊社の製品(MiniTool Partition Wizard)の記事掲載のお願いについてご連絡致します。
    恐縮ですが、ごメールアドレスをjuly.zhang@minitool.comにお送っていただけませんか?
    詳細に関するはどうぞお気軽にご連絡してお願いいたします。