SMARTテストの幻想

in tech

SMART 監視ツールは、SSD の健全性が 100% であるか、それを下回っているかを知ることができますが、NAS に既に保存されているファイルがまだ正しいかどうかを証明することはできません。このようにして、壊れたファイルのフォルダーの上に、一見健全な配列とフォルダーが作成されるのです。

おそらく NAS を主に安全なバックアップとして使用していることを考えると、ファイルが破損して失われることはストレージの目的そのものに反します。幸いなことに、バックアップを良好な状態に保つこの問題に対する解決策は、データ スクラビングです。

SMART テストでは、データではなくドライブの健全性をチェックします

それでもやる価値はありますが、全体像を描いているわけではありません。

Western Digital WD Red Plus 4TB NAS HDD を持っている人。 クレジット: Patrick Campanale / How-To Geek

SMART (自己監視、分析、およびレポート技術) テストは、ドライブの内部ヘルス カウンタを監視する組み込みのドライブ診断機能です。彼らは自己チェック ルーチンを実行して、故障の初期の兆候を見つけるため、非常に重要です。ドライブが 100% 健全な状態でも故障する可能性があるのは事実ですが、データを大切にする場合には SMART ツールが役立ちます。

ほとんどの事前構築済み NAS ボックスでは、短期テストまたは拡張テストをスケジュールできます。次に、結果を健全性ステータスと、読み取りエラー、再割り当てされたセクター、温度などを含む多数の属性として表示します。

とても便利です。ただし、これらは万能の監視ツールではありません。

SMART は 1 つの仕事、そして 1 つの仕事のみに最適です。ドライブ (NAS には複数のドライブが搭載されている場合があります) が正常に動作しているかどうか、および障害の兆候が現れ始めているかどうかがわかります。しかし、それは、水面下で醸成されているデータの整合性に関する問題がないことを意味するものではありません。

NAS に関する明確な SMART レポートであっても、最初から最後まで整合性が保証されるわけではありません。これはデバイス レベルで動作するため、ファイル システムが正しいと考えているもの、RAID 層が期待しているもの、特定のファイルを実行しようとしたときに保存されているブロックの一貫性が保たれているかどうかを実際に検証することはできません。

一方、データ破損は、SMART が目も当てられない場所から発生する可能性があります。 RAM の不良、不安定なコントローラーまたは HBA、ケーブル配線の限界、電源の不安定、ファームウェアの問題… まだまだ続きます。知らないうちにファイルが破損している場合があります。

スクラブが実際に何を検証するのか (そしてそれがいつ役立つのか)

これは最も楽しいことではありませんが、特定の状況では最良の方法です。

TerraMaster F4 SSD NAS には 4 つの異なる NVMe SSD がインストールされています。 クレジット: Patrick Campanale / How-To Geek

データ スクラブは、NAS に保存されているデータを計画的かつ体系的に渡すことです。いつかファイルが開かれるのを待つのではなく、NAS は保存されているブロックを意図的に読み取り、ディスク上の内容が最初に書き込まれた内容とまだ一致しているかどうかを確認します。スクラブを使用すると、潜在的な読み取りエラー、継続的な読み取り中にのみ現れる不整合、スクラブを使用しないと気付かない問題など、あらゆる種類の問題が表面化する可能性があります。

これは、ファイルが実際に正常に動作しているかどうかを検証する、より詳細なファイルレベルのパスです。

これが重要な理由はチェックサムです。それらをサポートするファイル システムでは、NAS はデータのブロックごとに小さなフィンガープリントを保存し、後でそのフィンガープリントを読み取ったものと比較できます。チェックサムに異常がある場合は、ドライブ自体が正常に動作していたとしても、データが破損していることを示します。

これは、スクラブが検出から修復まで行われる場所でもあります。ストレージ設定に冗長性があり、ファイル システムがそれを利用できる場合、多くの場合、スクラブによってプール内の他の場所から正しいコピーが取得され、不良ブロックが自動的に修正されます。冗長性がない場合でも、スクラブで問題を早期に発見できる可能性はありますが、欠落または破損したデータを魔法のように再作成することはできません。

スクラブはコールド データに特に最適です。つまり、損傷したブロックに長期間遭遇することはありません。ただし、スクラビングにより、これらの読み取りがスケジュールに従って強制的に実行されるため、ファイルを長期間使用しなかった場合でも、NAS は引き続き何が起こっているかをチェックします。

データスクラブですべてを解決できるわけではない

それはNASに依存します。

4 ベイ エンクロージャと積み重ねられた 6 ベイ Ugreen NAS の正面図。 クレジット: Patrick Campanale / How-To Geek

では、データ スクラブは、NAS で問題が発生する可能性のあるあらゆる問題を解決する魔法のようなものなのでしょうか?ああ、できれば。残念ながら、いくつかの制限があります。

スクラブは、NAS が検証できることしか検証できません (当然です)。セットアップがデータのチェックサムを保存しない場合、または NAS のスクラブ機能が実際にはパリティの整合性チェックに近い場合、アレイ構造が意味をなしているという確認以外には何も得られない可能性があります。それは少しずつチェックするようなものではありません。

もう 1 つの厳しい制限は冗長性です。 NAS には、既知のコピー (100% 正常であることがわかっているコピー) を取得する場所が必要です。これが破損を検出する唯一の方法だからです。単一ディスクの NAS、JBOD セットアップ、または実際の重複がないものでは、スクラブによって不良ブロックが検出される可能性はありますが、他にデータを取得する場所がないため、それらを修復することはできません。

たとえ冗長性があったとしても、スクラブは魔法の盾ではありません。データがディスクに到達する前に破損が発生した場合、または脆弱なハードウェアによって継続的に破損が発生した場合、根本原因を修正するまでスクラブによって問題が検出され続けるだけです。

データスクラビングに対処する最適な方法

ルーチンを設定すると、ファイルが安全に保たれます。

TerraMaster F4 SSD NAS の背面にあるポート。5Gb/s イーサネット ジャック、HDMI 出力、および USB ポートを示しています。 クレジット: Patrick Campanale / How-To Geek

スクラブは、ファイルを監視し、ファイルが良好な状態であることを確認するための優れた方法です。ただし、これは緊急事態を解決するものではありません。そのため、NAS メンテナンス ルーチンの一部として扱うと、最も効果的に機能します。

コールド データの問題を特定するには十分な頻度である必要がありますが、NAS がバックグラウンドで大量のデータを常に読み取らないように十分な間隔をあけて行う必要があります。 (それにより、非常に騒がしくなる可能性があります。)

ほとんどの家庭用セットアップの場合、これは結局、毎月のペースでスクラブを実行し、SMART がより軽い、より頻繁な、より一般的なヘルス チェックでギャップを埋めることになります。

簡単なヒント: これらのジョブが重複しないようにしてください。スクラブはすでに持続的な読み取りワークロードであり、これに SMART の長いテスト、パリティ チェック、バックアップ、またはメディアのインデックス作成を重ねると、NAS が使用不能になるギリギリの状態になります。全 SSD の NAS なら対応できると思いますが、それでも、理由もなく速度が低下することになります。


最後に、これらのデータ スクラブを、より大きなセーフティ ネットの単なる 1 層として扱います。最も重要なファイルについては、3-2-1 ルールを守り (または 3-2-1-1-0 にレベルアップすることもできます)、頻繁にチェックを実行し、NAS を良好な状態に維持して、データ破損のリスクを可能な限り低く抑えます。

関連記事

前の投稿
今週観たいパラマウント+の素晴らしい映画 3 本 (2 月 23 日)
次の投稿
WhatsApp ユーザーが知っておくべき 10 のハック