【 12月20〜23日連休で発生するRAID/サーバ機の熱暴走に注意喚起!冬場でも発生する温度変化によるデータトラブルとは? 】 (2/5ページ)
しかし小まめなメンテナンスさえあれば、寿命によるデータトラブルも軽減できます。
また、温度変化等によるRAID/サーバ機の障害原因はHDDだけに言えるものではなく、CPUの発熱も大きく関係します。CPUは演算能力が上がる程高性能とされていますが、その反面、機器自体の温度上昇は著しく消費電力も上がります。CPUの温度上昇によってHDDやメモリに正確に情報が伝わらず、リードライトが繰り返されることでHDDへは通常よりも強い負荷が掛かるのです。
CPUは1/m毎に刻むクロック数が高いほど演算能力が高まる為、クロック数の上昇が研究されてきました。しかし、消費電力増加による発熱はCPUだけでなくメモリやHDDに対するデメリットが多いため、機器全体の寿命を下げることになります。ハイパースレッディングによって仮想的なコアも、CPU温度・消費電力の上昇が著しく、マルチコアに最適化されたプログラムが主流な為、導入例は減少傾向にあります。発熱を抑制するためにもクロック数は抑え、マルチコアやマルチスレッドによって1つのCPUで同時処理数を増やして演算能力向上が図られる、クロックダウン機能が推奨されます。
また、動作するだけで発熱するHDDの適正環境温度は0~60℃ですが、RAID/サーバ機は作動するだけで70℃以上になるソフトも多く、熱暴走はいかなる環境であっても発生するのです。これはCPUにも言えることで、冬場であってもRAID/サーバ機が温度上昇することを忘れずに、日頃のメンテナンスは欠かさずに行ってください。
12月に入ってから当社にお持ち込みのあった機器は、定期メンテナンスを1週間後に控えたRAID/サーバ機で、HDDの寿命だけでなく冷却ファンに溜まった埃によって熱暴走を引き起こし、構成された6台のHDDうち3台に物理破損が発生している状態でした。今回の場合、RAID/サーバ機の異常にすぐに気づいたとのことで最悪の事態は免れていましたが、熱暴走を起こしたRAID/サーバ機では全てのHDDが破損することが多いため十分に注意が必要です。ハードウェア可用性向上のためのECCやホットスワップは、温度上昇で発生したRAID/サーバ機の障害には有効と言えませんのでご注意ください。