18.8. S.M.A.R.T. を使用した NVDIMM の健全性の監視
Non-Volatile Dual In-line Memory Modules (NVDIMM) デバイスによっては、健全性情報を取得するための Self-Monitoring, Analysis and Reporting Technology (SMART) インターフェイスをサポートしているものもあります。詳細は、システム上の ndctl-list(1) man ページを参照してください。
データの損失を防ぐために、NVDIMM の健全性状態を定期的に監視してください。SMART が NVDIMM デバイスのヘルスステータスに関する問題を報告した場合は、Detecting and replacing a broken NVDIMM device の説明に従って交換します。
前提条件
オプション: 一部のシステムでは、次のコマンドを使用して
acpi_ipmiドライバーをアップロードし、ヘルス情報を取得します。# modprobe acpi_ipmi
手順
ヘルス情報にアクセスします。
# ndctl list --dimms --health[ { "dev":"nmem1", "id":"8089-a2-1834-00001f13", "handle":17, "phys_id":32, "security":"disabled", "health":{ "health_state":"ok", "temperature_celsius":36.0, "controller_temperature_celsius":37.0, "spares_percentage":100, "alarm_temperature":false, "alarm_controller_temperature":false, "alarm_spares":false, "alarm_enabled_media_temperature":true, "temperature_threshold":82.0, "alarm_enabled_ctrl_temperature":true, "controller_temperature_threshold":98.0, "alarm_enabled_spares":true, "spares_threshold":50, "shutdown_state":"clean", "shutdown_count":4 } }, [...] ]