6.10. 손상된 NVDIMM 장치 감지 및 교체
시스템 로그 또는 S.M.A.R.T.T.에 의해 보고된 NVDIMM(Non-Volatile Dual In-line Memory Modules)과 관련된 오류 메시지가 발견되면 NVDIMM 장치가 실패할 수 있습니다. 이 경우 다음을 수행해야 합니다.
- 실패한 NVDIMM 장치 감지
- 백업 데이터가 저장되어 있습니다
- 물리적으로 장치를 교체
절차
손상된 장치를 감지합니다.
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 손상된 NVDIMM의 Restics
_id특성을 찾습니다.ndctl list --dimms --human
# ndctl list --dimms --humanCopy to Clipboard Copied! Toggle word wrap Toggle overflow 이전 예에서
nmem0이 손상된 NVDIMM이라는 것을 알고 있습니다. 따라서nmem0의phys_id속성을 찾습니다.예 6.7. NVDIMM의 phys_id 속성
다음 예에서
phys_id는0x10입니다.Copy to Clipboard Copied! Toggle word wrap Toggle overflow 손상된 NVDIMM의 메모리 슬롯을 찾습니다.
dmidecode
# dmidecodeCopy to Clipboard Copied! Toggle word wrap Toggle overflow 출력에서 Handle 식별자가 손상된 NVDIMM의 Restics
_id속성과 일치하는 항목을 찾습니다. 이 필드에 는 손상된 NVDIMM에서 사용하는 메모리 슬롯이 나열됩니다.예 6.8. NVDIMM 메모리 롤링
다음 예에서
nmem0장치는0x0010식별자와 일치하며DIMM-XXX-YYYY 메모리 슬롯을사용합니다.Copy to Clipboard Copied! Toggle word wrap Toggle overflow NVDIMM의 네임스페이스에 있는 모든 데이터를 백업합니다. NVDIMM을 교체하기 전에 데이터를 백업하지 않으면 시스템에서 NVDIMM을 제거하면 데이터가 손실됩니다.
주의NVDIMM이 완전히 손상된 경우와 같은 경우에 따라 백업이 실패할 수 있습니다.
이를 방지하기 위해 S.M.A.R.T. 를 사용하여 NVDIMM 상태 모니터링에 설명된 대로 NVDIMM 장치를 정기적으로 모니터링하고 오류가 발생하기 전에 NVDIMM을 교체합니다.
NVDIMM의 네임스페이스를 나열합니다.
ndctl list --namespaces --dimm=DIMM-ID-number
# ndctl list --namespaces --dimm=DIMM-ID-numberCopy to Clipboard Copied! Toggle word wrap Toggle overflow 예 6.9. NVDIMM 네임스페이스 목록
다음 예에서
nmem0 장치에는백업해야 하는namespace0.0및namespace0.2네임스페이스가 포함되어 있습니다.Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 손상된 NVDIMM을 물리적으로 교체합니다.