28.5.2. Broken NVDIMM 감지 및 교체
시스템 로그 또는 S.M.A.R.T.에서 보고된 NVDIMM과 관련된 오류 메시지가 표시되면 NVDIMM 장치가 실패할 수 있습니다. 이 경우 다음을 수행해야 합니다.
- NVDIMM 장치가 실패하는지 감지합니다.
- 저장된 데이터를 백업하고,
- 물리적으로 장치를 교체하십시오.
절차 28.3. Broken NVDIMM 감지 및 교체
- 손상된 DIMM을 감지하려면 다음 명령을 사용하십시오.
ndctl list --dimms --regions --health --media-errors --human
# ndctl list --dimms --regions --health --media-errors --human
Copy to Clipboard Copied! Toggle word wrap Toggle overflow badblocks
필드에는 NVDIMM이 손상된 것으로 표시됩니다.dev
필드에서 해당 이름을 기록해 둡니다. 다음 예에서nmem0
이라는 NVDIMM이 손상되었습니다.예 28.1. NVDIMM 장치의 상태
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 다음 명령을 사용하여 손상된 NVDIMM의
phys_id
속성을 찾습니다.ndctl list --dimms --human
# ndctl list --dimms --human
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 이전 예에서nmem0
이 손상된 NVDIMM임을 알 수 있습니다. 따라서nmem0
의phys_id
속성을 찾습니다. 다음 예제에서phys_id
는0x10
입니다.예 28.2. NVDIMM의 phys_id 속성
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 다음 명령을 사용하여 손상된 NVDIMM의 메모리 슬롯을 찾습니다.
dmidecode
# dmidecode
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 출력에서Handle
식별자가 손상된 NVDIMM의phys_id
속성과 일치하는 항목을 찾습니다.검색
필드에는 손상된 NVDIMM에 사용되는 메모리 슬롯이 나열됩니다. 다음 예에서nmem0
장치는0x0010
식별자와 일치하며DIMM-XXX-YYYY
메모리 슬롯을 사용합니다.예 28.3. NVDIMM 메모리 슬롯 목록
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - NVDIMM의 네임스페이스의 모든 데이터를 백업합니다. NVDIMM을 교체하기 전에 데이터를 백업하지 않으면 시스템에서 NVDIMM을 제거할 때 데이터가 손실됩니다.주의NVDIMM이 완전히 손상되는 경우와 같이 경우에 따라 백업이 실패할 수 있습니다.이를 방지하려면 28.5.1절. “S.M.A.R.T를 사용하여 NVDIMM 상태 모니터링.” 에 설명된 대로 S.M.A.R.T를 사용하여 NVDIMM 장치를 정기적으로 모니터링하고 장애가 발생하기 전에 NVDIMM을 교체하십시오.다음 명령을 사용하여 NVDIMM의 네임스페이스를 나열합니다.
ndctl list --namespaces --dimm=DIMM-ID-number
# ndctl list --namespaces --dimm=DIMM-ID-number
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 다음 예에서nmem0
장치에는 백업해야 하는namespace0.0
및namespace0.2
네임스페이스가 포함되어 있습니다.예 28.4. NVDIMM 네임스페이스 목록
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 손상된 NVDIMM을 물리적으로 교체합니다.