18.9. 손상된 NVDIMM 장치 감지 및 교체


시스템 로그 또는 S.M.A.R.T.에 의해 보고된 NVDIMM(Non-Volatile Dual In-line Memory Modules)과 관련된 오류 메시지가 표시되면 NVDIMM 장치가 실패할 수 있습니다. 이 경우 다음을 수행해야 합니다.

  1. 실패한 NVDIMM 장치 감지
  2. 저장된 데이터를 백업
  3. 물리적으로 장치를 교체합니다.

프로세스

  1. 손상된 장치를 감지합니다.

    # ndctl list --dimms --regions --health
    {
      "dimms":[
        {
          "dev":"nmem1",
          "id":"8089-a2-1834-00001f13",
          "handle":17,
          "phys_id":32,
          "security":"disabled",
          "health":{
            "health_state":"ok",
            "temperature_celsius":35.0,
            [...]
          }
    [...]
    }
    Copy to Clipboard Toggle word wrap
  2. 손상된 NVDIMM의 phys_id 속성을 찾습니다.

    # ndctl list --dimms --human
    Copy to Clipboard Toggle word wrap

    이전 예에서 nmem0 이 손상된 NVDIMM임을 알고 있습니다. 따라서 nmem0phys_id 속성을 찾습니다.

    예 18.5. NVDIMM의 phys_id 속성

    다음 예에서 phys_id0x10 입니다.

    # ndctl list --dimms --human
    
    [
      {
        "dev":"nmem1",
        "id":"XXXX-XX-XXXX-XXXXXXXX",
        "handle":"0x120",
        "phys_id":"0x1c"
      },
      {
        "dev":"nmem0",
        "id":"XXXX-XX-XXXX-XXXXXXXX",
        "handle":"0x20",
        "phys_id":"0x10",
        "flag_failed_flush":true,
        "flag_smart_event":true
      }
    ]
    Copy to Clipboard Toggle word wrap
  3. 손상된 NVDIMM의 메모리 슬롯을 찾습니다.

    # dmidecode
    Copy to Clipboard Toggle word wrap

    출력에서 Handle 식별자가 손상된 NVDIMM의 phys_id 속성과 일치하는 항목을 찾습니다. 로케이터 필드에는 손상된 NVDIMM에서 사용하는 메모리 슬롯이 나열됩니다.

    예 18.6. NVDIMM 메모리 슬롯 목록

    다음 예에서 nmem0 장치는 0x0010 식별자와 일치하고 DIMM-XXX-YYYY 메모리 슬롯을 사용합니다.

    # dmidecode
    
    ...
    Handle 0x0010, DMI type 17, 40 bytes
    Memory Device
            Array Handle: 0x0004
            Error Information Handle: Not Provided
            Total Width: 72 bits
            Data Width: 64 bits
            Size: 125 GB
            Form Factor: DIMM
            Set: 1
            Locator: DIMM-XXX-YYYY
            Bank Locator: Bank0
            Type: Other
            Type Detail: Non-Volatile Registered (Buffered)
    ...
    Copy to Clipboard Toggle word wrap
  4. NVDIMM의 네임스페이스의 모든 데이터를 백업합니다. NVDIMM을 교체하기 전에 데이터를 백업하지 않으면 시스템에서 NVDIMM을 제거하면 데이터가 손실됩니다.

    주의

    NVDIMM이 완전히 손상된 경우와 같은 경우에 백업이 실패할 수 있습니다.

    이를 방지하려면 S.M.A.R.T.를 사용하여 NVDIMM 상태에 설명된 대로 NVDIMM 장치를 정기적으로 모니터링하고 중단하기 전에 실패한 NVDIMM을 교체합니다.

  5. NVDIMM의 네임스페이스를 나열합니다.

    # ndctl list --namespaces --dimm=DIMM-ID-number
    Copy to Clipboard Toggle word wrap

    예 18.7. NVDIMM 네임스페이스 목록

    다음 예에서 nmem0 장치에는 백업해야 하는 namespace0.0namespace0.2 가 포함되어 있습니다.

    # ndctl list --namespaces --dimm=0
    
    [
      {
        "dev":"namespace0.2",
        "mode":"sector",
        "size":67042312192,
        "uuid":"XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX",
        "raw_uuid":"XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX",
        "sector_size":4096,
        "blockdev":"pmem0.2s",
        "numa_node":0
      },
      {
        "dev":"namespace0.0",
        "mode":"sector",
        "size":67042312192,
        "uuid":"XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX",
        "raw_uuid":"XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX",
        "sector_size":4096,
        "blockdev":"pmem0s",
        "numa_node":0
      }
    ]
    Copy to Clipboard Toggle word wrap
  6. 손상된 NVDIMM을 물리적으로 교체합니다.
맨 위로 이동
Red Hat logoGithubredditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

Theme

© 2025 Red Hat