第 3 章 故障排除所需的常见日志


列出了一些用于 OpenShift Container Storage 故障排除的常用日志,以及生成这些日志的命令。

  • 为特定 pod 生成日志:

     $ oc logs <pod-name> -n <namespace>
  • 为 Ceph 或 OpenShift Container Storage 集群生成日志:

    $ oc logs rook-ceph-operator-<ID> -n openshift-storage
    重要

    目前,rook-ceph-operator 日志不提供有关故障的任何信息,这在故障排除中可作为限制,请参阅为 rook-ceph-operator 启用和禁用 debug 日志

  • 为 cephfs 或 rbd 等插件 pod 生成日志,以检测 app-pod 挂载中的任何问题:

    $ oc logs csi-cephfsplugin-<ID> -n openshift-storage -c csi-cephfsplugin
    $ oc logs csi-rbdplugin-<ID> -n openshift-storage -c csi-rbdplugin
    • 为 CSI pod 中的所有容器生成日志:

      $ oc logs csi-cephfsplugin-<ID> -n openshift-storage --all-containers
      $ oc logs csi-rbdplugin-<ID> -n openshift-storage --all-containers
  • 为 cephfs 或 rbd provisioner pod 生成日志,以检测 PVC 不处于 BOUND 状态的问题:

    $ oc logs csi-cephfsplugin-provisioner-<ID> -n openshift-storage -c csi-cephfsplugin
    $ oc logs csi-rbdplugin-provisioner-<ID> -n openshift-storage -c csi-rbdplugin
    • 为 CSI pod 中的所有容器生成日志:

      $ oc logs csi-cephfsplugin-provisioner-<ID> -n openshift-storage --all-containers
      $ oc logs csi-rbdplugin-provisioner-<ID> -n openshift-storage --all-containers
  • 使用 cluster-info 命令生成 OpenShift Container Storage 日志:

    $ oc cluster-info dump -n openshift-storage --output-directory=<directory-name>
  • 检查 OpenShift Container Storage operator 日志和事件。

    • 检查 Operator 日志:

      # oc logs <ocs-operator> -n openshift-storage
      <ocs-operator>
      # oc get pods -n openshift-storage | grep -i "ocs-operator" | awk '{print $1}'
    • 检查 Operator 事件 :

      # oc get events --sort-by=metadata.creationTimestamp -n openshift-storage
  • 获取 OpenShift Container Storage operator 版本和频道。

    # oc get csv -n openshift-storage

    输出示例:

    NAME                     DISPLAY VERSION              REPLACES
    PHASE
    ocs-operator.v4.7.2      OpenShift Container Storage  4.7.2
    Succeeded
    # oc get subs -n openshift-storage

    输出示例:

    NAME          PACKAGE        SOURCE
    CHANNEL
    ocs-operator  ocs-operator   redhat-operators
    stable-4.8
  • 确认已创建了安装计划。

    # oc get installplan -n openshift-storage
  • 在更新 OpenShift Container Storage 后验证组件的镜像。

    • 检查您要在其上验证镜像运行的组件 pod 的节点。

      # oc get pods -o wide | grep <component-name>

      例如:

      # oc get pods -o wide | grep rook-ceph-operator

      输出示例:

      rook-ceph-operator-566cc677fd-bjqnb 1/1 Running 20 4h6m 10.128.2.5 rook-ceph-operator-566cc677fd-bjqnb 1/1 Running 20 4h6m 10.128.2.5 dell-r440-12.gsslab.pnq2.redhat.com <none> <none>
      
      <none> <none>

      dell-r440-12.gsslab.pnq2.redhat.comnode-name

    • 检查镜像 ID。

      # oc debug node/<node name>

      <node-name>

      是您要验证镜像运行的组件 pod 的节点名称。

      # chroot /host
      # crictl images | grep <component>

      例如:

      # crictl images | grep rook-ceph

      输出示例:

      IMAGE                                                     TAG
            IMAGEID          SIZE
      registry.redhat.io/ocs4/rook-ceph-rhel8-operator@sha256   <none>
            5600a36370df4    1.55GB

      记录 IMAGEID,并将其映射到 Rook Ceph Operator 页面中的 Digest ID。

其他资源

Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.