搜索

2.5. 主机

download PDF

2.5.1. 主机简介

主机也称为虚拟机监控程序,是运行虚拟机的物理服务器。使用称为基于内核的虚拟机(KVM)的可加载 Linux 内核模块提供完全虚拟化。

KVM 可以同时托管运行 Windows 或 Linux 操作系统的多个虚拟机。虚拟机作为独立 Linux 进程和线程在主机上运行,并由 Red Hat Virtualization Manager 远程管理。Red Hat Virtualization 环境连接有一个或多个主机。

Red Hat Virtualization 支持两种方法安装主机。您可以使用 Red Hat Virtualization Host (RHVH)安装介质,或者在标准 Red Hat Enterprise Linux 安装中安装虚拟机监控程序软件包。

注意

您可以通过选择主机名来识别 Red Hat Virtualization Manager 中的独立主机类型。这会打开详情视图。然后,查看 软件 下的 OS 描述

主机使用 tuned 配置集,提供虚拟化优化。有关 tuned 的更多信息,请参阅 Red Hat Enterprise Linux 监控和管理系统状态和性能 中的 TuneD 配置集

Red Hat Virtualization Host 启用了安全功能。Security Enhanced Linux (SELinux)和防火墙是完全配置且默认打开的。选定主机上的 SELinux 状态会在详情视图中常规标签页的 SELinux 模式下报告。当管理器添加到环境中时,该管理器可以在 Red Hat Enterprise Linux 主机上打开所需的端口。

主机是具有 Intel VT 或 AMD-V 扩展运行 Red Hat Enterprise Linux 7 AMD64/Intel 64 版本的物理 64 位服务器。

Red Hat Virtualization 平台上的物理主机:

  • 必须在系统中只属于一个集群。
  • 必须有支持 AMD-V 或 Intel VT 硬件虚拟化扩展的 CPU。
  • 必须具有支持由集群创建时所选虚拟 CPU 类型公开的所有功能的 CPU。
  • 至少 2 GB RAM。
  • 具有具有系统权限的系统管理员。

管理员可以从 Red Hat Virtualization 监视列表接收最新的安全公告。订阅 Red Hat Virtualization 监视列表,通过电子邮件接收 Red Hat Virtualization 产品的新安全公告。通过填写此表单来订阅:

https://www.redhat.com/mailman/listinfo/rhsa-announce

2.5.2. Red Hat Virtualization Host

Red Hat Virtualization Host (RHVH)使用特殊构建的 Red Hat Enterprise Linux 安装,且只有托管虚拟机所需的软件包。它使用一个基于 Red Hat Enterprise Linux 主机使用的 Anaconda 安装界面,并可通过 Red Hat Virtualization Manager 或 yum 更新。使用 yum 命令是安装附加软件包的唯一方法,并在升级后保留它们。

RHVH 提供了一个 Cockpit Web 界面,用于监控主机的资源并执行管理任务。不支持通过 SSH 或控制台直接访问 RHVH,因此 Cockpit Web 界面为主机添加到 Red Hat Virtualization Manager 之前执行的任务提供了一个图形用户界面,比如通过 Terminal 子选项卡配置网络或运行终端命令。

在 Web 浏览器中,访问 https://HostFQDNorIP:9090 的 Cockpit Web 界面。适用于 RHVH 的 Cockpit 包含自定义 虚拟化 仪表板,显示主机健康状态、SSH 主机密钥、自托管引擎状态、虚拟机和虚拟机统计信息。

从 Red Hat Virtualization 版本 4.4 SP1 开始,RHVH 使用 systemd-coredump 收集、保存和处理核心转储。如需更多信息,请参阅 内核转储存储配置文件和 systemd-coredump 服务 的文档。

在 Red Hat Virtualization 4.4 及更早的 RHVH 中,使用自动错误报告工具(ABRT)来收集有关应用程序崩溃的有意义的调试信息。如需更多信息,请参阅 Red Hat Enterprise Linux 系统管理员指南

注意

可以使用 grubby 工具将自定义启动内核参数添加到 Red Hat Virtualization Host 中。grubby 工具对 grub.cfg 文件进行持久更改。导航到主机的 Cockpit Web 界面中的 Terminal 子选项卡,以使用 grubby 命令。如需更多信息,请参阅 Red Hat Enterprise Linux 系统管理员指南

警告

不要在 RHVH 上创建不受信任的用户,因为这可能导致利用本地安全漏洞。

2.5.3. Red Hat Enterprise Linux 主机

您可以使用 Red Hat Enterprise Linux 7 作为主机在功能的硬件中安装。Red Hat Virtualization 支持运行 Red Hat Enterprise Linux 7 Server AMD64/Intel 64 版本(带有 Intel VT 或 AMD-V 扩展)的主机。要使用 Red Hat Enterprise Linux 机器作为主机,还必须附加 Red Hat Enterprise Linux 服务器和 Red Hat Virtualization 订阅。

添加主机可能需要一些时间,因为以下步骤由平台完成:虚拟化检查、安装软件包以及创建桥接。使用详情视图监控进程作为主机和管理系统建立连接。

另外,您可以安装一个 Cockpit Web 界面来监控主机的资源并执行管理任务。Cockpit Web 界面为在主机添加到 Red Hat Virtualization Manager 之前执行的任务提供了一个图形用户界面,如配置网络或通过 Terminal 子选项卡运行终端命令。

重要

第三方 watchdog 不应安装在 Red Hat Enterprise Linux 主机上,因为它们可能会影响到 VDSM 提供的 watchdog 守护进程。

2.5.4. Satellite 主机提供程序主机

Satellite 主机提供程序提供的主机也可以用作 Red Hat Virtualization Manager 的虚拟化主机。在将 Satellite 主机提供程序作为外部提供者添加到管理器后,它所提供的任何主机都可添加到 Red Hat Virtualization 中,方式与 Red Hat Virtualization 主机(RHVH)和 Red Hat Enterprise Linux 主机相同。

2.5.5. 主机任务

2.5.5.1. 在 Red Hat Virtualization Manager 中添加标准主机

重要

始终使用 RHV Manager 来修改集群中的主机的网络配置。否则,您可能创建不受支持的配置。详情请查看 Network Manager Stateful Configuration (nmstate)

在您的 Red Hat Virtualization 环境中添加主机可能需要一些时间,因为平台将完成下列步骤:虚拟化检查、软件包安装和创建网桥。

流程

  1. 在管理门户中,单击 Compute Hosts
  2. New
  3. 使用下拉列表为新主机选择 Data CenterHost Cluster
  4. 输入新主机的名称地址。标准 SSH 端口(端口 22)在 SSH Port 字段中自动填充。
  5. 选择用于管理器以访问主机的身份验证方法。

    • 输入 root 用户的密码以使用密码身份验证。
    • 或者,将 SSH PublicKey 字段中显示的密钥复制到主机上的 /root/.ssh/authorized_keys 以使用公钥身份验证。
  6. (可选)点 Advanced Parameters 按钮更改以下高级主机设置:

    • 禁用自动防火墙配置。
    • 添加主机 SSH 指纹以提高安全性。您可以手动添加,或自动获取。
  7. (可选)配置电源管理,其中主机有一个受支持的电源管理卡。有关电源管理配置的详情,请参阅管理指南中的主机电源管理设置说明
  8. 点击 OK

新主机显示在主机列表中,状态为 Installing,您可以在 通知 DrawerEvents 部分查看安装进度( EventsIcon )。在短暂延迟主机状态变为 Up 后。

2.5.5.2. 添加 Satellite 主机提供程序主机

添加 Satellite 主机的过程与添加 Red Hat Enterprise Linux 主机的过程几乎相同,但该主机在 Manager 中标识的方法几乎相同。以下流程概述了如何添加由 Satellite 主机提供程序提供的主机。

流程

  1. 单击 Compute Hosts
  2. 单击 New
  3. 使用下拉菜单为新主机选择 Host Cluster
  4. 选中 Foreman/Satellite 复选框,以显示添加 Satellite 主机提供程序主机的选项,然后选择要从其添加主机的供应商。
  5. 选择 Discovered HostsProvisioned Hosts

    • discovered Hosts (默认选项):从下拉列表中选择主机、主机组和计算资源。
    • 调配的主机 :从 Providers Hosts 下拉列表中选择主机。

      有关可以从外部供应商检索的主机的任何详情都会自动设置,并可以根据需要编辑。

  6. 输入新主机的 NameSSH Port (只适用于置备的主机)。
  7. 选择用于主机的身份验证方法。

    • 输入 root 用户的密码以使用密码身份验证。
    • SSH PublicKey 字段中显示的密钥复制到主机上的 /root/.ssh/authorized_hosts 中,以使用公钥身份验证(仅限会话)。
  8. 您现在已完成添加 Red Hat Enterprise Linux 主机的强制步骤。单击 Advanced Parameters 下拉菜单按钮以显示高级主机设置。

    1. (可选)禁用自动防火墙配置。
    2. (可选)添加主机 SSH 指纹以提高安全性。您可以手动添加,或自动获取。
  9. 您可以使用适用的选项卡配置 Power Management, SPM, Console, 和 Network Provider;但是,由于这些选项卡对于添加 Red Hat Enterprise Linux 主机不是基本,所以此流程中不涉及这些选项卡。
  10. OK 添加主机并关闭窗口。

新主机显示在主机列表中,状态为 Installing,您可以在详情视图中查看安装的进度。安装完成后,状态将更新为 Reboot。必须激活该主机,才能使状态变为 Up

2.5.5.3. 为主机设置卫星勘误表查看

在管理门户中,您可以配置主机来查看 Red Hat Satellite 中的勘误。将主机与 Red Hat Satellite 供应商相关联后,您可以在主机配置仪表板中接收有关可用勘误表及其重要性的更新,并决定何时应用更新。

Red Hat Virtualization 4.4 支持使用 Red Hat Satellite 6.6 查看勘误。

前提条件

  • Satellite 服务器必须添加为外部提供程序。
  • 您要查看勘误表的 Manager 及任何主机都必须通过对应的 FQDN 在卫星服务器中注册。这样可确保外部内容主机 ID 无需在 Red Hat Virtualization 中维护。

    重要

    使用 IP 地址添加的主机无法报告勘误表。

  • 管理主机的 Satellite 帐户必须具有 Administrator 权限和默认的组织设置。
  • 主机必须注册到卫星服务器。
  • 使用 Red Hat Satellite 远程执行来管理主机上的软件包。
注意

Katello 代理已弃用,并将在以后的 Satellite 版本中删除。迁移进程以使用远程执行功能远程更新客户端。

流程

  1. 单击 Compute Hosts,再选择 主机。
  2. Edit
  3. 选中 Use Foreman/Satellite 复选框。
  4. 从下拉列表中选择所需的 Satellite 服务器。
  5. 点击 OK

现在,主机被配置为显示可用的勘误表及其重要信息,它们在用于管理主机的配置的同一仪表板中。

其他资源

2.5.5.3.1. 为 PCI Passthrough 配置主机
注意

这是显示如何在 Red Hat Virtualization 上设置和配置 SR-IOV 的一系列主题中的一个。如需更多信息,请参阅设置和配置 SR-IOV

启用 PCI 透传(passthrough)可让虚拟机使用主机上的设备,就好像设备直接附加到虚拟机一样。要启用 PCI passthrough 功能,您必须启用虚拟化扩展和 IOMMU 功能。以下流程要求您重新引导主机。如果主机已附加到管理器,请务必先将主机置于维护模式。

前提条件

  • 确保主机硬件满足 PCI 设备直通和分配的要求。如需更多信息,请参阅 PCI 设备要求

为 PCI Passthrough 配置主机

  1. 在 BIOS 中启用虚拟化扩展和 IOMMU 扩展。如需更多信息,请参阅 Red Hat Enterprise Linux 虚拟化部署和管理指南中的在 BIOS 中启用 Intel VT-x 和 AMD-V 虚拟化硬件扩展
  2. 在将主机添加到 Manager 或手动编辑 grub 配置文件时,选择 Hostdev Passthrough & SR-IOV 复选框,在内核中启用 IOMMU 标志。

  3. 对于 GPU 直通,您需要在主机和客户机系统上运行其他配置步骤。请参阅 GPU device passthrough: Assigning a host GPU to a single virtual machine in Setting up an NVIDIA GPU for a virtual machine in Red Hat Virtualization

手动启用 IOMMU

  1. 通过编辑 grub 配置文件启用 IOMMU。

    注意

    如果您使用 IBM POWER8 硬件,请跳过此步骤,因为默认启用 IOMMU。

    • 对于 Intel,引导计算机,并在 grub 配置文件中的 GRUB_CMDLINE_LINUX 行的末尾附加 intel_iommu=on

      # vi /etc/default/grub
      ...
      GRUB_CMDLINE_LINUX="nofb splash=quiet console=tty0 ... intel_iommu=on
      ...
    • 对于 AMD,引导计算机,并将 amd_iommu=on 附加到 grub 配置文件中的 GRUB_CMDLINE_LINUX 行的末尾。

      # vi /etc/default/grub
      …​
      GRUB_CMDLINE_LINUX="nofb splash=quiet console=tty0 …​ amd_iommu=on
      …​
      注意

      如果检测到 intel_iommu=on 或 AMD IOMMU,您可以尝试添加 iommu=ptpt 选项只为用于透传的设备启用 IOMMU,并提供更好的主机性能。但是,该选项可能并不在所有硬件上受到支持。如果 pt 选项不适用于您的主机,则恢复先前的选项。

      如果因为硬件不支持中断重新映射而导致 passthrough 失败,您可以考虑启用 allow_unsafe_interrupts 选项(如果虚拟机受信任)。默认情况下不启用 allow_unsafe_interrupts,因为它可能会使主机暴露于来自虚拟机的 MSI 攻击。启用该选项:

      # vi /etc/modprobe.d
      options vfio_iommu_type1 allow_unsafe_interrupts=1
  2. 刷新 grub.cfg 文件并重启主机以使这些更改生效:

    # grub2-mkconfig -o /boot/grub2/grub.cfg
    # reboot
2.5.5.3.2. 为所有虚拟机启用嵌套虚拟化
重要

使用 hook 启用嵌套虚拟化是一项技术预览功能。技术预览功能不被红帽产品服务级别协议(SLA)支持,且可能无法完成。红帽不建议在生产环境中使用它们。这些技术预览功能可以使用户提早试用新的功能,并有机会在开发阶段提供反馈意见。如需更多信息,请参阅红帽技术预览功能支持范围

嵌套虚拟化可让虚拟机托管其他虚拟机。为清楚起见,我们将这些称为父虚拟机嵌套虚拟机

子虚拟机仅对具有父虚拟机权限的用户查看和管理。它们对 Red Hat Virtualization (RHV)管理员不可见。

默认情况下,RHV 中不启用嵌套虚拟化。要启用嵌套虚拟化,您需要在集群中的所有主机上安装 VDSM hook vdsm-hook-nestedvt。然后,在这些主机上运行的所有虚拟机都可以作为父虚拟机运行。

您应该只在支持嵌套虚拟化的主机上运行父虚拟机。如果父虚拟机迁移到不支持嵌套虚拟化的主机,则其子虚拟机将失败。要防止这种情况,请将集群中的所有主机配置为支持嵌套虚拟化。否则,限制父虚拟机迁移到不支持嵌套虚拟化的主机。

警告

采取预防措施,防止父虚拟机迁移到不支持嵌套虚拟化的主机。

流程

  1. 在管理门户中,点 Compute Hosts
  2. 选择您要启用嵌套虚拟化的集群中的主机,然后点 Management MaintenanceOK
  3. 再次选择主机,单击 Host Console,然后登录主机控制台。
  4. 安装 VDSM hook:

    # dnf install vdsm-hook-nestedvt
  5. 重启主机。
  6. 再次登录到主机控制台并验证是否启用了嵌套虚拟化:

    $ cat /sys/module/kvm*/parameters/nested

    如果这个命令返回 Y1,则表示启用了该功能。

  7. 对集群中的所有主机重复此步骤。

其他资源

2.5.5.3.3. 为单独的虚拟机启用嵌套虚拟化
重要

嵌套虚拟化是技术预览功能。技术预览功能不被红帽产品服务级别协议(SLA)支持,且可能无法完成。红帽不建议在生产环境中使用它们。这些技术预览功能可以使用户提早试用新的功能,并有机会在开发阶段提供反馈意见。如需更多信息,请参阅红帽技术预览功能支持范围

嵌套虚拟化可让虚拟机托管其他虚拟机。为清楚起见,我们将这些称为父虚拟机嵌套虚拟机

子虚拟机仅对具有父虚拟机权限的用户查看和管理。它们对 Red Hat Virtualization (RHV)管理员不可见。

要在 特定虚拟机上(而非所有虚拟机)启用嵌套虚拟化,您要将主机或主机配置为支持嵌套虚拟化。然后,您可以在这些特定主机上运行虚拟机或虚拟机并启用 传递主机 CPU。此选项可让虚拟机使用您刚刚在主机上配置的嵌套虚拟设置。这个选项还限制虚拟机可在哪些主机上运行并且需要手动迁移。

否则,要为集群中的所有虚拟机启用嵌套虚拟化,请参阅为所有虚拟机启用嵌套虚拟化

仅在支持嵌套虚拟化的主机上运行父虚拟机。如果您将父虚拟机迁移到不支持嵌套虚拟化的主机,则其子虚拟机将失败。

警告

不要将父虚拟机迁移到不支持嵌套虚拟化的主机。

避免实时迁移运行子虚拟机的父虚拟机。即使源和目标主机都相同,并且支持嵌套虚拟化,实时迁移也会导致子虚拟机失败。相反,请在迁移前关闭虚拟机。

流程

将主机配置为支持嵌套虚拟化:

  1. 在管理门户中,点 Compute Hosts
  2. 选择您要启用嵌套虚拟化的集群中的主机,然后点 Management MaintenanceOK
  3. 再次选择主机,单击 Host Console,然后登录主机控制台。
  4. Edit Host 窗口中,选择 Kernel 选项卡。
  5. 内核引导参数 下,如果复选框问候,请单击 RESET
  6. 选择嵌套虚拟化并单击确定

    此操作在 Kernel 命令行中显示一个 kvm-<architecture>.nested=1 参数。以下步骤将这个参数添加到 Current kernel CMD 行

  7. Installation Reinstall
  8. 当主机状态变为 Up 时,点 Power Management or SSH Management 下的 Management Restart
  9. 验证嵌套虚拟化是否已启用。登录到主机控制台并输入:

    $ cat /sys/module/kvm*/parameters/nested

    如果这个命令返回 Y1,则表示启用了该功能。

  10. 对运行父虚拟机的所有主机重复此步骤。

在特定虚拟机中启用嵌套虚拟化:

  1. 在管理门户中,点 Compute Virtual Machines
  2. 选择虚拟机并点 Edit
  3. Edit Vitual Machine 窗口中,点 Show Advanced Options 并选择 Host 选项卡。
  4. Start Running On 下,点 Specific Host,再选择您配置为支持嵌套虚拟化的主机或主机。
  5. CPU 选项 下,选择 Pass-Through Host CPU。此操作会自动将 Migration 模式设置为只允许手动迁移

    注意

    在 RHV 版本 4.2 中,当选择 不允许迁移时,您只能启用 Pass-Through Host CPU

其他资源

2.5.5.4. 将主机移到维护模式

许多常见的维护任务(包括网络配置和部署软件更新)都需要将主机置于维护模式。在可能导致 VDSM 停止正常工作的事件(如重启或网络或存储问题)之前,主机应置于维护模式。

当主机被置于维护模式时,Red Hat Virtualization Manager 会尝试将所有正在运行的虚拟机都迁移到备用主机。实时迁移应用标准先决条件,特别是集群中必须至少有一个活动主机,且具备相应的容量才可运行迁移的虚拟机。

注意

固定在主机上且无法迁移的虚拟机将被关闭。您可以通过在主机详情视图中的 Virtual Machines 选项卡中点 Pinned to Host 来检查哪些虚拟机被固定到主机。

将主机置于维护模式

  1. 单击 Compute Hosts,再选择所需的主机。
  2. 单击 Management Maintenance。这将打开 Maintenance Host (s) 确认窗口。
  3. (可选)输入将主机置于维护模式的 Reason,该模式将显示在日志中以及主机再次激活时。然后点 OK

    注意

    只有在集群设置中启用时,才会显示主机维护 Reason 字段。如需更多信息 ,请参阅集群常规设置说明

  4. (可选)为支持 Gluster 的主机选择所需选项。

    选择 Ignore Gluster Quorum and Self-Heal Validations 选项以避免默认检查。默认情况下,管理器会检查当主机进入维护模式时是否不会丢失 Gluster 仲裁。管理器还通过将主机移至维护模式,检查是否有可影响的自我修复活动。如果 Gluster 仲裁将丢失,或者有会受到影响的自我修复活动,则管理器会阻止主机进入维护模式。只有当没有将主机置于维护模式时使用这个选项。

    选择 Stop Gluster Service 选项,以停止所有 Gluster 服务,同时将主机移入维护模式。

    注意

    只有所选主机支持 Gluster 时,这些字段才会出现在主机维护窗口中。如需更多信息 ,请参阅替换主 Gluster Storage 节点以维护 Red Hat Hyperconverged Infrastructure

  5. 单击 OK 以启动维护模式。

所有正在运行的虚拟机都迁移到其他主机上。如果主机是存储池管理程序 (SPM),则 SPM 角色将迁移到其他主机。主机的 Status 字段更改为 Preparing for Maintenance,并在操作成功完成时最终变为 Maintenance。当主机处于维护模式时,VDSM 不会停止。

注意

如果有任何虚拟机上的迁移失败,请单击主机上的 Management Activate 停止操作进入维护模式,然后单击虚拟机上的 Cancel Migration 来停止迁移。

2.5.5.5. 从维护模式激活主机

必须先激活已置于维护模式或最近添加到环境中的主机。如果主机未就绪,激活可能会失败;确保在尝试激活主机前完成所有任务。

流程

  1. 单击 Compute Hosts,再选择 主机。
  2. Management Activate

主机状态会更改为 Unassigned,然后在操作完成时最后 启动。虚拟机现在可以在主机上运行。当主机被置于维护模式时,从主机迁移的虚拟机在激活后不会自动迁移到主机,但可以手动迁移。如果主机在进入维护模式之前是存储池管理器 (SPM),则当主机激活时 SPM 角色不会自动返回。

2.5.5.5.1. 配置主机防火墙规则

您可以使用 Ansible 配置主机防火墙规则,使其具有持久性。集群必须配置为使用 firewalld

注意

不支持更改 firewalld 区域。

为主机配置防火墙规则

  1. 在 Manager 计算机上,编辑 ovirt-host-deploy-post-tasks.yml.example 来添加自定义防火墙端口:

    # vi /etc/ovirt-engine/ansible/ovirt-host-deploy-post-tasks.yml.example
    ---
    #
    # Any additional tasks required to be executing during host deploy process can
    # be added below
    #
    - name: Enable additional port on firewalld
      firewalld:
        port: "12345/tcp"
        permanent: yes
        immediate: yes
        state: enabled
  2. 将文件保存为 ovirt-host-deploy-post-tasks.yml

使用更新的防火墙规则配置新的或重新安装的主机。

现有的主机需要通过点 Installation Reinstall 并选择 Automatically configure host firewall 来重新安装。

2.5.5.5.2. 删除主机

有时需要从 Red Hat Virtualization 环境中删除主机,比如重新安装主机时。

流程

  1. 单击 Compute Hosts,再选择 主机。
  2. 单击 Management Maintenance
  3. 主机处于维护模式后,单击 RemoveRemove Host (s) 确认窗口将打开。
  4. 如果主机属于 Red Hat Gluster Storage 集群的一部分,并选择 Force Remove 复选框,并且在其上有卷 brick,或者主机是否不响应。
  5. 点击 OK
2.5.5.5.3. 更新次版本之间的主机

您可以更新集群中的所有主机,或更新单个主机

2.5.5.5.3.1. 更新集群中的所有主机

您可以更新集群中的所有主机,而不是逐一更新主机。这在升级到 Red Hat Virtualization 的新版本时特别有用。如需有关用于自动化更新的 Ansible 角色的更多信息,请参阅 oVirt Cluster Upgrade

一次更新一个集群。

限制

  • 在 RHVH 上,更新仅保留 /etc/var 目录中的修改内容。更新期间会覆盖其他路径中的修改数据。
  • 如果启用了迁移,则虚拟机将自动迁移到集群中的另一主机上。
  • 在自托管引擎环境中,管理器虚拟机只能在同一集群中自托管引擎节点之间迁移。它不能迁移到标准主机。
  • 集群必须有足够的内存供其主机执行维护。否则,虚拟机迁移将挂起且失败。您可以通过在更新主机前关闭部分或所有虚拟机来减少主机更新的内存使用。
  • 您无法将固定的虚拟机(如使用 vGPU 的虚拟机)迁移到另一台主机。固定虚拟机会在更新过程中关闭,除非您选择跳过该主机。

流程

  1. 在管理门户中,点 Compute Clusters 并选择集群。Upgrade status 列显示集群中任何主机的升级是否可用。
  2. 单击 Upgrade
  3. 选择要更新的主机,然后单击 Next
  4. 配置选项:

    • Stop Pinned VMs 会关闭固定到集群中主机的任何虚拟机,这个选项被默认选择。您可以清除此复选框以跳过更新这些主机,从而使固定虚拟机保持运行,例如当固定虚拟机运行重要服务或进程时,您不希望它在更新过程中在未知时间关闭。
    • Upgrade Timeout (Minutes) 设置在集群升级失败并显示超时前等待各个主机更新的时间。默认值为 60。您可以为可能不足 60 分钟的大型集群增加它,或者为主机快速更新的小型集群减少它。
    • Check Upgrade 会在运行升级过程前,检查每个主机是否有可用的更新。默认情况下不选择它,但如果您需要确保包括最新的更新,例如当您配置了 Manager 以检查主机更新少于默认值时,您可以选择它。
    • Reboot After Upgrade 会在更新后重新启动,这会默认选择。如果您确定没有需要主机重新引导的待定更新,您可以清除此复选框来加快进程。
    • 在更新过程中,使用 Maintenance Policy 将集群的调度策略设置为 cluster_maintenance。默认情况下会选择它,因此活动有限,除非为高可用,虚拟机不会启动。如果您有一个自定义调度策略要在更新过程中一直使用,但这可能会产生未知的后果,您可以清除此复选框。在禁用这个选项前,请确保您的自定义策略与集群升级活动兼容。
  5. Next
  6. 检查受影响的主机和虚拟机的摘要。
  7. 单击 Upgrade
  8. 集群升级状态屏幕会显示进度条,显示完成的情况,以及升级过程中的步骤列表。您可以点击 Go to Event Log 打开升级的日志条目。关闭此屏幕不会中断升级过程。

您可以跟踪主机更新的进度:

  • Compute Clusters 视图中,Upgrade Status 列会显示一个进度条,显示完成的百分比。
  • Compute Hosts 视图中
  • Notification DrawerEvents 部分( EventsIcon )。

您可以通过 Compute Virtual Machines 视图中的 Status 栏跟踪各个虚拟机的迁移进度。在大型环境中,您可能需要过滤结果以显示一组特定的虚拟机。

2.5.5.5.3.2. 更新单个主机

使用主机升级管理器直接从管理门户更新各个主机。

注意

升级管理器仅检查状态为 UpNon-operational,但不是 Maintenance 的主机。

限制

  • 在 RHVH 上,更新仅保留 /etc/var 目录中的修改内容。更新期间会覆盖其他路径中的修改数据。
  • 如果启用了迁移,则虚拟机将自动迁移到集群中的另一主机上。在主机使用量相对较低时更新主机。
  • 在自托管引擎环境中,管理器虚拟机只能在同一集群中自托管引擎节点之间迁移。它不能迁移到标准主机。
  • 集群必须有足够的内存供其主机执行维护。否则,虚拟机迁移将挂起且失败。您可以通过在更新主机前关闭部分或所有虚拟机来减少主机更新的内存使用。
  • 您无法将固定的虚拟机(如使用 vGPU 的虚拟机)迁移到另一台主机。在更新主机之前,必须关闭固定虚拟机。

流程

  1. 确保启用了正确的存储库。要查看当前启用的存储库列表,请运行 dnf repolist

    • 对于 Red Hat Virtualization 主机:

      # subscription-manager repos --enable=rhvh-4-for-rhel-8-x86_64-rpms
    • 对于 Red Hat Enterprise Linux 主机:

      # subscription-manager repos \
          --enable=rhel-8-for-x86_64-baseos-eus-rpms \
          --enable=rhel-8-for-x86_64-appstream-eus-rpms \
          --enable=rhv-4-mgmt-agent-for-rhel-8-x86_64-rpms \
          --enable=advanced-virt-for-rhel-8-x86_64-rpms \
          --enable=fast-datapath-for-rhel-8-x86_64-rpms
      
      # subscription-manager release --set=8.6
  2. 在管理门户中,点 Compute Hosts 并选择要更新的主机。
  3. Installation Check for Upgrade 并点 OK

    打开 Notification Drawer ( EventsIcon )并展开 Events 部分来查看结果。

  4. 如果有可用更新,点 Installation Upgrade
  5. OK 来更新主机。运行的虚拟机会根据其迁移策略迁移。如果对任何虚拟机禁用迁移,则会提示您将其关闭。

    主机详情会在 Compute Hosts 中更新,其状态会经历以下阶段:

    Maintenance > Installing > Reboot > Up

    注意

    如果更新失败,主机的状态将变为 Install Failed。在 Install Failed Installation Upgrade

对 Red Hat Virtualization 环境中的每一主机重复此步骤。

注意

您应该从管理门户更新主机。但是,您可以使用 dnf upgrade 来更新主机。

2.5.5.5.3.3. 手动更新主机
小心

此信息适用于需要手动更新主机的高级系统管理员。红帽不支持此方法。本节中描述的程序并没有完全包括重要的步骤,如证书续订。假设对其已有了解。红帽支持使用管理门户更新主机。详情请参阅 Administration Guide 中的 Updating individual hostsUpdating all hosts in a cluster

您可以使用 dnf 命令更新您的主机。定期更新您的系统以确保及时应用安全和漏洞修复。

限制

  • 在 RHVH 上,更新仅保留 /etc/var 目录中的修改内容。更新期间会覆盖其他路径中的修改数据。
  • 如果启用了迁移,则虚拟机将自动迁移到集群中的另一主机上。在主机使用量相对较低时更新主机。
  • 在自托管引擎环境中,管理器虚拟机只能在同一集群中自托管引擎节点之间迁移。它不能迁移到标准主机。
  • 集群必须有足够的内存供其主机执行维护。否则,虚拟机迁移将挂起且失败。您可以通过在更新主机前关闭部分或所有虚拟机来减少主机更新的内存使用。
  • 您无法将固定的虚拟机(如使用 vGPU 的虚拟机)迁移到另一台主机。在更新主机之前,必须关闭固定虚拟机。

流程

  1. 确保启用了正确的存储库。您可以通过运行 dnf repolist 来检查当前启用了哪些存储库。

    • 对于 Red Hat Virtualization 主机:

      # subscription-manager repos --enable=rhvh-4-for-rhel-8-x86_64-rpms
    • 对于 Red Hat Enterprise Linux 主机:

      # subscription-manager repos \
          --enable=rhel-8-for-x86_64-baseos-eus-rpms \
          --enable=rhel-8-for-x86_64-appstream-eus-rpms \
          --enable=rhv-4-mgmt-agent-for-rhel-8-x86_64-rpms \
          --enable=advanced-virt-for-rhel-8-x86_64-rpms \
          --enable=fast-datapath-for-rhel-8-x86_64-rpms
      
      # subscription-manager release --set=8.6
  2. 在管理门户中,点 Compute Hosts 并选择要更新的主机。
  3. Management MaintenanceOK
  4. 对于 Red Hat Enterprise Linux 主机:

    1. 确定 Red Hat Enterprise Linux 的当前版本:

      # cat /etc/redhat-release
    2. 检查哪个版本的 redhat-release 软件包可用:

      # dnf --refresh info --available redhat-release

      此命令显示任何可用的更新。例如,当从 Red Hat Enterprise Linux 8.2.z 升级到 8.3,比较软件包版本和当前安装的版本:

      Available Packages
      Name         : redhat-release
      Version      : 8.3
      Release      : 1.0.el8
      …​
      小心

      Red Hat Enterprise Linux Advanced Virtualization 模块通常比 Red Hat Enterprise Linux y-stream 晚发布。如果没有新的 Advanced Virtualization 模块可用,或者有启用它的错误,在此停止并取消升级。否则,您将面临损坏主机的风险。

    3. 如果 Red Hat Enterprise Linux 8.3 或更高版本有 Advanced Virtualization 流,请重置 virt 模块:

      # dnf module reset virt
      注意

      如果在 Advanced Virtualization 流中已启用此模块,则不需要这一步骤,但它不会造成负面影响。

      您可以输入以下内容来查看流的值:

      # dnf module list virt
    4. 使用以下命令在高级虚拟化流中启用 virt 模块:

      • RHV 4.4.2:

        # dnf module enable virt:8.2
      • RHV 4.4.3 到 4.4.5:

        # dnf module enable virt:8.3
      • 对于 RHV 4.4.6 到 4.4.10:

        # dnf module enable virt:av
      • 对于 RHV 4.4 及更新的版本:

        # dnf module enable virt:rhel
        注意

        从 RHEL 8.6 开始,高级虚拟化软件包将使用标准 virt:rhel 模块。对于 RHEL 8.4 和 8.5,只使用一个高级虚拟化流,rhel:av

  5. 启用 nodejs 模块的版本 14:

    # dnf module -y enable nodejs:14
  6. 更新主机:

    # dnf upgrade --nobest
  7. 重新启动主机,以确保正确应用所有更新。

    注意

    检查基于 img 的日志,以查看是否有其他软件包更新针对 Red Hat Virtualization 主机失败。如果在更新后成功重新安装某些软件包,请检查 /var/imgbased/perted-rpms 中是否列出了软件包。添加任何缺少的软件包,然后运行 rpm -Uvh /var/imgbased/persisted-rpms/*

对 Red Hat Virtualization 环境中的每一主机重复此过程。

2.5.5.5.4. 重新安装主机

从管理门户重新安装 Red Hat Virtualization 主机(RHVH)和 Red Hat Enterprise Linux 主机。该流程包括停止和重启主机。

警告

安装或重新安装主机的操作系统时,红帽强烈建议您先分离附加到主机的任何现有非 OS 存储,以避免意外初始化这些磁盘,从而避免意外初始化这些磁盘,并可能会丢失数据。

前提条件

  • 如果集群启用了迁移,虚拟机可以自动迁移到集群中的另一台主机。因此,在主机使用量相对较低时,重新安装主机。
  • 确保集群有足够的内存来执行维护。如果集群缺少内存,迁移虚拟机将挂起,然后失败。要减少内存用量,请在将主机移至维护之前关闭部分或所有虚拟机。
  • 在执行重新安装前,请确保集群包含多个主机。不要尝试同时重新安装所有主机。个主机必须保持可用才能执行存储池管理程序(SPM)任务。

流程

  1. 单击 Compute Hosts,再选择 主机。
  2. Management MaintenanceOK
  3. Installation Reinstall。这将打开 Install Host 窗口。
  4. 单击确定以 重新安装主机。

重新安装主机并将其状态返回到 启动 后,您可以将虚拟机迁移到主机。

重要

将 Red Hat Virtualization Host 注册到 Red Hat Virtualization Manager 并重新安装它后,管理门户可能会错误地将其状态显示为 Install Failed。单击 Management Activate,主机将更改为 Up 状态并可供使用。

2.5.5.6. 查看主机勘误

主机已配置为从 Red Hat Satellite 服务器接收勘误信息后,可以查看每个主机的勘误信息。有关将主机配置为接收勘误信息的更多信息,请参阅 为主机配置 Satellite 勘误管理

流程

  1. 单击 Compute Hosts
  2. 单击主机的名称。这会打开详情视图。
  3. Errata 选项卡。

2.5.5.7. 查看主机的 Health 状态

除了其常规状态外,主机还具有外部 健康状态。外部健康状态由插件或外部系统报告,或者由管理员设置,并出现在主机名称左侧的以下图标之一:

  • 确定 :无图标
  • infoInfo
  • 警告Warning
  • 错误Error
  • 失败Failure

要查看主机健康状态的更多详情,请点主机的名称。这会打开详情视图,然后点 Events 选项卡。

也可以使用 REST API 查看主机的健康状态。主机上的 GET 请求将包含 external_status 元素,其中包含健康状态。

您可以通过 事件 集合在 REST API 中设置主机健康状态。如需更多信息,请参阅 REST API 指南中的 添加事件

2.5.5.8. 查看主机设备

您可以在详情视图中的 Host Devices 选项卡中查看每个主机的主机设备。如果为直接设备分配配置了主机,则这些设备可以直接附加到虚拟机,以提高性能。

如需有关直接设备分配的硬件要求的更多信息,请参阅 Hardware Considerations for Implementing SR-IOV 中的 Additional Hardware Considerations for Using Device Assignment

有关配置主机以进行直接设备分配的更多信息,请参阅为 PCI Passthrough 主机任务配置主机

有关将主机设备附加到虚拟机的更多信息,请参阅虚拟机管理指南中的主机设备

流程

  1. 单击 Compute Hosts
  2. 单击主机的名称。这会打开详情视图。
  3. 单击 主机设备 选项卡。

此选项卡列出了主机设备的详细信息,包括设备是否附加到虚拟机,并且当前由该虚拟机使用。

2.5.5.9. 从管理门户访问 Cockpit

Cockpit 默认在 Red Hat Virtualization 主机上(RHVH)和 Red Hat Enterprise Linux 主机上可用。您可以通过在浏览器中输入地址或通过管理门户来访问 Cockpit Web 界面。

流程

  1. 在管理门户中,单击 Compute Hosts 并选择主机。
  2. 单击 Host Console

Cockpit 登录页面将在新的浏览器窗口中打开。

2.5.5.9.1. 设置传统 SPICE 密码

SPICE 控制台默认使用 FIPS 兼容加密和密码字符串。默认的 SPICE 密码字符串为: kECDHE+FIPS:kDHE+FIPS:kRSA+FIPS:!eNULL:!aNULL:!aNULL

此字符串通常已足够。但是,如果您的虚拟机具有较旧的操作系统或 SPICE 客户端,其中一个或另一个不支持 FIPS 兼容的加密,则必须使用更弱的密码字符串。否则,如果您在现有集群中安装新集群或新主机并尝试连接到该虚拟机,则可能会出现连接安全错误。

您可以使用 Ansible playbook 更改密码字符串。

更改密码字符串

  1. 在 Manager 计算机上,在 /usr/share/ovirt-engine/playbooks 目录中创建文件。例如:

    # vim /usr/share/ovirt-engine/playbooks/change-spice-cipher.yml
  2. 在文件中输入以下内容并保存它:

    name: oVirt - setup weaker SPICE encryption for old clients
    hosts: hostname
    vars:
      host_deploy_spice_cipher_string: 'DEFAULT:-RC4:-3DES:-DES'
    roles:
      - ovirt-host-deploy-spice-encryption
  3. 运行您刚才创建的文件:

    # ansible-playbook -l hostname /usr/share/ovirt-engine/playbooks/change-spice-cipher.yml

或者,您可以使用带有变量 host_deploy_spice_cipher_string--extra-vars 选项的 Ansible playbook ovirt-host-deploy 重新配置主机:

# ansible-playbook -l hostname \
  --extra-vars host_deploy_spice_cipher_string=”DEFAULT:-RC4:-3DES:-DES” \
  /usr/share/ovirt-engine/playbooks/ovirt-host-deploy.yml

2.5.5.10. 配置主机电源管理设置

配置主机电源管理设备设置,以从管理门户执行主机生命周期操作(停止、启动、重新启动)。

您必须配置主机电源管理,以便使用主机高可用性和虚拟机高可用性。有关电源管理设备的更多信息,请参阅技术参考中的电源管理

流程

  1. 单击 Compute Hosts 并选择一个主机。
  2. 单击 Management Maintenance,然后单击 OK 进行确认。
  3. 当主机处于维护模式时,单击 Edit
  4. Power Management 选项卡。
  5. 选中 Enable Power Management 复选框来启用字段。
  6. 选择 Kdump 集成 复选框以防止在执行内核崩溃转储时隔离主机。

    重要

    如果在现有主机上启用或禁用 Kdump 集成,您必须重新安装主机以便配置 kdump。

  7. (可选)如果您不希望主机的电源管理由主机的集群调度策略控制,请选择 Disable policy control of of power management 复选框。
  8. 单击加号(1)按钮,以添加新的电源管理设备。这会打开 Edit fence agent 窗口。
  9. 在相应的字段中,输入电源管理设备的用户名密码
  10. 从下拉列表中选择电源管理设备类型
  11. Address 字段中输入 IP 地址。
  12. 输入电源管理设备用来与主机通信的 SSH 端口号。
  13. 输入 Slot 编号,用于识别电源管理设备的刀片式。
  14. 输入电源管理设备的 Options。使用以逗号分隔的 'key=value' 条目列表。

    • 如果可以使用 IPv4 和 IPv6 IP 地址(默认),将 Options 字段留空。
    • 如果只能使用 IPv4 IP 地址,输入 inet4_only=1
    • 如果只能使用 IPv6 IP 地址,输入 inet6_only=1
  15. 选中 Secure 复选框,以启用电源管理设备安全地连接到主机。
  16. 单击 Test 以确保设置正确。测试 Succeeded,在 成功验证后,Host Status 为:时会显示。
  17. 点击 OK 关闭 Edit fence agent 窗口。
  18. 电源管理选项卡中,选择展开高级参数,并使用"上移"按钮指定管理器将搜索主机的集群dc(数据中心)用于隔离代理的顺序。
  19. 点击 OK
注意
  • 对于 IPv6,Red Hat Virtualization 仅支持静态寻址。
  • 不支持双栈 IPv4 和 IPv6 地址。

现在,管理门户中启用了 Management Power Management 下拉菜单。

2.5.5.11. 配置主机存储池管理程序设置

存储池管理程序 (SPM) 是针对数据中心中的一个主机的管理角色,用于维护对存储域的访问控制。SPM 必须始终可用,如果 SPM 主机不可用,则 SPM 角色将分配给其他主机。由于 SPM 角色使用部分主机的可用资源,因此优先选择可以负担资源的主机非常重要。

主机的存储池管理器(SPM)优先级设置会改变被分配 SPM 角色的主机的可能性:在主机具有高 SPM 优先级的主机前,将被分配 SPM 角色。

流程

  1. 单击 Compute Hosts
  2. Edit
  3. 单击 SPM 选项卡。
  4. 使用单选按钮为主机选择适当的 SPM 优先级。
  5. 点击 OK
2.5.5.11.1. 将自托管引擎主机迁移到其他集群

您不能将配置为自托管引擎主机的主机迁移到运行自托管引擎虚拟机所在的数据中心或集群。所有自托管引擎主机必须位于同一数据中心和集群中。

您需要通过从主机取消部署自托管引擎配置来禁用主机作为自托管引擎主机。

流程

  1. 单击 Compute Hosts,再选择 主机。
  2. 单击 Management Maintenance。主机的状态更改为 Maintenance
  3. Reinstall 下,选择 Hosted Engine UNDEPLOY
  4. Reinstall

    提示

    或者,也可以使用 REST API undeploy_hosted_engine 参数。

  5. Edit
  6. 选择目标数据中心和集群。
  7. 点击 OK
  8. Management Activate

2.5.6. New Host 和 Edit Host Windows 中的设置和控件的说明

2.5.6.1. 主机常规设置说明

这些设置适用于编辑主机详情或添加新的 Red Hat Enterprise Linux 主机和 Satellite 主机提供程序主机。

General 设置表包含 New HostEdit Host 窗口的常规选项卡上所需的信息。

表 2.20. 常规设置
字段名称Description

主机集群

主机所属的集群和数据中心。

使用 Foreman/Satellite

选择或清除此复选框,以查看或隐藏用于添加由 Satellite 主机提供程序提供的主机的选项。以下选项也可用:

发现的主机

  • 发现的主机 - 填充引擎所发现的卫星主机名称的下拉列表。
  • 主机组 -A 可用主机组的下拉列表。
  • 计算资源 - 提供计算资源的虚拟机监控程序下拉列表。

置备的主机

  • Provider Hosts - 使用所选外部提供者提供的主机名称填充的下拉列表。此列表中的条目按照提供程序搜索过滤器中输入的任何搜索查询过滤。
  • Provider search filter - 允许您搜索所选外部提供者提供的主机的文本字段。这个选项特定于供应商; 请参阅供应商文档来获取有关特定供应商的搜索查询的详情。将此字段留空以查看所有可用的主机。

Name

主机的名称。此文本字段的限制为 40 个字符,且必须是唯一的名称,其中含有大写字母和小写字母、数字、连字符和下划线的任意组合。

注释

用于添加与主机相关的纯文本可读注释的字段。

Hostname

主机的 IP 地址或可解析的主机名。如果使用可解析的主机名,您必须确保解析主机名的所有地址都解析为与主机的管理网络匹配的 IP 地址、IPv4 和 IPv6。

密码

主机的 root 用户的密码。在添加主机时设置密码。之后无法编辑密码。

安装后激活主机

选择这个复选框以在成功安装后激活主机。这默认是启用的,且需要成功激活管理程序。

成功安装后,您可以清除此复选框,将主机状态切换为维护。这样,管理员可以对虚拟机监控程序执行其他配置任务。

安装后重启主机

选中此复选框以在主机安装后重新启动。默认启用。

注意

更改主机的内核命令行参数,或者更改集群的防火墙类型,还需要重新引导主机。

SSH 公钥

将文本框中的内容复制到主机上的 /root/.ssh/authorized_hosts 文件中,以使用 Manager 的 SSH 密钥,而不使用密码来与主机进行身份验证。

自动配置主机防火墙

在添加新主机时,管理器可在主机的防火墙上打开所需的端口。默认启用。这是一个 高级参数

SSH 指纹

您可以 fetch 主机的 SSH 指纹,并将其与预期主机返回的指纹进行比较,确保它们匹配。这是一个 高级参数

2.5.6.2. 主机电源管理设置说明

Power Management 设置表包含新建主机编辑主机窗口的电源管理选项卡上所需的信息。如果主机有一个受支持的电源管理卡,您可以配置电源管理卡。

表 2.21. 电源管理设置
字段名称Description

启用电源管理

启用主机上的电源管理。选中此复选框,以启用 Power Management 选项卡中的其余字段。

kdump 集成

在执行内核崩溃转储时防止主机隔离,以便崩溃转储不会中断。在 Red Hat Enterprise Linux 7.1 及更新的版本中,kdump 会被默认可用。如果主机上的 kdump 可用,但其配置无效(kdump 服务无法启动),启用 Kdump 集成 会导致主机(重新)安装失败。如果在现有主机上启用或禁用 Kdump 集成,则必须重新安装主机

禁用电源管理的策略控制

电源管理由主机的集群调度策略控制。如果启用了电源管理并且达到定义的低利用率值,则管理器将关闭主机机器,并在负载平衡需要或集群中没有足够的可用主机时再次重新启动。选择这个复选框以禁用策略控制。

按不同顺序排列代理

列出主机的隔离代理。隔离代理可以是连续的、并行或两者的组合。

  • 如果按顺序使用隔离代理,则将使用主代理来停止或启动主机,如果失败,则使用二级代理。
  • 如果同时使用隔离代理,则两个隔离代理都必须响应停止主机的 Stop 命令;如果一个代理响应 Start 命令,则主机将启动。

默认情况下,隔离代理是连续的。使用 up 和 down 按钮更改使用隔离代理的顺序。

要使两个隔离代理并发并发,请从其他隔离代理旁的 Concurrent with 下拉列表中选择一个隔离代理。额外的隔离代理可以添加到并发隔离代理组中,方法是从附加隔离代理旁的 Concurrent with 下拉列表中选择组。

添加隔离代理

点击 + 按钮添加新隔离代理。这会打开 Edit fence agent 窗口。有关此窗口中字段的更多信息,请查看下表。

电源管理代理首选项

默认情况下,指定管理器将在与主机相同的集群中搜索隔离代理 ,如果没有找到隔离代理,管理器将在同一 dc(数据中心)中搜索。使用上下和下移按钮来更改使用这些资源的顺序。此字段位于 高级参数 下。

下表包含 Edit fence agent 窗口中所需的信息。

表 2.22. 编辑隔离代理 设置
字段名称Description

地址

访问主机的电源管理设备的地址。可解析的主机名或 IP 地址。

用户名

用于访问电源管理设备的用户帐户。您可以在该设备中设置用户,或使用默认用户。

密码

访问电源管理设备的用户的密码。

类型

主机上的电源管理设备类型。选择以下任意一项:

  • APC - APC MasterSwitch 网络电源开关。不适用于 APC 5.x 电源开关设备。
  • apc_snmp - 与 APC 5.x 电源开关设备一起使用。
  • BladeCenter - IBM Bladecenter Remote Supervisor Adapter。
  • cisco_ucs - Cisco Unified Computing System。
  • drac5 - Dell Remote Access Controller for Dell computers。
  • drac7 - Dell Remote Access Controller for Dell computers。
  • eps - ePowerSwitch 8M+ 网络电源开关。
  • hpblade - HP BladeSystem.
  • ilo, ilo2, ilo3, ilo4 - HP Integrated Lights-Out.
  • ipmilan - Intelligent Platform Management Interface and Sun Integrated Lights Out Management devices。
  • RSA - IBM Remote Supervisor Adapter。
  • rsb - Fujitsu-Siemens RSB 管理界面.
  • WTI - WTI 网络电源交换机.

有关电源管理设备的更多信息,请参阅技术参考中的电源管理

端口

电源管理设备用来与主机通信的端口号。

插槽

用于识别电源管理设备的刀片数。

Service Profile

用于识别电源管理设备的刀片式服务配置文件名称。当设备类型为 cisco_ucs 时,此字段会出现而不是 Slot

选项

电源管理设备特定选项。输入这些内容作为 'key=value'。有关可用选项,请参阅主机电源管理设备的文档。

对于 Red Hat Enterprise Linux 7 主机,如果您使用 cisco_ucs 作为电源管理设备,您还需要将 ssl_insecure=1 附加到 Options 字段中。

安全

选中此复选框,以允许电源管理设备安全地连接到主机。这可以通过 ssh、ssl 或其他验证协议完成,具体取决于电源管理代理。

2.5.6.3. SPM 优先级设置说明

SPM 设置表详述了新建主机编辑主机窗口的 SPM 选项卡上所需的信息。

表 2.23. SPM 设置
字段名称Description

SPM 优先级

定义主机将被授予存储池管理程序 (SPM) 角色的可能性。选项包括 Low, Normal, 和 High 优先级。低优先级意味着被分配 SPM 角色的主机的可能性较小,高优先级意味着会增加的可能性。默认设置为 Normal。

2.5.6.4. 主机控制台设置说明

Console 设置表详细说明了 New HostEdit Host 窗口的 Console 选项卡上所需的信息。

表 2.24. 控制台设置
字段名称Description

覆盖显示地址

选中此复选框来覆盖主机的显示地址。当主机由内部 IP 定义且位于 NAT 防火墙后面时,此功能很有用。当用户从内部网络外连接到虚拟机时,而不是返回运行虚拟机的主机的专用地址时,虚拟机会返回公共 IP 或 FQDN (在外部网络中解析到公共 IP)。

显示地址

此处指定的显示地址将用于此主机上运行的所有虚拟机。地址必须采用完全限定域名或 IP 的格式。

vGPU 放置

指定 vGPU 的首选放置:

  • 整合 :如果您想要在可用物理卡中运行更多 vGPU,则选择此选项。
  • 分隔 :如果您更喜欢在单独的物理卡中运行每个 vGPU,则使用这个选项。

2.5.6.5. 网络供应商设置介绍

Network Provider 设置表详细介绍了 New HostEdit Host 窗口的 Network Provider 选项卡所需的信息。

表 2.25. Network Provider 设置
字段名称Description

外部网络提供程序

如果您添加了外部网络供应商,并且希望该主机的网络由外部网络供应商调配,请从列表中进行选择。

2.5.6.6. 内核设置说明

内核设置表详细介绍了 New HostEdit Host 窗口中的内核选项卡上需要的信息。常见内核引导参数选项被列为复选框,以便您可以轻松选择它们。

对于更复杂的更改,请使用 内核命令行 旁边的免费文本条目字段添加到所需的任何其他参数中。如果更改任何内核命令行参数,则必须 重新安装主机

重要

如果主机附加到 Manager,则必须将主机置于维护模式,然后才能进行更改。进行更改后 ,重新安装主机 以应用更改。

表 2.26. 内核 设置
字段名称Description

hostdev Passthrough 和 SR-IOV

在内核中启用 IOMMU 标志,以便虚拟机可以使用主机设备,就像将其直接附加到虚拟机一样。主机硬件和固件还必须支持 IOMMU。硬件上必须启用虚拟化扩展和 IOMMU 扩展。请参阅为 PCI 传递配置主机。IBM POWER8 默认启用 IOMMU。

嵌套虚拟化

启用 vmxsvm 标志,以便虚拟机可在虚拟机中运行。这个选项是一个技术预览功能:它只用于评估目的。它不可用于生产环境。要使用这个设置,您必须在主机上安装 vdsm-hook-nestedvt hook。详情请参阅启用所有虚拟机的嵌套虚拟化为单独虚拟机启用嵌套虚拟化

不安全的中断

如果启用了 IOMMU,但 passthrough 会失败,因为硬件不支持中断重新映射,您可以考虑启用这个选项。请注意,只有在主机上的虚拟机被信任时,您应该只启用这个选项,但该选项可能会使主机公开到虚拟机的 MSI 攻击。这个选项仅用于在将未认证硬件用于评估时用作临时解决方案。

PCI 预分配

如果您的 SR-IOV NIC 无法因为内存问题而分配虚拟功能,请考虑启用这个选项。主机硬件和固件还必须支持 PCI 实际位置。这个选项仅用于在将未认证硬件用于评估时用作临时解决方案。

将 Nouveau 列入黑名单

阻止 nouveau 驱动程序。nouveau 是 NVIDIA GPU 的社区驱动程序,它与厂商附加的驱动程序冲突。当供应商驱动程序优先考虑时,nouveau 驱动程序应该会被阻止。

SMT Disabled

禁用 Simultaneous Multi Threading (SMT)。禁用 SMT 可缓解安全漏洞(如 L1TF 或 MDS)对系统的影响。

FIPS 模式

启用 FIPS 模式。详情请参阅 启用 FIPS。

内核命令行

此字段允许您将更多内核参数附加到默认参数。

注意

如果内核引导参数灰显,则单击 重置按钮,且可以使用 选项。

2.5.6.7. 托管引擎设置说明

托管引擎设置表详细介绍了新建主机编辑主机窗口的托管引擎选项卡所需的信息。

表 2.27. 托管引擎设置
字段名称Description

选择托管引擎部署操作

有三个选项可用:

  • none - 不需要操作。
  • deploy - 选择此选项以将主机部署为自托管引擎节点。
  • 取消部署 - 对于自托管引擎节点,您可以选择此选项来取消部署主机并移除与自托管引擎相关的配置。

2.5.7. 主机弹性

2.5.7.1. 主机高可用性

Red Hat Virtualization Manager 使用隔离来保持集群中的主机响应。不响应的主机 与非 操作主机 不同。非 Operational 主机可由 Manager 进行通信,但具有不正确的配置,例如缺少的逻辑网络。不响应的主机 不能与管理器通信。

隔离可让集群响应意外的主机故障,并强制进行节能、负载平衡和虚拟机可用性策略。您应该为主机的电源管理设备配置隔离参数,并从时间测试其正确性。在隔离操作中,重启后不响应的主机,如果主机没有在指定时间内返回活动状态,则仍然保持不响应的等待的手动干预和故障排除。

注意

要自动检查隔离参数,您可以配置 PMHealthCheckEnabled (默认为false)和 PMHealthCheckIntervalInSec (默认为 3600 sec)engine-config 选项。

当设置为 true 时,PackpmHealthCheckEnabled 会按照 PMHealthCheckIntervalInSec 指定的时间间隔检查所有主机代理,并在检测到问题时引发警告。有关配置 engine-config 选项的更多信息,请参阅 engine-config 命令语法。

虚拟机管理器可通过 Red Hat Virtualization Manager 在代理主机、代理主机或管理门户中手动执行。在不响应的主机上运行的所有虚拟机均已停止,并且高可用性虚拟机在不同的主机上启动。电源管理操作至少需要两台主机。

管理器启动后,它会自动尝试隔离在静默时间(默认为 5 分钟)后启用了电源管理的不响应的主机。可以通过更新 DisableFenceAtStartupInSec engine-config 选项来配置静默时间。

注意

DisableFenceAtStartupInSec engine-config 选项有助于防止管理器在启动时试图隔离主机的场景。这在数据中心中断后发生,因为主机的引导过程通常比 Manager 引导过程长。

可以使用电源管理参数自动隔离主机主机,或者右键点主机并使用菜单上的选项来手动隔离。

重要

如果主机运行具有高可用性的虚拟机,则必须启用和配置电源管理。

2.5.7.2. Red Hat Virtualization 中的代理电源管理

Red Hat Virtualization Manager 不会直接与隔离代理通信。相反,经理使用代理向主机电源管理设备发送电源管理命令。管理器使用 VDSM 执行电源管理设备操作,因此环境中的另一台主机用作隔离代理。

您可以选择:

  • 任何与需要隔离的主机相同的集群中的主机。
  • 任何与需要隔离的主机在同一数据中心中的主机。

可行的隔离代理主机的状态为 UPMaintenance

2.5.7.3. 在主机上设置隔离参数

主机隔离的参数使用 New HostEdit Host 窗口中的 Power Management 字段进行设置。电源管理使系统能够使用其他接口(如远程访问卡(RAC))隔离问题的主机。

所有电源管理操作都是使用代理主机完成的,而不是由 Red Hat Virtualization Manager 直接使用。电源管理操作至少需要两台主机。

流程

  1. 单击 Compute Hosts,再选择 主机。
  2. Edit
  3. Power Management 选项卡。
  4. 选中 Enable Power Management 复选框来启用字段。
  5. 选择 Kdump 集成 复选框以防止在执行内核崩溃转储时隔离主机。

    重要

    如果在现有主机上启用或禁用 Kdump 集成,则必须重新安装主机

  6. (可选)如果您不希望主机的电源管理由主机的集群的调度策略控制,请选择 Disable policy control of of power management 复选框。
  7. 点击 + 按钮添加新的电源管理设备。这会打开 Edit fence agent 窗口。
  8. 输入电源管理设备的地址用户名密码
  9. 从下拉列表中选择电源管理 设备类型
  10. 输入电源管理设备用来与主机通信的 SSH 端口号。
  11. 输入 Slot 编号,用于识别电源管理设备的刀片式。
  12. 输入电源管理设备的 Options。使用以逗号分隔的 'key=value' 条目列表。
  13. 选中 Secure 复选框,以启用电源管理设备安全地连接到主机。
  14. Test 按钮,以确保设置正确。测试 Succeeded,在 成功验证后,Host Status 为:时会显示。

    警告

    电源管理参数(userid、password、选项等)仅在设置期间和之后手动进行测试。如果您选择忽略有关不正确的参数的警报,或者在没有相应更改 Red Hat Virtualization Manager 的情况下在电源管理硬件上更改参数,那么在大多数需要时,隔离可能会失败。

  15. 点击 OK 关闭 Edit fence agent 窗口。
  16. 电源管理选项卡中,选择展开高级参数,并使用"上移"按钮指定管理器将搜索主机的集群dc(数据中心)用于隔离代理的顺序。
  17. 点击 OK

您返回到主机列表。请注意,主机名旁边的感叹号现已消失,表示电源管理已经配置成功。

2.5.7.4. fence_kdump 高级配置

kdump

点主机的名称在详情视图中的 General 选项卡中查看 kdump 服务的状态:

  • 启用: kdump 已被正确配置,kdump 服务正在运行。
  • 禁用 :kdump 服务没有运行(在这种情况下,kdump 集成无法正常工作)。
  • 未知 :只适用于之前 VDSM 版本的主机没有报告 kdump 状态。

有关安装和使用 kdump 的更多信息,请参阅 Red Hat Enterprise Linux 7 Kernel Crash Dump Guide

fence_kdump

New HostEdit Host 窗口的 Power Management 选项卡中启用 Kdump 集成配置标准 fence_kdump 设置。如果环境的网络配置很简单,且 Manager 的 FQDN 可以在所有主机上可解析,则默认的 fence_kdump 设置就可以使用。

但是,有些情况下,需要高级配置 fence_kdump。更复杂的网络的环境可能需要手动更改 Manager、fence_kdump 侦听程序或两者的配置。例如,如果 Manager 的 FQDN 无法在所有启用了 Kdump 集成 的主机上解析,您可以使用 engine-config 设置正确的主机名或 IP 地址:

engine-config -s FenceKdumpDestinationAddress=A.B.C.D

以下示例用例中可能还需要配置更改:

  • 管理器有两个 NIC,其中其中一个是面向公众的,第二个是 fence_kdump 消息的首选目的地。
  • 您需要在不同的 IP 或端口上执行 fence_kdump 侦听器。
  • 您需要为 fence_kdump 通知消息设置自定义间隔,以防止可能的数据包丢失。

仅为高级用户推荐自定义的 fence_kdump 检测设置,因为只有在更复杂的网络设置中才需要更改默认配置。

2.5.7.5. fence_kdump 侦听器配置

编辑 fence_kdump 侦听器的配置。这只在默认配置不够时才需要。

流程

  1. /etc/ovirt-engine/ovirt-fence-kdump-listener.conf.d/ 中创建一个新文件(例如 my-fence-kdump.conf)。
  2. 使用语法 OPTION= 输入您的自定义,并保存文件。

    重要

    编辑的值也需要在 engine-config 中改变,如在 Manager 中配置 fence-kdump的 fence_kdump Listener Configuration Options 列表所述。

  3. 重启 fence_kdump 侦听器:

    # systemctl restart ovirt-fence-kdump-listener.service

如果需要,可以自定义以下选项:

表 2.28. fence_kdump Listener 配置选项
变量Description默认备注

LISTENER_ADDRESS

定义要接收 fence_kdump 消息的 IP 地址。

0.0.0.0

如果更改了此参数的值,它必须与 engine-config 中的 FenceKdumpDestinationAddress 的值匹配。

LISTENER_PORT

定义要接收 fence_kdump 消息的端口。

7410

如果更改了此参数的值,它必须与 engine-config 中的 FenceKdumpDestinationPort 的值匹配。

HEARTBEAT_INTERVAL

定义监听器的心跳更新间隔(以秒为单位)。

30

如果更改了此参数的值,它的大小必须小于 engine-config 中的 FenceKdumpListenerTimeout 的值。

SESSION_SYNC_INTERVAL

定义将监听器的主机 kdump 会话同步到数据库的时间间隔(以秒为单位)。

5

如果更改了此参数的值,它的大小必须小于 engine-config 中的 KdumpStartedTimeout 的值。

REOPEN_DB_CONNECTION_INTERVAL

定义重新打开之前不可用的数据库连接的时间间隔(以秒为单位)。

30

-

KDUMP_FINISHED_TIMEOUT

定义主机 kdump 流标记为 FINISHED 的主机最后一次收到的消息后的最大超时时间(以秒为单位)。

60

如果更改了此参数的值,它的大小必须加倍于 engine-config 中的 FenceKdumpMessageInterval 的值。

2.5.7.6. 在 Manager 上配置 fence_kdump

编辑 Manager 的 kdump 配置。这只在默认配置不够时才需要。可使用以下方法找到当前的配置值:

# engine-config -g OPTION

流程

  1. 使用 engine-config 命令编辑 kdump 的配置:

    # engine-config -s OPTION=value
    重要

    还必须在 fence_kdump 侦听器配置文件中更改编辑的值,如 Kdump Configuration Options 表中所述。请参阅 fence_kdump 侦听器配置

  2. 重启 ovirt-engine 服务:

    # systemctl restart ovirt-engine.service
  3. 如果需要,重新安装启用了 Kdump 集成 的所有主机(请参阅下表)。

可使用 engine-config 配置以下选项:

表 2.29. kdump 配置选项
变量Description默认备注

FenceKdumpDestinationAddress

定义要向发送 fence_kdump 消息的主机名或 IP 地址。如果为空,则使用 Manager 的 FQDN。

空字符串(使用Manager FQDN)

如果更改了此参数的值,它必须与 fence_kdump 侦听器配置文件中的 LISTENER_ADDRESS 的值匹配,且所有启用了 Kdump 集成 的所有主机都需要被重新安装。

FenceKdumpDestinationPort

定义将 fence_kdump 消息发送到的端口。

7410

如果更改了此参数的值,它必须与 fence_kdump 侦听器配置文件中的 LISTENER_PORT 值匹配,并且必须重新安装启用了 Kdump 集成 的所有主机。

FenceKdumpMessageInterval

定义 fence_kdump 发送的消息之间的间隔(以秒为单位)。

5

如果更改了此参数的值,则必须小于 fence_kdump 侦听器配置文件中的 KDUMP_FINISHED_TIMEOUT 的值的一半,且必须重新安装启用了 Kdump 集成的所有主机。

FenceKdumpListenerTimeout

定义最后心跳后的最大超时时间(以秒为单位),以考虑 fence_kdump 侦听程序处于活动状态。

90

如果更改了此参数的值,它的大小必须加倍于 fence_kdump 侦听器配置文件中的 HEARTBEAT_INTERVAL 的值。

KdumpStartedTimeout

定义在收到 kdumping 主机的第一个信息(检测主机 kdump 流已启动)前等待的最大超时时间(以秒为单位)。

30

如果更改了此参数的值,它的大小必须是 fence_kdump 侦听器配置文件中的 SESSION_SYNC_INTERVAL 的值和 FenceKdumpMessageInterval 的两倍或更大。

2.5.7.7. 软隔离主机

由于意外问题,主机有时可能会变得不响应,但 VDSM 无法响应请求,但依赖于 VDSM 的虚拟机仍保持有效并可访问。在这些情况下,重新启动 VDSM 将返回到响应状态并解决这个问题。

"SSH Soft 隔离"是一个进程,管理器尝试在不响应的主机上通过 SSH 重新启动 VDSM。如果管理器无法通过 SSH 重新启动 VDSM,则隔离的责任将在配置了外部隔离代理时进入外部隔离代理。

通过 SSH 进行软隔离的工作方式如下:必须在主机上配置和启用隔离,并且数据中心必须存在有效的代理主机(第二个主机,处于 UP 状态)。当 Manager 和主机间的连接超时时,会出现以下情况:

  1. 在第一个网络失败时,主机的状态将变为"连接"。
  2. 然后,管理器尝试询问 VDSM 以获得其状态,或者等待主机上负载确定的时间间隔。用于确定间隔长度的公式由配置值 TimeoutToResetVdsInSeconds 配置(默认为 60 秒)+ [DelayResetPerVmInSeconds (默认为 0.5 秒)]*(在主机上运行虚拟机的数量)+ [DelayResetForSpmInSeconds (默认为 20 秒)] * (如果主机为 SPM)运行。为了给 VDSM 给予响应的最大时间,经理可选择上述两个选项的更长时间(三个尝试检索 VDSM 的状态或以上公式决定的间隔)。
  3. 如果主机没有响应该间隔经过的,则 vdsm restart 将通过 SSH 执行。
  4. 如果 vdsm 重启 在主机和 Manager 之间重新建立连接时无法成功,则主机的状态会变为 Non Responsive,如果配置了电源管理,则隔离将移交给外部隔离代理。
注意

通过 SSH 进行软隔离可以在没有配置电源管理的主机上执行。这与"隔离"不同,只能在配置了电源管理的主机上执行。

2.5.7.8. 使用主机电源管理功能

为主机配置了电源管理后,您可以从管理门户界面访问多个选项。虽然每个电源管理设备都有自己的可定制选项,但它们都支持启动、停止和重新启动主机的基本选项。

流程

  1. 单击 Compute Hosts,再选择 主机。
  2. Management 下拉菜单并选择以下 Power Management 选项之一:

    • 重新启动 :此选项将停止主机并等待主机的状态更改为 Down。当代理确认主机已停机时,高可用性虚拟机会在集群中的另一主机上重新启动。然后代理重启这个主机。当主机准备好使用状态时,其状态显示为 Up
    • 启动 :此选项启动主机,并允许它加入群集。当它准备就绪后,其状态显示为 Up
    • 停止 :此选项关闭主机。在使用此选项前,请确保主机上运行的虚拟机已迁移到集群中的其他主机。否则,虚拟机将崩溃,并且只有高可用性虚拟机将在另一主机上重新启动。当主机停止后,其状态显示为 Non-Operational

      注意

      如果没有启用 Power Management,您可以通过选择它来重启或停止主机,点 Management 下拉菜单,然后选择 SSH Management 选项、RestartStop

      重要

      当主机上定义了两个隔离代理时,可以同步或按顺序使用它们。对于并行代理,两个代理都必须响应 Stop 命令,使主机被停止;当一个代理响应 Start 命令时,主机将启动。对于后续代理,要启动或停止主机,首先使用主代理;如果失败,则使用二级代理。

  3. 点击 OK

2.5.7.9. 手动隔离或隔离不响应的主机

如果主机无法预测到不响应状态,例如因为硬件故障,这可能会显著影响环境的性能。如果您没有电源管理设备,或者配置不正确,则可以手动重启主机。

警告

不要选择 Confirm 'Host been Rebooted',除非您已手动重启主机。在主机仍然运行时使用这个选项可能会导致虚拟机镜像崩溃。

流程

  1. 在管理门户中,单击 Compute Hosts,并确认主机的状态为 Nonsponsive
  2. 手动重启主机。这可能意味着,物理输入实验并重启主机。
  3. 在管理门户中,选择主机并点 More Actions ( moreactions ),然后点 Confirm 'Host is Rebooted'
  4. 选择 Approve Operation 复选框,再单击 OK
  5. 如果您的主机需要非常长的时间引导,您可以设置 ServerRebootTimeout 来指定在等待了多少秒之后将主机看做为 Non Responsive

    # engine-config --set ServerRebootTimeout=integer
Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.