8.17. 虚拟化

在某些情况下，通过 HTTPS 或 SSH 安装虚拟机会失败

目前，当尝试通过 HTTPS 或 SSH 连接从 ISO 源安装客户机操作系统(OS)时，virt-install 工具会失败 - 例如使用 virt-install --cdrom https://example/path/to/image.iso。上述操作意外中止，并显示 internal error: process exited while connecting to monitor 消息，而不是创建虚拟机(VM)。

同样，使用 RHEL 9 web 控制台安装客户机操作系统失败，如果使用 HTTPS 或 SSH URL 或 Download OS 功能，则会显示 Unknown driver 'https' 错误。

临时解决方案：在主机上安装 qemu-kvm-block-curl 和 qemu-kvm-block-ssh 来启用 HTTPS 和 SSH 协议支持。或者，使用不同的连接协议或不同的安装源。

Jira:RHELPLAN-99854^[1]

在虚拟机中使用 NVIDIA 驱动程序会禁用 Wayland

目前，NVIDIA 驱动程序与 Wayland 图形会话不兼容。因此，使用 NVIDIA 驱动程序的 RHEL 客户机操作系统会自动禁用 Wayland 并加载 Xorg 会话。这主要在以下情况下发生：

当您通过 NVIDIA GPU 设备传递给 RHEL 虚拟机(VM)
当您为 RHEL 虚拟机分配 NVIDIA vGPU mediated 设备

当前没有解决此问题的方法。

Jira:RHELPLAN-117234^[1]

在 AMD Milan 系统上有时无法提供 Milan VM CPU 类型

在某些 AMD Milan 系统上，默认在 BIOS 中禁用了增强 REP MOVSB(erms)和 Fast Short REP MOVSB(fsrm)功能标记。因此，在这些系统上可能无法使用 Milan CPU 类型。另外，载具有不同功能标志设置的 Milan 主机之间的虚拟机实时迁移可能会失败。

临时解决方案：在主机的 BIOS 中手动打开 erms 和 fsrm。

Jira:RHELPLAN-119655^[1]

带有故障切换设置的 hostdev 接口在热拔后无法进行热插

从正在运行的虚拟机(VM)中删除带有故障切换配置的 hostdev 网络接口后，该接口目前无法重新连接到同一正在运行的虚拟机。当前没有解决此问题的方法。

Jira:RHEL-7337

带有故障切换 VF 的虚拟机实时复制迁移失败

目前，如果虚拟机使用启用了虚拟功能(VF)故障转移功能的设备，则试图对一个正在运行的虚拟机(VM)进行 post-copy 迁移会失败。

临时解决方案：使用标准迁移类型，而不是复制后迁移。

Jira:RHEL-7335

主机网络无法在实时迁移过程中 ping 使用 VF 的虚拟机

当使用配置的虚拟功能 (VF) 实时迁移虚拟机时，如使用虚拟 SR-IOV 软件的虚拟机，虚拟机的网络不对其它设备看到，如 ping 之类的命令无法访问虚拟机。完成迁移后，问题将不再发生。

Jira:RHEL-7336

禁用 AVX 会导致虚拟机无法引导

在使用具有高级向量扩展(AVX)支持的 CPU 的主机上，尝试引导明确禁用 AVX 的虚拟机当前会失败，并触发虚拟机中的内核 panic。当前没有解决此问题的方法。

Jira:RHELPLAN-97394^[1]

在网络接口重置后，Windows VM 无法获取 IP 地址

有时，Windows 虚拟机在自动网络接口重置后无法获取 IP 地址。因此，虚拟机无法连接到网络。

临时解决方案：在 Windows 设备管理器中禁用和重新启用网络适配器驱动程序。

Jira:RHEL-11366

Windows Server 2016 虚拟机有时会在热插拔 vCPU 后停止工作

目前，将 vCPU 分配给运行 Windows Server 2016 客户机操作系统的虚拟机(VM)可能会导致各种问题，如虚拟机意外终止、变得没有响应或重启。当前没有解决此问题的方法。

Jira:RHELPLAN-63771^[1]

在具有 NVIDIA passthrough 设备的虚拟机上的冗余错误消息

使用带有 RHEL 9.2 及更新版本的操作系统的 Intel 主机机器时，带有直通 NVDIA GPU 设备的虚拟机(VM)会频繁地记录以下错误信息：

Spurious APIC interrupt (vector 0xFF) on CPU#2, should never happen.

但是，这个错误消息不会影响虚拟机的功能，可以忽略。详情请查看红帽知识库。

Jira:RHELPLAN-141042^[1]

在主机上重启 OVS 服务可能会阻止在其上运行的虚拟机的网络连接

当 Open vSwitch (OVS)服务在主机上重启时或崩溃时，在此主机上运行的虚拟机(VM)无法恢复网络设备的状态。因此，虚拟机可能无法完全接收数据包。

此问题只会影响在 virtio 网络堆栈中使用压缩 virtqueue 格式的系统。

临时解决方案：使用 virtio 网络设备定义中的 packed=off 参数来禁用压缩的 virtqueue。当禁用压缩的 virtqueue 时，网络设备的状态在某些情况下可以从 RAM 中恢复。

Jira:RHEL-333

恢复中断的复制后虚拟机迁移可能会失败

如果虚拟机(VM)的复制后迁移中断，然后在同一传入端口上立即恢复，则迁移可能会失败，并显示以下错误 Address already in use

临时解决方案：在恢复后复制迁移或切换到另一个端口进行迁移恢复前至少等待 10 秒。

Jira:RHEL-7096

NUMA 节点映射在 AMD EPYC CPU 上无法正常工作

QEMU 无法正确处理 AMD EPYC CPU 上的 NUMA 节点映射。因此，如果使用 NUMA 节点配置，具有这些 CPU 的虚拟机(VM)的性能可能会受到负面影响。另外，虚拟机在启动过程中会显示类似如下的警告。

sched: CPU #4's llc-sibling CPU #3 is not on the same node! [node: 1 != 0]. Ignoring dependency.
WARNING: CPU: 4 PID: 0 at arch/x86/kernel/smpboot.c:415 topology_sane.isra.0+0x6b/0x80

临时解决方案：不要将 AMD EPYC CPU 用于 NUMA 节点配置。

Jira:RHELPLAN-150884^[1]

PCIe ATS 设备无法在 Windows 虚拟机上工作

当您在带有 Windows 客户机操作系统的虚拟机的 XML 配置中配置 PCIe 地址转换服务(ATS)设备时，在引导虚拟机后，客户机不会启用 ATS 设备。这是因为 Windows 目前不支持 virtio 设备上的 ATS。

如需更多信息，请参阅红帽知识库。

Jira:RHELPLAN-118495^[1]

virsh blkiotune --weight 命令无法设置正确的 cgroup I/O 控制器值

目前，使用 virsh blkiotune --weight 命令设置 VM 权重无法按预期工作。该命令无法在 cgroup I/O 控制器接口文件中设置正确的 io.bfq.weight 值。目前还没有临时解决方案。

Jira:RHELPLAN-83423^[1]

启动带有 NVIDIA A16 GPU 的虚拟机有时会导致主机 GPU 停止工作

目前，如果您启动了一个使用 NVIDIA A16 GPU 直通设备的虚拟机，在某些情况下，主机系统上的 NVIDIA A16 GPU 物理设备会停止工作。

要临时解决这个问题，请重新 hypervisor ,并将 GPU 设备的 reset_method 设置为 bus ：

# echo bus > /sys/bus/pci/devices/<DEVICE-PCI-ADDRESS>/reset_method
# cat /sys/bus/pci/devices/<DEVICE-PCI-ADDRESS>/reset_method
bus

详情请查看红帽知识库。

Jira:RHEL-7212^[1]

Windows 虚拟机可能会因为存储错误而变得无响应

在使用 Windows 客户机操作系统的虚拟机上，在高 I/O 负载下，系统在某些情况下会变得无响应。当发生这种情况时，系统会记录一个 viostor Reset to device, \Device\RaidPort3, was issued 错误。当前没有解决此问题的方法。

Jira:RHEL-1609^[1]

在引导时，带有某些 PCI 设备的 Windows 10 虚拟机可能会变得无响应

目前，如果将具有本地磁盘后端的 virtio-win-scsi PCI 设备被附加到虚拟机，则使用 Windows 10 客户机操作系统的虚拟机(VM)会在启动过程中变得无响应。

临时解决方案：在启用了 multi_queue 选项的情况下引导虚拟机。

Jira:RHEL-1084^[1]

具有内存气球设备集的 Windows 11 虚拟机在重启过程中可能会意外关闭

目前，重新引导使用 Windows 11 客户机操作系统和内存 balloon 设备的虚拟机(VM)在某些情况下会失败，并显示 DRIVER POWER STAT FAILURE 蓝屏错误。

Jira:RHEL-935^[1]

virtio balloon 驱动程序有时无法在 Windows 10 和 Windows 11 虚拟机上工作

在某些情况下，virtio-balloon 驱动程序在使用 Windows 10 或 Windows 11 客户机操作系统的虚拟机(VM)上无法正常工作。因此，此类虚拟机可能无法有效地使用其分配的内存。

Jira:RHEL-12118

virtio 文件系统在 Windows 虚拟机中性能不佳

目前，当在使用 Windows 客户机操作系统的虚拟机(VM)上配置了 virtio 文件系统(virtiofs)时，虚拟机中的 virtiofs 性能比使用 Linux 客户机的虚拟机中的性能要差的多。当前没有解决此问题的方法。

Jira:RHEL-1212^[1]

在 Windows 虚拟机上热拔存储设备可能会失败

在使用 Windows 客户机操作系统的虚拟机(VM)上，当虚拟机运行时删除存储设备（也称为设备热拔）在某些情况下会失败。因此，存储设备一直附加在虚拟机上，磁盘管理器服务可能会变得无响应。当前没有解决此问题的方法。

Jira:RHEL-869

将 CPU 热插到 Windows 虚拟机可能会导致系统失败

当将最大数量的 CPU 热插到启用了巨页的 Windows 虚拟机(VM)时，客户机操作系统可能会崩溃，并显示以下 停止错误 ：

PROCESSOR_START_TIMEOUT

当前没有解决此问题的方法。

Jira:RHEL-1220

在 Windows 虚拟机上更新 virtio 驱动程序可能会失败

当在 Windows 虚拟机(VM)上更新 KVM 半虚拟化(virtio)驱动程序时，更新可能会导致鼠标停止工作，可能无法对新安装的驱动程序签名。当通过从 virtio-win-guest-tools 软件包（其是 virtio-win.iso 文件的一部分）安装来更新 virtio 驱动程序时，此问题会发生。

临时解决方案：使用 Windows 设备管理器更新 virtio 驱动程序。

Jira:RHEL-574^[1]

在使用 vhost-kernel的虚拟机中无法更改 TX 队列大小

目前，您无法在使用 vhost-kernel 作为 virtio 网络驱动程序的后端的 KVM 虚拟机(VM)上设置 TX 队列大小。因此，您只能对 TX 队列使用默认值 256 ，这可能会阻止您优化虚拟机网络吞吐量。当前没有解决此问题的方法。

Jira:RHEL-1138^[1]

虚拟机在 AMD EPYC 型号上错误地报告 spec_rstack_overflow 参数的 vulnerable 状态

当您引导主机时，它不会检测 spec_rstack_overflow 参数中的任何漏洞。查询日志中的参数，它显示消息：

# cat /sys/devices/system/cpu/vulnerabilities/spec_rstack_overflow
Mitigation: Safe RET

在同一主机上引导虚拟机后，虚拟机在 spec_rstack_overflow 参数中检测到一个漏洞。当查询日志中的参数时，它显示消息：

# cat /sys/devices/system/cpu/vulnerabilities/spec_rstack_overflow
Vulnerable: Safe RET, no microcode

但是，这是一个假的警告消息，您可以忽略虚拟机中 /sys/devices/system/cpu/vulnerabilities/spec_rstack_overflow 文件的状态。

Jira:RHEL-17614^[1]

链接状态在虚拟机上显示 up，即使当 e1000e 或 igb 型号接口的状态为 down 时

在引导虚拟机前，为 e1000 或 igb 型号网络接口的以太网链接状态设置为 down。尽管如此，在虚拟机引导后，网络接口保持 up 状态，因为当您将以太网链接状态设置为 down ，然后停止并启动虚拟机时，它会自动设置回 up。因此，不能保持网络接口的正确状态。

临时解决方案：使用以下命令将网络接口状态设置为 down ：

# ip link set dev eth0 down

或者，您可以在虚拟机运行时尝试删除并重新添加此网络接口。

Jira:RHEL-21867

SeaBIOS 无法从具有 4096 个字节扇区大小的磁盘引导

当使用 SeaBIOS 从使用 4096 字节的逻辑或物理扇区大小的磁盘引导虚拟机时，引导磁盘没有显示为可用，引导虚拟机失败。要从这样的磁盘引导虚拟机，请使用 UEFI 而不是 SeaBIOS。

Jira:RHEL-7110

kdump 在带有 AMD SEV-SNP 的虚拟机上失败

目前，kdump 在使用具有安全嵌套的分页(SNP)功能的 AMD Secure Encrypted Virtualization (SEV)的 RHEL 9 虚拟机(VM)上失败。当前没有解决此问题的方法。

Jira:RHEL-10019^[1]

如果每个 CPU 使用超过 128 个核，则 Windows Server 2019 虚拟机在引导时会崩溃

当使用 Windows Server 2019 客户机操作系统的虚拟机在被配置为单个虚拟 CPU (vCPU)使用超过 128 个核时，其目前无法引导。虚拟机会在蓝屏上显示一个停止错误，而不是引导。

临时解决方案：每个 vCPU 使用少于 128 个内核。

Jira:RHELDOCS-18863^[1]

带有 VBS 和 IOMMU 设备的 Windows 虚拟机无法引导

当您引导启用了基于虚拟化安全性(VBS)的 Windows 虚拟机时，使用 qemu-kvm 工具的输入输出内存管理单元(IOMMU)设备时，引导序列只显示引导屏幕，从而导致引导过程不完整。

临时解决方案：确保虚拟机域 XML 被配置为如下：

<features>
  <ioapic driver='qemu'/>
</features>
<devices>
<iommu model='intel'>
   <driver intremap='on' eim='off' aw_bits='48'/>
   <alias name='iommu0'/>
</iommu>
<memballoon model='virtio'>
   <alias name='balloon0'/>
   <address type='pci' domain='0x0000' bus='0x03' slot='0x00' function='0x0'/>
   <driver iommu='on' ats='on'/>
</memballoon>
</devices>

否则，Windows 虚拟机无法引导。

Jira:RHEL-45585^[1]

--migrate-disks-detect-zeroes 选项可能无法用于虚拟机迁移

目前，当在 RHEL 9 上迁移虚拟机时，--migrate-disks-detect-zeroes 选项可能无法正常工作，且迁移可能在没有指定磁盘上的零块检测。这个问题是由 QEMU 中存在一个错误造成的，其中镜像作业依赖于发音漏洞，这会导致稀疏目标文件。

Jira:RHEL-82906

具有大量可引导数据磁盘的虚拟机可能无法启动

如果您试图启动具有大量可引导数据磁盘的虚拟机(VM)，则虚拟机可能无法引导并显示以下错误：有些问题： import_mok_state （）失败：volume Full

临时解决方案：减少可引导数据磁盘的数量，并使用一个系统磁盘。要确保系统磁盘以引导顺序中的第一个，请将 boot order=1 添加到 XML 配置中系统磁盘的设备定义中。例如：

<disk type='file' device='disk'>
  <driver name='qemu' type='qcow2'/>
  <source file='/path/to/disk.qcow2'/>
  <target dev='vda' bus='virtio'/>
  <boot order='1'/>
</disk>

仅为系统磁盘设置引导顺序。

Jira:RHEL-68418

没有配置 discard_granularity 时，发送丢弃 I/O 请求的虚拟机可能会暂停

主机内核无法对齐丢弃 I/O 请求，QEMU 使用 werror= policy 参数响应此类故障。当 werror 设置为 stop:werror=stop 时，失败的丢弃请求会导致虚拟机(VM)暂停。这通常不可取，因为无法纠正这种情况并再次恢复虚拟机。

临时解决方案：确保设置 virtio-blk 和 virtio-scsi 磁盘上的 discard_granularity 参数，并匹配主机的 /sys/block/ <blkdev> /queue/discard_granularity 值。这使得虚拟机了解对齐限制并确保丢弃请求正确对齐，因此它们不会失败。

Jira:RHEL-86032^[1]

如果使用大量 vCPU 分配，Windows 2025 虚拟机会减慢

当分配有 32 个或更多 vCPU 时，Windows Server 2025 虚拟机(VM)在 Red Hat Enterprise Linux 主机上会减慢速度。因此，当虚拟机配置了大量 vCPU 时，Windows 虚拟机可能会在引导期间引导或卡住。

临时解决方案：您可以自行使用临时解决方案。使用少量 vCPU 引导虚拟机，以便在 Windows 服务器上禁用 plaformclock。在具有管理员特权的 shell 提示符中，运行：

bcdedit /set useplatformclock no

然后，关闭虚拟机并使用所需的大量 vCPU 重新配置它。另外，请确保在再次启动大型虚拟机前启用 hv-time 选项。

Jira:RHEL-62742^[1]

virtiofs 共享目录中的打开文件太多可能会使 vrtiofsd 进程崩溃

当从虚拟机(VM)访问带有大量打开文件的 virtiofs 共享目录时，操作可能会失败，并显示以下错误： Too many open files，virtiofsd 进程可能会崩溃。

临时解决方案：尝试以下任一步骤：

以 root 用户身份运行 virtiofsd 并使用 -inode-file-handles=mandatory 命令行选项。
使用 --cache=never 命令行选项。
增加 virtiofsd 的文件描述符数量，可以和-- rlimit-nofile 命令行选项一起使用。

Jira:RHEL-87161^[1]

具有大型内存的虚拟机无法使用 AMD Genoa CPU 在 SEV-SNP 主机上引导

目前，虚拟机(VM)无法使用 4 代 AMD EPYC 处理器（也称为 Genoa）的主机上引导，并启用了 Secure Nested Paging (SEV-SNP)功能的 AMD 安全加密虚拟化。虚拟机中会出现内核 panic，而不是引导。

Jira:RHEL-32892^[1]

安装 VirtIO-Win 捆绑包无法取消

目前，如果您在 Windows 客户机操作系统中从 VirtIO-Win 安装程序捆绑包开始安装 virtio-win 驱动程序，点安装过程中的 Cancel 按钮无法正确中止它。安装程序向导界面显示一个 "Setup Failed" 屏幕，但安装了驱动程序，并重置了客户机的 IP 地址。

Jira:RHEL-53962,JIRA:RHEL-53965

在带有 hypervisor 启动类型的 Sapphire Rapids CPU 上运行的 Windows 虚拟机在重启时无法引导

如果您在 Sapphire Rapids CPU 上运行的 Windows 虚拟机(VM)中将 hypervisor 启动类型设置为 auto，则虚拟机重启后可能无法引导。例如，您可以使用 bcdedit /set hypervisorlaunchtype Auto 命令将 hypervisor 启动类型设置为 auto。

临时解决方案：不要在 Windows 虚拟机中将 hypervisor 启动类型设置为 auto。

Jira:RHEL-67699

使用 VBS 为 Windows 客户机热插拔 vCPU 和内存无法正常工作

目前，基于 Windows Virtualization 的安全(VBS)与热插 CPU 和内存资源不兼容。因此，尝试将内存或 vCPU 附加到启用了 VBS 的运行的 Windows 虚拟机(VM)中，仅在客户机系统重启后将资源添加到虚拟机。

Jira:RHEL-66229, Jira:RHELDOCS-19066

在 IBM Z 上迁移虚拟机有时会删除网络配置

目前，在 IBM Z 主机间迁移虚拟机(VM)后，虚拟机的网络配置在某些情况下是重置，这会导致网络在虚拟机上不可用。要临时解决这个问题，请在启动虚拟机迁移前禁用 vhost-net 服务。

Jira:RHEL-43214^[1]

8.17. 虚拟化

学习

尝试、购买和销售

社区

關於紅帽

让开源更具包容性

关于红帽文档

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links