第 5 章 对外部内核参数的重要更改


本章为系统管理员提供了 Red Hat Enterprise Linux 8.9 附带的内核中显著变化的总结。这些更改包括添加或更新的 proc 条目、sysctlsysfs 默认值、引导参数、内核配置选项或者任何可见的行为更改。

新内核参数

gather_data_sampling=[X86,INTEL]

使用这个内核参数,您可以控制 Gather Data Sampling (GDS)缓解。

(GDS)是一个硬件漏洞,其允许对之前存储在向量寄存器中的数据进行非特权推测访问。

默认情况下,此问题在更新的微码中被缓解。缓解可能会有性能影响,但可以被禁用。在没有微码缓解的系统上,禁用 AVX 服务器作为一种缓解。可用值包括:

  • force :禁用 AVX ,以缓解没有微码缓解的系统。如果存在微码缓解,则无效。已知在带有 bug 的 AVX 枚举用户空间中会导致崩溃。
  • off :禁用 GDS 缓解。
rdrand=[X86]

使用这个内核参数,您可以隐藏 RDRAND 支持的广告。这会影响某些 AMD 处理器,因为 BIOS 支持有 bug,特别是围绕挂起或恢复路径。

  • force :覆盖内核的决定,来隐藏 RDRAND 支持的广告。

更新的内核参数

intel_pstate=[X86]

您可以为 CPU 性能扩展使用此内核参数。可用值包括:

  • disable - 不启用 intel_pstate 作为支持的处理器的默认扩展驱动程序。
  • [NEW] active - 使用 intel_pstate 驱动程序绕过 cpufreq 的扩展调控层,并为 p-state 选择提供自己的算法。在 active 模式下,intel_pstate 提供两种 P-state 选择算法:powersave 和 performance。它们运行的方式取决于硬件管理的 P-states (HWP)功能是否已在处理器中启用了,并可能在处理器型号上也启用了。
  • passive - 使用 intel_pstate 作为扩展驱动程序,但将其配置为与通用 cpufreq 调控一起工作(而不是启用其内部调控)。这个模式不能与硬件管理的 P-states (HWP)功能一同使用。
  • force - 在默认禁止它,而使用acpi-cpufreq的系统上启用 intel_pstate。强制 intel_pstate 驱动程序而不是 acpi-cpufreq 可能会禁用平台功能,如热控制和功率封顶,这依赖指示给 OSPM 的 ACPI P-States 信息,因此应谨慎使用。这个选项不能与 intel_pstate 驱动程序不支持的处理器一起工作,或不能在使用 pcc-cpufreq 而不是 acpi-cpufreq 的平台上工作。
  • no_hwp - 不启用硬件 P 状态控制(HWP)(如果可用)。
  • hwp_only - 仅在支持硬件 P 状态控制(HWP)的系统上加载 intel_pstate (如果可用)。
  • support_acpi_ppc - 强制 ACPI _PPC 性能限制。如果 Fixed ACPI Description Table 将首选的电源管理配置文件指定为 "Enterprise Server" 或 " Performance Server",则默认打开此功能。
  • per_cpu_perf_limits - 使用 cpufreq sysfs 接口允许每个逻辑 CPU P-State 性能控制限制。
rdt=[HW,X86,RDT]

使用这个内核参数,您可以打开或关闭单个 RDT 功能。列表包括:cmt,mbmtotal,mbmlocal,l3cat,l3cdp,l2cat,l2cdp,mba,[NEW] smba,[NEW] bmec.

例如,要打开 cmt 并关闭 mba ,请使用:

rdt=cmt,!mba
tsc=[x86]

使用这个内核参数,您可以禁用对 TSC 的时钟源稳定性检查。这个参数采用的格式是:<string>

  • reliable :将 tsc 时钟源标记为 reliable,这会在运行时禁用时钟源验证,以及引导时所做的稳定性检查。用于对较旧的硬件和在虚拟化环境中启用高分辨率计时器模式。
  • noirqtime: 不要使用 TSC 来进行 irq 核算。用于在 RDTSC 较慢的任何平台上运行时禁用 IRQ_TIME_ACCOUNTING,这个核算可能会增加开销。
  • unstable: 将 TSC 时钟源标记为 unstable,这会在引导时将 TSC 标记为 unconditionly unstable ,并避免在 TSC watchdog 通知后出现任何进一步的混乱。
  • nowatchdog: 禁用时钟源 watchdog。在具有严格的延迟要求的情况下使用(其中来自时钟源 watchdog 的中断是不可接受的)。
  • recalibrate: 强制在其 TSC 频率是从使用 MSR or CPUID(0x15)的 HW 或 FW 获得的系统上对 HW 计时器(HPET 或 PM 计时器)进行强制重新校准。如果差别超过 500 ppm,则警告。

新的 sysctl 参数

nmi_wd_lpm_factor=(仅限 PPC)

应用到 NMI watchdog 超时的因素(仅在 nmi_watchdog 设置为 1时)。这个因素代表了在 LPM 过程中计算 NMI watchdog 超时时添加到 watchdog_thresh 的百分比。软锁定超时不会受到影响。

  • 0 表示没有更改。
  • 默认值为 200 表示 NMI watchdog 设置为 30s (基于 watchdog_thresh 等于 10)。
txrehash

使用这个内核参数,您可以控制对套接字的默认哈希 rethink 行为。

  • 如果设为 1 (默认),则在侦听套接字上执行哈希 rethink。
  • 如果设为 0, 则不会执行哈希 rethink。
Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.