第 5 章 对外部内核参数的重要更改
本章为系统管理员提供了 Red Hat Enterprise Linux 8.9 附带的内核中显著变化的总结。这些更改包括添加或更新的 proc
条目、sysctl
和 sysfs
默认值、引导参数、内核配置选项或者任何可见的行为更改。
新内核参数
- gather_data_sampling=[X86,INTEL]
使用这个内核参数,您可以控制 Gather Data Sampling (GDS)缓解。
(GDS)是一个硬件漏洞,其允许对之前存储在向量寄存器中的数据进行非特权推测访问。
默认情况下,此问题在更新的微码中被缓解。缓解可能会有性能影响,但可以被禁用。在没有微码缓解的系统上,禁用 AVX 服务器作为一种缓解。可用值包括:
-
force
:禁用 AVX ,以缓解没有微码缓解的系统。如果存在微码缓解,则无效。已知在带有 bug 的 AVX 枚举用户空间中会导致崩溃。 -
off
:禁用 GDS 缓解。
-
- rdrand=[X86]
使用这个内核参数,您可以隐藏 RDRAND 支持的广告。这会影响某些 AMD 处理器,因为 BIOS 支持有 bug,特别是围绕挂起或恢复路径。
-
force
:覆盖内核的决定,来隐藏 RDRAND 支持的广告。
-
更新的内核参数
- intel_pstate=[X86]
您可以为 CPU 性能扩展使用此内核参数。可用值包括:
-
disable
- 不启用intel_pstate
作为支持的处理器的默认扩展驱动程序。 -
[NEW]
active
- 使用intel_pstate
驱动程序绕过cpufreq
的扩展调控层,并为 p-state 选择提供自己的算法。在 active 模式下,intel_pstate
提供两种 P-state 选择算法:powersave 和 performance。它们运行的方式取决于硬件管理的 P-states (HWP)功能是否已在处理器中启用了,并可能在处理器型号上也启用了。 -
passive
- 使用intel_pstate
作为扩展驱动程序,但将其配置为与通用cpufreq
调控一起工作(而不是启用其内部调控)。这个模式不能与硬件管理的 P-states (HWP)功能一同使用。 -
force
- 在默认禁止它,而使用acpi-cpufreq
的系统上启用intel_pstate
。强制intel_pstate
驱动程序而不是acpi-cpufreq
可能会禁用平台功能,如热控制和功率封顶,这依赖指示给 OSPM 的 ACPI P-States 信息,因此应谨慎使用。这个选项不能与intel_pstate
驱动程序不支持的处理器一起工作,或不能在使用pcc-cpufreq
而不是acpi-cpufreq
的平台上工作。 -
no_hwp
- 不启用硬件 P 状态控制(HWP)(如果可用)。 -
hwp_only
- 仅在支持硬件 P 状态控制(HWP)的系统上加载intel_pstate
(如果可用)。 -
support_acpi_ppc
- 强制ACPI _PPC
性能限制。如果 Fixed ACPI Description Table 将首选的电源管理配置文件指定为 "Enterprise Server" 或 " Performance Server",则默认打开此功能。 -
per_cpu_perf_limits
- 使用cpufreq sysfs
接口允许每个逻辑 CPU P-State 性能控制限制。
-
- rdt=[HW,X86,RDT]
使用这个内核参数,您可以打开或关闭单个 RDT 功能。列表包括:
cmt
,mbmtotal
,mbmlocal
,l3cat
,l3cdp
,l2cat
,l2cdp
,mba
,[NEW]smba
,[NEW]bmec
.例如,要打开
cmt
并关闭mba
,请使用:rdt=cmt,!mba
- tsc=[x86]
使用这个内核参数,您可以禁用对 TSC 的时钟源稳定性检查。这个参数采用的格式是:
<string>
。-
reliable
:将 tsc 时钟源标记为 reliable,这会在运行时禁用时钟源验证,以及引导时所做的稳定性检查。用于对较旧的硬件和在虚拟化环境中启用高分辨率计时器模式。 -
noirqtime
: 不要使用 TSC 来进行irq
核算。用于在 RDTSC 较慢的任何平台上运行时禁用IRQ_TIME_ACCOUNTING
,这个核算可能会增加开销。 -
unstable
: 将 TSC 时钟源标记为 unstable,这会在引导时将 TSC 标记为 unconditionly unstable ,并避免在 TSC watchdog 通知后出现任何进一步的混乱。 -
nowatchdog
: 禁用时钟源 watchdog。在具有严格的延迟要求的情况下使用(其中来自时钟源 watchdog 的中断是不可接受的)。 -
recalibrate
: 强制在其 TSC 频率是从使用 MSR or CPUID(0x15)的 HW 或 FW 获得的系统上对 HW 计时器(HPET 或 PM 计时器)进行强制重新校准。如果差别超过 500 ppm,则警告。
-
新的 sysctl 参数
- nmi_wd_lpm_factor=(仅限 PPC)
应用到 NMI watchdog 超时的因素(仅在
nmi_watchdog
设置为1
时)。这个因素代表了在 LPM 过程中计算 NMI watchdog 超时时添加到watchdog_thresh
的百分比。软锁定超时不会受到影响。-
值
0
表示没有更改。 -
默认值为
200
表示 NMI watchdog 设置为 30s (基于watchdog_thresh
等于 10)。
-
值
- txrehash
使用这个内核参数,您可以控制对套接字的默认哈希 rethink 行为。
-
如果设为
1
(默认),则在侦听套接字上执行哈希 rethink。 -
如果设为
0,
则不会执行哈希 rethink。
-
如果设为