第 7 章 使用拓扑管理器
Topology Manager(拓扑管理器)是一个 Kubelet 组件,它从 CPU Manager 和设备管理器收集提示信息(hint),以匹配同一非统一内存访问 (NUMA) 节点上的 pod CPU 和设备资源。
拓扑管理器使用收集来的提示信息中获得的拓扑信息,根据配置的 Topology Manager 策略以及请求的 Pod 资源,决定节点是否被节点接受或拒绝。
拓扑管理器对希望使用硬件加速器来支持对工作延迟有极高要求的操作及高吞吐并发计算的负载很有用。
注意
拓扑管理器是 OpenShift Container Platform 中的一个 alpha 功能。
7.1. 设置拓扑管理器
先决条件
-
将 CPU Manager 策略配置为
static
。请参考扩展和性能文档中的使用 CPU Manager 部分 。
流程
启用 LatencySensitive FeatureGate
# oc edit featuregate/cluster
添加 Feature Set: LatencySensitive 到 spec:
# oc describe featuregate/cluster Name: cluster Namespace: Labels: <none> Annotations: release.openshift.io/create-only: true API Version: config.openshift.io/v1 Kind: FeatureGate Metadata: Creation Timestamp: 2019-10-30T15:06:41Z Generation: 2 Resource Version: 7773803 Self Link: /apis/config.openshift.io/v1/featuregates/cluster UID: b00204ab-cc5e-4ca5-ad93-b9bdd738c1de Spec: Feature Set: LatencySensitive Events: <none>
使用 KubeletConfig 配置 Topology Manager 策略。
以下 YAML 文件示例显示了一个指定的
single-numa-node
策略。apiVersion: machineconfiguration.openshift.io/v1 kind: KubeletConfig metadata: name: cpumanager-enabled spec: machineConfigPoolSelector: matchLabels: custom-kubelet: cpumanager-enabled kubeletConfig: cpuManagerPolicy: static cpuManagerReconcilePeriod: 5s topologyManagerPolicy: single-numa-node 1
- 1
- 指定所选的拓扑管理器策略。
# oc create -f topologymanager-kubeletconfig.yaml