第 1 章 管理 OpenShift Pipelines 性能
如果您的 OpenShift Pipelines 安装同时运行大量任务,则其性能可能会降级。您可能会遇到缓慢和失败的管道运行。
作为参考,在红帽测试中,在 Amazon Web Services (AWS) m6a.2xlarge
节点上运行的三节点 OpenShift Container Platform 集群上,最多有 60 个简单测试管道会同时运行,而不会出现严重故障或延迟。如果更多管道同时运行,失败的管道运行数量、管道运行的平均持续时间、pod 创建延迟、工作队列深度和待处理 pod 的数量增加。此测试是在 Red Hat OpenShift Pipelines 版本 1.13 上执行的;从版本 1.12 中观察到没有统计的区别。
这些结果取决于测试配置。您的配置的性能结果可能会有所不同。
1.1. 提高 OpenShift Pipelines 性能 复制链接链接已复制到粘贴板!
如果您遇到管道运行缓慢或重新当前失败,您可以执行以下步骤来提高 OpenShift Pipelines 的性能。
- 监控 OpenShift Container Platform 集群中运行的 OpenShift Container Platform 集群中的节点的资源使用情况。如果资源使用量很高,请增加节点数。
启用高可用性模式。此模式会影响为任务运行和管道运行创建并启动 pod 的控制器。在红帽测试中,高可用性模式可显著降低管道执行时间,以及创建
TaskRun
资源 CR 到执行任务运行的 pod 启动的延迟。要启用高可用性模式,请在TektonConfig
自定义资源(CR)中进行以下更改:-
将
pipeline.performance.disable-ha
spec 设置为false
。 -
将
pipeline.performance.buckets
spec 设置为5
到10
之间的数字。 将
pipeline.performance.replicas
spec 设置为大于2
的数字,并小于或等于pipeline.performance.buckets
设置。注意您可以尝试不同的存储桶和副本数来观察对性能的影响。一般来说,更高的数字会很有用。监控节点耗尽的资源,包括 CPU 和内存使用率。
-
将