日志记录

OpenShift Container Platform 4.10

OpenShift Logging 安装、使用和发行注记

Red Hat OpenShift Documentation Team

摘要

本文档提供有关安装、配置和使用 OpenShift Logging 的说明，该 Logging 将汇总多个 OpenShift Container Platform 服务的日志。

第 1 章 Logging 发行注记

注意

Red Hat OpenShift 的日志记录子系统作为一个可安装的组件提供，它与核心 OpenShift Container Platform 不同的发行周期不同。Red Hat OpenShift Container Platform 生命周期政策概述了发行版本兼容性。

注意

stable 频道只为日志记录的最新版本提供更新。要继续获得之前版本的更新，您必须将订阅频道改为 stable-X，其中 X 是您安装的日志记录版本。

1.1. Logging 5.6.11

此发行版本包括 OpenShift Logging 程序错误修复 5.6.11。

1.1.1. 程序错误修复

在此次更新之前，LokiStack 网关会广泛缓存授权请求。因此，这会导致错误的授权结果。在这个版本中，Loki 网关缓存以更精细的方式缓存来解决这个问题。(LOG-4435)

1.1.2. CVE

1.2. Logging 5.6.9

此发行版本包括 OpenShift Logging 程序错误修复 5.6.9。

1.2.1. 程序错误修复

在此次更新之前，当使用多个角色使用带有 AWS Cloudwatch 转发的 STS 进行身份验证时，最近更新会导致凭证不是唯一的。在这个版本中，STS 角色和静态凭证的多个组合可以再次用于与 AWS Cloudwatch 进行身份验证。(LOG-4084)
在此次更新之前，向量收集器偶尔会在日志中出现以下错误信息：thread 'vector-worker' panicked at 'all branch are disabled, no else branch', src/kubernetes/reflector.rs:26:9。在这个版本中，这个错误已解决。(LOG-4276)
在此次更新之前，Loki 为活跃流过滤标签值，但没有删除重复，使 Grafana 的标签浏览器不可用。在这个版本中，Loki 会过滤活跃流的重复标签值，从而解决了这个问题。(LOG-4390)

1.2.2. CVE

1.3. Logging 5.6.8

此发行版本包括 OpenShift Logging 程序错误修复 5.6.8。

1.3.1. 程序错误修复

在此次更新之前，当输入匹配标签值包含 ClusterLogForwarder 中的 / 字符时，向量收集器意外终止。在这个版本中，通过引用 match 标签解决了这个问题，使收集器能够启动和收集日志。(LOG-4091)
在此次更新之前，当在 OpenShift Container Platform Web 控制台中查看日志时，点更多数据可用选项仅在第一次点击时加载更多日志条目。在这个版本中，每次点击时会加载更多条目。(OU-187)
在此次更新之前，当在 OpenShift Container Platform Web 控制台中查看日志时，点 streaming 选项只显示 流传输 日志消息，而无需显示实际日志。在这个版本中，消息和日志流都会正确显示。(OU-189)
在此次更新之前，Loki Operator 会重置错误，导致识别配置问题很难排除故障。在这个版本中，错误会保留，直到配置错误解决为止。(LOG-4158)
在此次更新之前，具有超过 8,000 个命名空间的集群会导致 Elasticsearch 拒绝查询，因为命名空间列表大于 http.max_header_size 设置。在这个版本中，标头大小的默认值有所增加，从而解决了这个问题。(LOG-4278)

1.3.2. CVE

1.4. Logging 5.6.7

此发行版本包括 OpenShift Logging 程序错误修复 5.6.7。

1.4.1. 程序错误修复

在此次更新之前，LokiStack 网关返回命名空间的标签值，而无需应用用户的访问权限。在这个版本中，Loki 网关应用标签值请求的权限，从而解决了这个问题。(LOG-3728)
在此次更新之前，当消息包含时间戳时，日志消息的 time 字段不会默认解析为 Fluentd 中的 structured.time。在这个版本中，如果输出目的地支持，解析的日志消息将包含一个 structured.time 字段。(LOG-4090)
在此次更新之前，LokiStack 路由配置会导致查询运行时间超过 30 秒。在这个版本中，Loki global 和 per-tenant queryTimeout 设置会影响路由超时设置，从而解决了这个问题。(LOG-4130)
在此次更新之前，带有为租户限制定义的值的 LokiStack CR，但没有全局限制会导致 Loki Operator 崩溃。在这个版本中，Operator 可以处理仅定义租户限制的 LokiStack CR，从而解决了这个问题。(LOG-4199)
在此次更新之前，OpenShift Container Platform Web 控制台会在升级后生成错误，因为 web 浏览器保留了之前版本的缓存文件。在这个版本中，这些文件不再被缓存，从而解决了这个问题。(LOG-4099)
在此次更新之前，Vector 在转发到默认 Loki 实例时会生成证书错误。在这个版本中，可以使用 Vector 将日志在没有错误的情况下转发到 Loki。(LOG-4184)
在此次更新之前，当 tls.insecureSkipVerify 选项被设置为 true 时，Cluster Logging Operator API 需要一个由 secret 提供的证书。在这个版本中，Cluster Logging Operator API 不再需要在这样的情形中由 secret 提供证书。以下配置已添加到 Operator 的 CR 中：
```
tls.verify_certificate = false
tls.verify_hostname = false
```
(LOG-4146)

1.4.2. CVE

CVE-2021-26341
CVE-2021-33655
CVE-2021-33656
CVE-2022-1462
CVE-2022-1679
CVE-2022-1789
CVE-2022-2196
CVE-2022-2663
CVE-2022-3028
CVE-2022-3239
CVE-2022-3522
CVE-2022-3524
CVE-2022-3564
CVE-2022-3566
CVE-2022-3567
CVE-2022-3619
CVE-2022-3623
CVE-2022-3625
CVE-2022-3627
CVE-2022-3628
CVE-2022-3707
CVE-2022-3970
CVE-2022-4129
CVE-2022-20141
CVE-2022-25147
CVE-2022-25265
CVE-2022-30594
CVE-2022-36227
CVE-2022-39188
CVE-2022-39189
CVE-2022-41218
CVE-2022-41674
CVE-2022-42703
CVE-2022-42720
CVE-2022-42721
CVE-2022-42722
CVE-2022-43750
CVE-2022-47929
CVE-2023-0394
CVE-2023-0461
CVE-2023-1195
CVE-2023-1582
CVE-2023-2491
CVE-2023-22490
CVE-2023-23454
CVE-2023-23946
CVE-2023-25652
CVE-2023-25815
CVE-2023-27535
CVE-2023-29007

1.5. Logging 5.6.6

此发行版本包括 OpenShift Logging 程序错误修复 5.6.6。

1.5.1. 程序错误修复

在此次更新之前，在将 ClusterLogForwarder 自定义资源配置为写入与有效负载中键匹配的 Kafka 输出主题时，会丢弃信息，因为出现错误。在这个版本中，这个问题已通过在 Fluentd 的缓冲名称前添加一个下划线前缀来解决。(LOG-3458)
在此次更新之前，当内节点被重复使用并且有多个具有相同内节点的条目时，Fluentd 中会出现监控被提早关闭的问题。在这个版本中，在 Fluentd 位置文件中提早关闭监控的问题已解决。(LOG-3629)
在此次更新之前，Fluentd 的 JavaScript 客户端多行异常的检测会失败，从而导致它们以多行打印。在这个版本中，例外会以一行输出，从而解决了这个问题。(LOG-3761)
在此次更新之前，从 Red Hat Openshift Logging Operator 版本 4.6 直接升级到 5.6 版本，从而导致功能问题。在这个版本中，升级范围被限制在两个版本内，从而解决了这个问题。(LOG-3837)
在此次更新之前，Splun 或 Google Logging 输出不会显示指标。在这个版本中，这个问题已通过为 HTTP 端点发送指标来解决。(LOG-3932)
在此次更新之前，当 ClusterLogForwarder 自定义资源被删除时，收集器 Pod 会继续运行。在这个版本中，在不启用日志转发时，收集器 Pod 不会运行。(LOG-4030)
在此次更新之前，无法通过点击并在日志直方图上拖动，在 OpenShift Container Platform Web 控制台中选择时间范围。在这个版本中，可以使用单击和拖动来成功选择时间范围。(LOG-4101)
在此次更新之前，监视文件的 Fluentd 哈希值是使用对日志文件的路径生成的，从而导致日志轮转时没有唯一的哈希值。在这个版本中，监视文件的哈希值使用内节点号创建，从而解决了这个问题。(LOG-3633)
在此次更新之前，点 OpenShift Container Platform Web 控制台中的 Show Resources 链接不会产生任何影响。在这个版本中，通过修复 Show Resources 链接的功能来解决这个问题，以切换每个日志条目的资源显示。(LOG-4118)

1.5.2. CVE

1.6. Logging 5.6.5

此发行版本包括 OpenShift Logging 程序错误修复 5.6.5。

1.6.1. 程序错误修复

在此次更新之前，模板定义会阻止 Elasticsearch 索引一些标签和 namespace_labels，从而导致数据 ingestion 出现问题。在这个版本中，修复替换了标签中的点和斜杠，以确保正确修正、有效地解决问题。(LOG-3419)
在此次更新之前，如果 OpenShift Web 控制台的 Logs 页面无法连接到 LokiStack，则会显示通用错误消息，从而不提供额外的上下文或故障排除建议。在这个版本中，错误消息已被改进，使其包含更具体的故障排除详情和建议。(LOG-3750)
在此次更新之前，时间范围格式不会被验证，从而导致选择自定义日期范围的错误。在这个版本中，时间格式会被验证，允许用户选择有效的范围。如果选择了无效的时间范围格式，则会向用户显示错误消息。(LOG-3583)
在此次更新之前，当在 Loki 中搜索日志时，即使表达式的长度不超过 5120 个字符，查询也会在很多情况下失败。在这个版本中，查询授权标签匹配程序已被优化，从而解决了这个问题。(LOG-3480)
在此次更新之前，Loki Operator 无法生成一个 memberlist 配置，该配置足以在使用 memberlist 进行私有 IP 时查找所有组件。在这个版本中，确保生成的配置包含公告的端口，从而成功查找所有组件。(LOG-4008)

1.6.2. CVE

1.7. Logging 5.6.4

此发行版本包括 OpenShift Logging 程序错误修复 5.6.4。

1.7.1. 程序错误修复

在此次更新之前，当 LokiStack 部署为日志存储时，Loki pod 生成的日志会被收集并发送到 LokiStack。在这个版本中，Loki 生成的日志不包括在集合中，不会存储。(LOG-3280)
在此次更新之前，当 OpenShift Web 控制台的 Logs 页面中的查询编辑器为空时，下拉菜单不会被填充。在这个版本中，如果尝试空查询，会显示错误消息，且下拉菜单现在会如预期填充。(LOG-3454)
在此次更新之前，当 tls.insecureSkipVerify 选项被设置为 true 时，Cluster Logging Operator 会生成不正确的配置。因此，当尝试跳过证书验证时，Operator 无法将数据发送到 Elasticsearch。在这个版本中，Cluster Logging Operator 会生成正确的 TLS 配置，即使启用了 tls.insecureSkipVerify。因此，即使尝试跳过证书验证，数据也可以成功发送到 Elasticsearch。(LOG-3475)
在此次更新之前，当启用结构化解析且消息转发到多个目的地时，它们不会被深度复制。这会导致一些接收的日志，包括结构化消息，而其他日志则没有。在这个版本中，在 JSON 解析前，配置生成已被修改为深度复制信息。因此，所有收到的消息现在都包含结构化消息，即使它们被转发到多个目的地。(LOG-3640)
在此次更新之前，如果 collection 字段包含 {}，可能会导致 Operator 崩溃。在这个版本中，Operator 将忽略这个值，允许 Operator 在不中断的情况下平稳运行。(LOG-3733)
在此次更新之前，LokiiHost 的 Gateway 组件的 nodeSelector 属性没有任何效果。在这个版本中，nodeSelector 属性可以正常工作。(LOG-3783)
在此次更新之前，静态 LokiStack memberlist 配置只依赖于私有 IP 网络。因此，当 OpenShift Container Platform 集群 pod 网络配置了公共 IP 范围时，Lokiition pod 会出现 crashloop。在这个版本中，Loki 管理员可以选择将 pod 网络用于 memberlist 配置。这解决了这个问题，并防止 LokiStack pod 在 OpenShift Container Platform 集群 pod 网络配置了公共 IP 范围时进入 crashloop 状态。(LOG-3814)
在此次更新之前，如果 tls.insecureSkipVerify 字段设置为 true，Cluster Logging Operator 会生成不正确的配置。因此，当尝试跳过证书验证时，Operator 无法将数据发送到 Elasticsearch。在这个版本中，即使启用了 tls.insecureSkipVerify，Operator 也会生成正确的 TLS 配置。因此，即使尝试跳过证书验证，数据也可以成功发送到 Elasticsearch。(LOG-3838)
在此次更新之前，如果 Cluster Logging Operator (CLO) 安装没有 Elasticsearch Operator，则 CLO pod 会持续显示与删除 Elasticsearch 相关的错误消息。在这个版本中，CLO 在显示任何错误消息前执行额外的检查。因此，没有 Elasticsearch Operator 时不再显示与 Elasticsearch 删除相关的错误消息。(LOG-3763)

1.7.2. CVE

1.8. Logging 5.6.3

此发行版本包括 OpenShift Logging 程序错误修复 5.6.3。

1.8.1. 程序错误修复

在此次更新之前，Operator 将网关租户 secret 信息存储在配置映射中。在这个版本中，Operator 将此信息存储在 secret 中。(LOG-3717)
在此次更新之前，Fluentd 收集器不会捕获存储在 /var/log/auth-server/audit.log 中的 OAuth 登录事件。在这个版本中，Fluentd 会捕获这些 OAuth 登录事件，从而解决了这个问题。(LOG-3729)

1.8.2. CVE

1.9. 日志记录 5.6.2

此发行版本包括 OpenShift Logging 程序错误修复 5.6.2。

1.9.1. 程序错误修复

在此次更新之前，收集器没有根据 systemd 日志的优先级正确设置 level 字段。在这个版本中，level 字段会被正确设置。(LOG-3429)
在此次更新之前，Operator 会错误地在 OpenShift Container Platform 4.12 或更高版本上生成不兼容警告。在这个版本中，Operator 最大 OpenShift Container Platform 版本值已被修正，从而解决了这个问题。(LOG-3584)
在此次更新之前，创建一个带有 default 值的 ClusterLogForwarder 自定义资源(CR)不会生成任何错误。在这个版本中，这个值无效生成的错误警告。(LOG-3437)
在此次更新之前，当 ClusterLogForwarder 自定义资源 (CR) 配置了多个管道时，会将一个输出设置为默认，收集器 Pod 会重启。在这个版本中，输出验证的逻辑已被修正，从而解决了这个问题。(LOG-3559)
在此次更新之前，收集器 Pod 在创建后会重启。在这个版本中，部署的收集器不会自行重启。(LOG-3608)
在此次更新之前，补丁版本会从目录中删除了 Operator 的早期版本。这使得无法安装旧版本。这个版本更改了捆绑包配置，以便以前的同一次版本的发行版本保留在目录中。(LOG-3635)

1.9.2. CVE

1.10. Logging 5.6.1

此发行版本包括 OpenShift Logging 程序错误修复 5.6.1。

1.10.1. 程序错误修复

在此次更新之前，紧凑器会在保留活跃时报告 TLS 证书错误与 querier 通信。在这个版本中，紧凑器和 querier 不再通过 HTTP 进行通信。(LOG-3494)
在此次更新之前，Loki Operator 不会重试设置 LokiStack CR 的状态，这会导致过时的状态信息。在这个版本中，Operator 会重试冲突的状态信息更新。(LOG-3496)
在此次更新之前，当 kube-apiserver-operator Operator 检查 Webhook 的有效性时，Loki Operator Webhook 服务器会导致 TLS 错误。在这个版本中，Loki Operator Webhook PKI 由 Operator Lifecycle Manager (OLM) 管理，从而解决了这个问题。(LOG-3510)
在此次更新之前，LokiStack Gateway Labels Enforcer 会在使用带有布尔值表达式的组合标签过滤器时为有效的 LogQL 查询生成解析错误。在这个版本中，LokiStack LogQL 实现支持带有布尔值表达式的标签过滤器，并解决这个问题。(LOG-3441),(LOG-3397)
在此次更新之前，如果多个标签键具有相同的前缀，一些键包含点，则写入 Elasticsearch 的记录将失败。在这个版本中，下划线替换标签键中的点，从而解决了这个问题。(LOG-3463)
在此次更新之前，因为 OpenShift Container Platform 控制台和 logging-view-plugin 之间的不兼容，Red Hat OpenShift Logging Operator 不适用于 OpenShift Container Platform 4.10 集群。在这个版本中，插件可以与 OpenShift Container Platform 4.10 管理控制台正确集成。(LOG-3447)
在此次更新之前，ClusterLogForwarder 自定义资源的协调会错误地报告引用默认日志存储的管道的降级状态。在这个版本中，管道会正确验证。(LOG-3477)

1.10.2. CVE

1.11. Logging 5.6

此版本包括 OpenShift Logging Release 5.6。

1.11.1. 弃用通知

在 Logging 5.6 中，Fluentd 已被弃用，计划在以后的发行版本中删除。红帽将在当前发行生命周期中提供对这个功能的程序漏洞修复和支持，但这个功能将不再获得改进，并将被删除。作为 fluentd 的替代选择，您可以使用 Vector。

1.11.2. 功能增强

在这个版本中，日志记录与 OpenShift Container Platform 集群范围的加密策略兼容。(LOG-895)
在这个版本中，您可以通过 LokiStack 自定义资源（按优先级排序）来为每个租户、每个流和全局策略保留策略声明。(LOG-2695)
在这个版本中，Splun 是日志转发的可用输出选项。(LOG-2913)
在这个版本中，Vector 替换了 Fluentd 作为默认的 Collector。(LOG-2222)
在这个版本中，Developer 角色可以访问在运行 OpenShift Container Platform 4.11 及更高版本的集群中将其分配到的 Log Console Plugin 中的每个项目工作负载日志。(LOG-3388)
在这个版本中，任何源的日志包含一个字段 openshift.cluster_id，它是部署 Operator 的集群的唯一标识符。您可以使用以下命令查看 clusterID 值。(LOG-2715)

$ oc get clusterversion/version -o jsonpath='{.spec.clusterID}{"\n"}'

1.11.3. 已知问题

在此次更新之前，如果多个标签键具有相同的前缀，并且一些键包含 . 字符，则 Elasticsearch 将拒绝日志。这通过将标签键中的 . 替换为 _ 来解决 Elasticsearch 的限制。这个问题的一个临时解决方案是删除导致错误的标签，或向标签添加一个命名空间。(LOG-3463)

1.11.4. 程序错误修复

在此次更新之前，如果您删除了 Kibana 自定义资源，OpenShift Container Platform Web 控制台将继续显示到 Kibana 的链接。在这个版本中，删除 Kibana 自定义资源也会删除该链接。(LOG-2993)
在此次更新之前，用户无法查看其有权访问的命名空间的应用程序日志。在这个版本中，Loki Operator 会自动创建一个集群角色和集群角色绑定，允许用户读取应用程序日志。(LOG-3072)
在此次更新之前，Operator 在使用 LokiStack 作为默认日志存储时删除了 ClusterLogForwarder 自定义资源中定义的任何自定义输出。在这个版本中，Operator 会在处理 ClusterLogForwarder 自定义资源时将自定义输出与默认输出合并。(LOG-3090)
在此次更新之前，CA 密钥用作将 CA 挂载到 Loki 的卷名称，从而导致 CA Key 包含非格式字符（如点）时出现错误状态。在这个版本中，卷名称标准化为一个内部字符串，用于解决这个问题。(LOG-3331)
在此次更新之前，在 LokiStack 自定义资源定义中设置的默认值，会导致无法创建 LokiStack 实例，而无需 ReplicationFactor 为 1。在这个版本中，Operator 为使用的大小设置实际值。(LOG-3296)
在此次更新之前，当启用 JSON 解析时向量解析消息字段，而不定义 structuredTypeKey 或 structuredTypeName 值。在这个版本中，在将结构化日志写入 Elasticsearch 时，structuredTypeKey 或 structuredTypeName 所需的值。(LOG-3195)
在此次更新之前，Elasticsearch Operator 的 secret 创建组件会持续修改的内部 secret。在这个版本中，现有 secret 会被正确处理。(LOG-3161)
在此次更新之前，Operator 可以在 Elasticsearch 或 Kibana 部署改变状态时，输入删除和重新创建收集器 daemonset 的循环。在这个版本中，Operator 状态处理中会解决这个问题。(LOG-3157)
在此次更新之前，Kibana 有一个固定的 24h OAuth cookie 过期时间，当 accessTokenInactivityTimeout 字段被设置为小于 24h 的值时，会导致 Kibana 中的 401 错误。在这个版本中，Kibana 的 OAuth cookie 过期时间与 accessTokenInactivityTimeout 同步，默认值为 24h。(LOG-3129)
在此次更新之前，协调资源的 Operator 常规模式是在尝试获取或更新前尝试和创建，这会导致创建后持续的 HTTP 409 响应。在这个版本中，Operator 会首先尝试检索对象，仅在缺少或未指定对象时创建或更新它。(LOG-2919)
在此次更新之前，Fluentd 中的 .level 和'.structure.level 字段可能包含不同的值。在这个版本中，每个字段的值都相同。(LOG-2819)
在此次更新之前，Operator 不会等待可信 CA 捆绑包填充，并在更新捆绑包后再次部署收集器。在这个版本中，Operator 会在继续收集器部署前，等待简要查看捆绑包是否已填充。(LOG-2789)
在此次更新之前，日志记录遥测信息在检查指标时会出现两次。在这个版本中，日志记录遥测信息会如预期显示。(LOG-2315)
在此次更新之前，Fluentd pod 日志会在启用 JSON 解析添加后包含警告信息。在这个版本中，不会显示警告信息。(LOG-1806)
在此次更新之前，must-gather 脚本无法完成，因为 oc 需要具有写入权限的文件夹来构建其缓存。在这个版本中，oc 对文件夹有写入权限，must-gather 脚本可以成功完成。(LOG-3446)
在此次更新之前，日志收集器 SCC 可以替换为集群上的其他 SCC，从而导致收集器不可用。在这个版本中，设置日志收集器 SCC 的优先级，使其优先于其他 SCC。(LOG-3235)
在此次更新之前，向量缺少字段 sequence，它被添加到 fluentd 中，作为处理缺少实际纳秒精度的方法。在这个版本中，字段 openshift.sequence 已添加到事件日志中。(LOG-3106)

1.11.5. CVE

1.12. Logging 5.5.16

此发行版本包括 OpenShift Logging 程序错误修复 5.5.16。

1.12.1. 程序错误修复

在此次更新之前，LokiStack 网关会广泛缓存授权请求。因此，这会导致错误的授权结果。在这个版本中，Loki 网关缓存以更精细的方式缓存来解决这个问题。(LOG-4434)

1.12.2. CVE

1.13. Logging 5.5.14

此发行版本包括 OpenShift Logging 程序错误修复 5.5.14。

1.13.1. 程序错误修复

在此次更新之前，向量收集器偶尔会在日志中出现以下错误信息：thread 'vector-worker' panicked at 'all branch are disabled, no else branch', src/kubernetes/reflector.rs:26:9。在这个版本中，这个错误已解决。(LOG-4279)

1.13.2. CVE

CVE-2023-2828

1.14. Logging 5.5.13

此发行版本包括 OpenShift Logging 程序错误修复 5.5.13。

1.14.1. 程序错误修复

无。

1.14.2. CVE

1.15. Logging 5.5.11

此发行版本包括 OpenShift Logging 程序错误修复 5.5.11。

1.15.1. 程序错误修复

在此次更新之前，无法通过点击并在日志直方图上拖动，在 OpenShift Container Platform Web 控制台中选择时间范围。在这个版本中，可以使用单击和拖动来成功选择时间范围。(LOG-4102)
在此次更新之前，点 OpenShift Container Platform Web 控制台中的 Show Resources 链接不会产生任何影响。在这个版本中，通过修复 Show Resources 链接的功能来解决这个问题，以切换每个日志条目的资源显示。(LOG-4117)

1.15.2. CVE

CVE-2021-26341
CVE-2021-33655
CVE-2021-33656
CVE-2022-1462
CVE-2022-1679
CVE-2022-1789
CVE-2022-2196
CVE-2022-2663
CVE-2022-2795
CVE-2022-3028
CVE-2022-3239
CVE-2022-3522
CVE-2022-3524
CVE-2022-3564
CVE-2022-3566
CVE-2022-3567
CVE-2022-3619
CVE-2022-3623
CVE-2022-3625
CVE-2022-3627
CVE-2022-3628
CVE-2022-3707
CVE-2022-3970
CVE-2022-4129
CVE-2022-20141
CVE-2022-24765
CVE-2022-25265
CVE-2022-29187
CVE-2022-30594
CVE-2022-36227
CVE-2022-39188
CVE-2022-39189
CVE-2022-39253
CVE-2022-39260
CVE-2022-41218
CVE-2022-41674
CVE-2022-42703
CVE-2022-42720
CVE-2022-42721
CVE-2022-42722
CVE-2022-43750
CVE-2022-47929
CVE-2023-0394
CVE-2023-0461
CVE-2023-1195
CVE-2023-1582
CVE-2023-2491
CVE-2023-23454
CVE-2023-27535

1.16. Logging 5.5.10

此发行版本包括 OpenShift Logging 程序错误修复 5.5.10。

1.16.1. 程序错误修复

在此次更新之前，OpenShift Web 控制台的日志记录视图插件在 LokiStack 无法访问时只显示一个错误文本。在这个版本中，插件会显示正确的错误消息，其中包含如何修复不可访问 LokiStack 的详细信息。(LOG-2874)

1.16.2. CVE

1.17. Logging 5.5.9

此发行版本包括 OpenShift Logging 程序错误修复 5.5.9。

1.17.1. 程序错误修复

在此次更新之前，Fluentd 收集器的问题会导致它不会捕获存储在 /var/log/auth-server/audit.log 中的 OAuth 登录事件。这会导致 OAuth 服务中的登录事件集合不完整。在这个版本中，Fluentd 收集器通过从 OAuth 服务捕获所有登录事件来解决这个问题，包括存储在 /var/log/auth-server/audit.log 中的登录事件。(LOG-3730)
在此次更新之前，当启用结构化解析且消息转发到多个目的地时，它们不会被深度复制。这会导致一些接收的日志，包括结构化消息，而其他日志则没有。在这个版本中，在 JSON 解析前，配置生成已被修改为深度复制信息。因此，所有收到的日志现在都包含结构化消息，即使它们被转发到多个目的地。(LOG-3767)

1.17.2. CVE

1.18. Logging 5.5.8

此发行版本包括 OpenShift Logging 程序错误修复 5.5.8。

1.18.1. 程序错误修复

在此次更新之前，systemd 日志中缺少 priority 字段，因为收集器如何设置 level 字段出错。在这个版本中，这些字段会被正确设置，从而解决了这个问题。(LOG-3630)

1.18.2. CVE

1.19. Logging 5.5.7

此发行版本包括 OpenShift Logging 程序错误修复 5.5.7。

1.19.1. 程序错误修复

在此次更新之前，LokiStack Gateway Labels Enforcer 会在使用带有布尔值表达式的组合标签过滤器时为有效的 LogQL 查询生成解析错误。在这个版本中，LokiStack LogQL 实现支持带有布尔值表达式的标签过滤器，并解决这个问题。(LOG-3534)
在此次更新之前，ClusterLogForwarder 自定义资源(CR)不会将 syslog 输出的 TLS 凭证传递给 Fluentd，从而导致转发过程中出现错误。在这个版本中，凭证可以正确地传递给 Fluentd，从而解决了这个问题。(LOG-3533)

1.19.2. CVE

CVE-2021-46848 CVE-2022-3821 CVE-2022-35737 CVE-2022-42010 CVE-2022-42011 CVE-2022-42012 CVE-2022-42898 CVE-2022-43680

1.20. Logging 5.5.6

此发行版本包括 OpenShift Logging 程序错误修复 5.5.6。

1.20.1. 程序错误修复

在此次更新之前，Pod 安全准入控制器会将标签 podSecurityLabelSync = true 添加到 openshift-logging 命名空间中。这会导致我们指定的安全标签被覆盖，因此 Collector pod 不会启动。在这个版本中，标签 podSecurityLabelSync = false 可保留安全标签。收集器 Pod 按预期部署。(LOG-3340)
在此次更新之前，Operator 会安装 console 视图插件，即使在集群中没有启用它。这会导致 Operator 崩溃。在这个版本中，如果集群的帐户没有启用 console 视图，Operator 会正常运行，且不会安装 console 视图。(LOG-3407)
在此次更新之前，以前的一个用于支持部署没有被更新时进行回归的修复会导致 Operator 崩溃，除非部署了 Red Hat Elasticsearch Operator。在这个版本中，这个问题已被恢复，Operator 现在会稳定，但重新引入了以前的与报告状态相关的问题。(LOG-3428)
在此次更新之前，Loki Operator 只部署 LokiStack 网关的一个副本，而不考虑所选的堆栈大小。在这个版本中，根据所选大小正确配置副本数。(LOG-3478)
在此次更新之前，如果多个标签键具有相同的前缀，一些键包含点，则写入 Elasticsearch 的记录将失败。在这个版本中，下划线替换标签键中的点，从而解决了这个问题。(LOG-3341)
在此次更新之前，日志记录视图插件包含与特定版本的 OpenShift Container Platform 不兼容的功能。在这个版本中，插件的正确发行版本流可以解决这个问题。(LOG-3467)
在此次更新之前，ClusterLogForwarder 自定义资源的协调会错误地报告一个或多个管道的降级状态，从而导致收集器 pod 每 8-10 秒重启。在这个版本中，ClusterLogForwarder 自定义资源进程的协调可以正确地解决这个问题。(LOG-3469)
在此更改 ClusterLogForwarder 自定义资源的 outputDefaults 字段的 spec 之前，会将设置应用到每个声明的 Elasticsearch 输出类型。这会变化可以更正行为，使其与设置专门用于默认受管 Elasticsearch 存储的增强规格匹配。(LOG-3342)
在此次更新之前，OpenShift CLI (oc) must-gather 脚本没有完成，因为 OpenShift CLI (oc)需要一个具有写入权限来构建其缓存的文件夹。在这个版本中，OpenShift CLI (oc) 对文件夹有写入权限，must-gather 脚本可以成功完成。(LOG-3472)
在此次更新之前，Loki Operator Webhook 服务器会导致 TLS 错误。在这个版本中，Loki Operator Webhook PKI 由 Operator Lifecycle Manager 的动态 webhook 管理来管理，从而解决了这个问题。(LOG-3511)

1.20.2. CVE

1.21. Logging 5.5.5

此发行版本包括 OpenShift Logging 程序错误修复 5.5.5。

1.21.1. 程序错误修复

在此次更新之前，Kibana 有一个固定的 24h OAuth cookie 过期时间，当 accessTokenInactivityTimeout 字段被设置为小于 24h 的值时，会导致 Kibana 中的 401 错误。在这个版本中，Kibana 的 OAuth cookie 过期时间与 accessTokenInactivityTimeout 同步，默认值为 24h。(LOG-3305)
在此次更新之前，当启用 JSON 解析时向量解析消息字段，而不定义 structuredTypeKey 或 structuredTypeName 值。在这个版本中，在将结构化日志写入 Elasticsearch 时，structuredTypeKey 或 structuredTypeName 所需的值。(LOG-3284)
在此次更新之前，当出现从此警报表达式返回的一组标签时，FluentdQueueLengthIncreasing 警报可能无法触发。在这个版本中，减少了标签，使其只包含警报所需的标签。(LOG-3226)
在此次更新之前，Loki 不支持连接到断开连接的集群中的外部存储。在这个版本中，容器镜像中包含代理环境变量和代理可信 CA 捆绑包来支持这些连接。(LOG-2860)
在此次更新之前，OpenShift Container Platform Web 控制台用户无法选择包含 Loki 的 CA 证书的 ConfigMap 对象，从而导致 pod 在没有 CA 的情况下运行。在这个版本中，Web 控制台用户可以选择配置映射，从而解决了这个问题。(LOG-3310)
在此次更新之前，CA 密钥用作将 CA 挂载到 Loki 中的卷名称，从而导致 CA 密钥包含非格式字符（如点）时出现错误状态。在这个版本中，卷名称标准化为一个内部字符串，用于解决这个问题。(LOG-3332)

1.21.2. CVE

CVE-2016-3709
CVE-2020-35525
CVE-2020-35527
CVE-2020-36516
CVE-2020-36558
CVE-2021-3640
CVE-2021-30002
CVE-2022-0168
CVE-2022-0561
CVE-2022-0562
CVE-2022-0617
CVE-2022-0854
CVE-2022-0865
CVE-2022-0891
CVE-2022-0908
CVE-2022-0909
CVE-2022-0924
CVE-2022-1016
CVE-2022-1048
CVE-2022-1055
CVE-2022-1184
CVE-2022-1292
CVE-2022-1304
CVE-2022-1355
CVE-2022-1586
CVE-2022-1785
CVE-2022-1852
CVE-2022-1897
CVE-2022-1927
CVE-2022-2068
CVE-2022-2078
CVE-2022-2097
CVE-2022-2509
CVE-2022-2586
CVE-2022-2639
CVE-2022-2938
CVE-2022-3515
CVE-2022-20368
CVE-2022-21499
CVE-2022-21618
CVE-2022-21619
CVE-2022-21624
CVE-2022-21626
CVE-2022-21628
CVE-2022-22624
CVE-2022-22628
CVE-2022-22629
CVE-2022-22662
CVE-2022-22844
CVE-2022-23960
CVE-2022-24448
CVE-2022-25255
CVE-2022-26373
CVE-2022-26700
CVE-2022-26709
CVE-2022-26710
CVE-2022-26716
CVE-2022-26717
CVE-2022-26719
CVE-2022-27404
CVE-2022-27405
CVE-2022-27406
CVE-2022-27950
CVE-2022-28390
CVE-2022-28893
CVE-2022-29581
CVE-2022-30293
CVE-2022-34903
CVE-2022-36946
CVE-2022-37434
CVE-2022-39399

1.22. Logging 5.5.4

此发行版本包括 RHSA-2022:7434-OpenShift Logging 程序错误修复 5.5.4。

1.22.1. 程序错误修复

在此次更新之前，日志记录视图插件的查询解析程序中的错误会导致日志查询的部分部分（如果查询包含大括号 {} ）消失。这会导致查询无效，从而导致为有效查询返回错误。在这个版本中，解析器可以正确地处理这些查询。(LOG-3042)
在此次更新之前，Operator 可以在 Elasticsearch 或 Kibana 部署改变状态时，输入删除和重新创建收集器 daemonset 的循环。在这个版本中，Operator 状态处理中会解决这个问题。(LOG-3049)
在此次更新之前，不会实施警报来支持 Vector 的收集器实现。这个更改会添加 Vector 警报并部署单独的警报，具体取决于所选收集器的实现。(LOG-3127)
在此次更新之前，Elasticsearch Operator 的 secret 创建组件会持续修改的内部 secret。在这个版本中，现有 secret 会被正确处理。(LOG-3138)
在此次更新之前，日志 must-gather 脚本的前重构删除了工件的预期位置。在这个版本中，恢复将工件写入 /must-gather 文件夹的更改。(LOG-3213)
在此次更新之前，在某些集群中，Prometheus exporter 会使用 IPv4 上而不是 IPv6。在这个版本中，Fluentd 会检测 IP 版本，并使用 0.0.0.0 (IPv4) 或 [::] 用于 IPv6。(LOG-3162)

1.22.2. CVE

1.23. 日志记录 5.5.3

此发行版本包括 OpenShift Logging 程序错误修复 5.5.3。

1.23.1. 程序错误修复

在此次更新之前，带有结构化消息的日志条目包含原始消息字段，该字段使条目更大。在这个版本中，删除了结构化日志的 message 字段，以减少增大的大小。(LOG-2759)
在此次更新之前，收集器配置排除了来自 收集器、default-log-store 和 visualization pod 的日志，但无法在 .gz 文件中排除存档的日志。在这个版本中，作为 collector, default-log-store, 和 visualization pod 的 .gz 存储的归档日志也会被排除。(LOG-2844)
在此次更新之前，当请求通过网关发送对不可用 pod 的请求时，不会警告中断。在这个版本中，如果网关在完成写入或读取请求时遇到问题，则单个警报将生成。(LOG-2884)
在此次更新之前，pod 元数据可以被流畅的插件更改，因为通过管道传递的值通过引用。此更新可确保每个日志消息接收 pod 元数据的副本，以便每个消息进程都可以独立使用。(LOG-3046)
在此次更新之前，在 OpenShift Console Logs 视图中选择 unknown severity 排除了 level=unknown 值的日志。在这个版本中，根据未知严重性进行过滤时，可以查看没有级别以及带有 level=unknown 的日志。(LOG-3062)
在此次更新之前，发送到 Elasticsearch 的日志记录有一个名为 write-index 的额外字段，其中包含发送日志所需的索引名称。此字段不是数据模型的一部分。在这个版本中，这个字段将不再发送。(LOG-3075)
随着新的内置 Pod Security Admission Controller 的推出，根据全局或命名空间级别定义的强制安全标准没有配置 Pod。在这个版本中，Operator 和收集器允许特权执行并运行，而不出现安全审计警告或错误。(LOG-3077)
在此次更新之前，Operator 在使用 LokiStack 作为默认日志存储时删除了 ClusterLogForwarder 自定义资源中定义的任何自定义输出。在这个版本中，Operator 会在处理 ClusterLogForwarder 自定义资源时将自定义输出与默认输出合并。(LOG-3095)

1.23.2. CVE

1.24. Logging 5.5.2

此发行版本包括 OpenShift Logging 程序错误修复 5.5.2。

1.24.1. 程序错误修复

在此次更新之前，Fluentd 收集器的警报规则不遵循 OpenShift Container Platform 监控风格的准则。此更新会修改这些警报，使其包含命名空间标签，从而解决了这个问题。(LOG-1823)
在此次更新之前，索引管理滚动脚本会在索引名称中有多个连字符时生成新的索引名称。在这个版本中，索引名称会正确生成。(LOG-2644)
在此次更新之前，Kibana 路由会在没有证书的情况下设置 caCertificate 值。在这个版本中，不会设置 caCertificate 值。(LOG-2661)
在此次更新之前，收集器依赖项的更改会导致它为未使用的参数发出警告消息。在这个版本中，删除未使用的配置参数可以解决这个问题。(LOG-2859)
在此次更新之前，为 Loki Operator 创建的部署创建的 pod 被错误地调度到没有 Linux 操作系统的节点（如果这些节点已在运行 Operator 的集群中可用）。在这个版本中，Operator 将额外的 node-selector 附加到 pod 定义，该定义仅允许将 pod 调度到基于 Linux 的节点上。(LOG-2895)
在此次更新之前，OpenShift 控制台日志视图不会根据严重性过滤日志，因为 LokiStack 网关中存在 LogQL 解析器问题。在这个版本中，解析器修复了这个问题，OpenShift Console Logs 视图可以根据严重性进行过滤。(LOG-2908)
在此次更新之前，重构 Fluentd 收集器插件会删除事件的时间戳字段。在这个版本中，恢复从事件收到的时间提供的 timestamp 字段。(LOG-2923)
在此次更新之前，审计日志中没有 level 字段会导致向量日志出现错误。在这个版本中，在审计日志记录中添加 level 字段可以解决这个问题。(LOG-2961)
在此次更新之前，如果您删除了 Kibana 自定义资源，OpenShift Container Platform Web 控制台将继续显示到 Kibana 的链接。在这个版本中，删除 Kibana 自定义资源也会删除该链接。(LOG-3053)
在此次更新之前，当 ClusterLogForwarder 自定义资源定义了 JSON 解析时，每个 rollover 任务都会创建空索引。在这个版本中，新的索引不为空。(LOG-3063)
在此次更新之前，当用户在 Loki Operator 5.5 更新后删除了 LokiStack 时，最初由 Loki Operator 5.4 创建的资源仍保留。在这个版本中，资源的 owner-references 指向 5.5 LokiStack。(LOG-2945)
在此次更新之前，用户无法查看其有权访问的命名空间的应用程序日志。在这个版本中，Loki Operator 会自动创建一个集群角色和集群角色绑定，允许用户读取应用程序日志。(LOG-2918)
在此次更新之前，具有 cluster-admin 特权的用户无法使用日志记录控制台正确查看基础架构和审计日志。在这个版本中，授权检查已被扩展，还可将 cluster-admin 和 dedicated-admin 组中的用户识别为 admins。(LOG-2970)

1.24.2. CVE

1.25. Logging 5.5.1

此发行版本包括 OpenShift Logging 程序错误修复 5.5.1。

1.25.1. 功能增强

当日志记录控制台（Logging Console）插件被使用时，此增强会将 Aggregated Logs 选项卡添加到 OpenShift Container Platform Web 控制台的 Pod Details 页面中。此功能增强仅适用于 OpenShift Container Platform 4.10 及更新的版本。(LOG-2647)
此功能增强将 Google Cloud Logging 添加为日志转发的输出选项。(LOG-1482)

1.25.2. 程序错误修复

在此次更新之前，Operator 无法确保 pod 就绪，这会导致集群在集群重启过程中达到可操作的状态。在这个版本中，Operator 会在重启过程中进入新 pod 前将新 pod 标记为 ready，这会解决这个问题。(LOG-2745)
在此次更新之前，Fluentd 有时无法识别 Kubernetes 平台轮转日志文件，且不会读取日志消息。在这个版本中，通过设置上游开发团队所推荐的配置参数修正。(LOG-2995)
在此次更新之前，添加多行错误检测会导致内部路由更改并将记录转发到错误的目的地。在这个版本中，内部路由正确。(LOG-2801)
在此次更新之前，更改 OpenShift Container Platform Web 控制台的刷新间隔会在 Query 字段为空时造成错误。在这个版本中，当 Query 字段为空时，更改间隔不是可用的选项。(LOG-2917)

1.25.3. CVE

1.26. Logging 5.5

以下公告可用于 Logging 5.5:发行版本 5.5

1.26.1. 功能增强

在这个版本中，您可以将来自同一 pod 的不同容器的结构化日志转发到不同的索引。要使用此功能，您必须使用多容器支持配置管道并注解 pod。(LOG-1296)

重要

日志的 JSON 格式化因应用程序而异。因为创建太多索引会影响性能，所以请限制使用此功能，仅对与 JSON 格式不兼容的日志创建索引。使用查询将日志与不同命名空间分离，或使用兼容 JSON 格式的应用程序进行隔离。

在这个版本中，您可以使用 Kubernetes 的普通标签，app.kubernetes.io/component, app.kubernetes.io/managed-by, app.kubernetes.io/part-of, 和 app.kubernetes.io/version 来过滤 Elasticsearch 输出的日志。非 Elasticsearch 输出类型可以使用 kubernetes.labels 中包含的所有标签。(LOG-2388)
在这个版本中，启用了 AWS Security Token Service (STS) 的集群可能会使用 STS 验证将日志转发到 Amazon CloudWatch。(LOG-1976)
在这个版本中，"LokiOperator" Operator 和 Vector 收集器从技术预览变为正式发布 (GA)。与之前版本相关的全部仍处于会待处理的状态，一些 API 仍为技术预览。详情请参阅 带有 LokiStack 的日志记录部分。

1.26.2. 程序错误修复

在此次更新之前，配置为将日志转发到 Amazon CloudWatch 的集群会将拒绝的日志文件写入到临时存储，从而导致集群变得不稳定。在这个版本中，所有存储选项的块备份已被禁用，从而解决了这个问题。(LOG-2746)
在此次更新之前，Operator 使用的一些 API 的版本已弃用，并计划在以后的 OpenShift Container Platform 版本中删除。在这个版本中，依赖项被移到受支持的 API 版本。(LOG-2656)

在此次更新之前，Operator 使用的一些 API 的版本已弃用，并计划在以后的 OpenShift Container Platform 版本中删除。在这个版本中，依赖项被移到受支持的 API 版本。(LOG-2656)

在此次更新之前，为多行错误检测配置了多个 ClusterLogForwarder 管道，会导致收集器进入 crashloopbackoff 错误状态。在这个版本中解决了这个问题，多个配置部分具有相同的唯一 ID。(LOG-2241)
在此次更新之前，收集器无法将非 UTF-8 符号保存到 Elasticsearch 存储日志中。在这个版本中，收集器对非 UTF-8 符号进行编码，从而解决此问题。(LOG-2203)
在此次更新之前，非拉丁字符在 Kibana 中无法正确显示。在这个版本中，Kibana 可以正确地显示所有有效的 UTF-8 字符。(LOG-2784)

1.26.3. CVE

1.27. Logging 5.4.14

此发行版本包括 OpenShift Logging 程序错误修复 5.4.14。

1.27.1. 程序错误修复

无。

1.27.2. CVE

1.28. Logging 5.4.13

此发行版本包括 OpenShift Logging 程序错误修复 5.4.13。

1.28.1. 程序错误修复

在此次更新之前，Fluentd 收集器的问题会导致它不会捕获存储在 /var/log/auth-server/audit.log 中的 OAuth 登录事件。这会导致 OAuth 服务中的登录事件集合不完整。在这个版本中，Fluentd 收集器通过从 OAuth 服务捕获所有登录事件来解决这个问题，包括存储在 /var/log/auth-server/audit.log 中的登录事件。(LOG-3731)

1.28.2. CVE

1.29. Logging 5.4.12

此发行版本包括 OpenShift Logging 程序错误修复 5.4.12。

1.29.1. 程序错误修复

无。

1.29.2. CVE

1.30. Logging 5.4.11

此发行版本包括 OpenShift Logging 程序错误修复 5.4.11。

1.30.1. 程序错误修复

1.30.2. CVE

1.31. Logging 5.4.10

此发行版本包括 OpenShift Logging 程序错误修复 5.4.10。

1.31.1. 程序错误修复

无。

1.31.2. CVE

1.32. 日志记录 5.4.9

此发行版本包括 OpenShift Logging 程序错误修复 5.4.9。

1.32.1. 程序错误修复

在此次更新之前，Fluentd 收集器会警告未使用的配置参数。在这个版本中，删除了这些配置参数及其警告信息。(LOG-3074)
在此次更新之前，Kibana 有一个固定的 24h OAuth cookie 过期时间，当 accessTokenInactivityTimeout 字段被设置为小于 24h 的值时，会导致 Kibana 中的 401 错误。在这个版本中，Kibana 的 OAuth cookie 过期时间与 accessTokenInactivityTimeout 同步，默认值为 24h。(LOG-3306)

1.32.2. CVE

CVE-2016-3709
CVE-2020-35525
CVE-2020-35527
CVE-2020-36516
CVE-2020-36558
CVE-2021-3640
CVE-2021-30002
CVE-2022-0168
CVE-2022-0561
CVE-2022-0562
CVE-2022-0617
CVE-2022-0854
CVE-2022-0865
CVE-2022-0891
CVE-2022-0908
CVE-2022-0909
CVE-2022-0924
CVE-2022-1016
CVE-2022-1048
CVE-2022-1055
CVE-2022-1184
CVE-2022-1292
CVE-2022-1304
CVE-2022-1355
CVE-2022-1586
CVE-2022-1785
CVE-2022-1852
CVE-2022-1897
CVE-2022-1927
CVE-2022-2068
CVE-2022-2078
CVE-2022-2097
CVE-2022-2509
CVE-2022-2586
CVE-2022-2639
CVE-2022-2938
CVE-2022-3515
CVE-2022-20368
CVE-2022-21499
CVE-2022-21618
CVE-2022-21619
CVE-2022-21624
CVE-2022-21626
CVE-2022-21628
CVE-2022-22624
CVE-2022-22628
CVE-2022-22629
CVE-2022-22662
CVE-2022-22844
CVE-2022-23960
CVE-2022-24448
CVE-2022-25255
CVE-2022-26373
CVE-2022-26700
CVE-2022-26709
CVE-2022-26710
CVE-2022-26716
CVE-2022-26717
CVE-2022-26719
CVE-2022-27404
CVE-2022-27405
CVE-2022-27406
CVE-2022-27950
CVE-2022-28390
CVE-2022-28893
CVE-2022-29581
CVE-2022-30293
CVE-2022-34903
CVE-2022-36946
CVE-2022-37434
CVE-2022-39399

1.33. Logging 5.4.8

此发行版本包括 RHSA-2022:7435-OpenShift Logging 程序错误修复 5.4.8。

1.33.1. 程序错误修复

无。

1.34. Logging 5.4.6

此发行版本包括 OpenShift Logging 程序错误修复 5.4.6。

1.34.1. 程序错误修复

在此次更新之前，Fluentd 有时无法识别 Kubernetes 平台轮转日志文件，且不会读取日志消息。在这个版本中，通过设置上游开发团队所推荐的配置参数修正。(LOG-2792)
在此次更新之前，当 ClusterLogForwarder 自定义资源定义了 JSON 解析时，每个 rollover 任务都会创建空索引。在这个版本中，新的索引不为空。(LOG-2823)
在此次更新之前，如果您删除了 Kibana 自定义资源，OpenShift Container Platform Web 控制台将继续显示到 Kibana 的链接。在这个版本中，删除 Kibana 自定义资源也会删除该链接。(LOG-3054)

1.34.2. CVE

1.35. Logging 5.4.5

此发行版本包括 RHSA-2022:6183-OpenShift Logging Bug Fix 5.4.5。

1.35.1. 程序错误修复

在此次更新之前，Operator 无法确保 pod 就绪，这会导致集群在集群重启过程中达到可操作的状态。在这个版本中，Operator 会在重启过程中进入新 pod 前将新 pod 标记为 ready，这会解决这个问题。(LOG-2881)
在此次更新之前，添加多行错误检测会导致内部路由更改并将记录转发到错误的目的地。在这个版本中，内部路由正确。(LOG-2946)
在此次更新之前，Operator 无法使用带引号的布尔值值解码索引设置 JSON 响应，并导致错误。在这个版本中，Operator 可以正确解码这个 JSON 响应。(LOG-3009)
在此次更新之前，Elasticsearch 索引模板定义了带有错误类型的标签的字段。这会更新这些模板以匹配日志收集器所转发的预期类型。(LOG-2972)

1.35.2. CVE

1.36. Logging 5.4.4

此发行版本包括 RHBA-2022:5907-OpenShift Logging Bug Fix 5.4.4。

1.36.1. 程序错误修复

在此次更新之前，非拉丁字符在 Elasticsearch 中无法正确显示。在这个版本中，Elasticsearch 可以正确显示所有有效的 UTF-8 符号。(LOG-2794)
在此次更新之前，非拉丁字符在 Fluentd 中无法正确显示。在这个版本中，Fluentd 可以正确地显示所有有效的 UTF-8 字符。(LOG-2657)
在此次更新之前，收集器的指标服务器尝试使用通过环境值公开的值绑定到地址。在这个更改中，将配置修改为绑定到任何可用接口。(LOG-2821)
在此次更新之前，cluster-logging Operator 依赖于集群来创建 secret。OpenShift Container Platform 4.11 中更改了集群行为，这会导致日志记录部署失败。在这个版本中，cluster-logging Operator 会根据需要创建 secret 来解决这个问题。(LOG-2840)

1.36.2. CVE

1.37. Logging 5.4.3

此发行版本包括 RHSA-2022:5556-OpenShift Logging Bug Fix 5.4.3。

1.37.1. Elasticsearch Operator 弃用通知

在日志记录子系统 5.4.3 中，Elasticsearch Operator 已被弃用，计划在以后的发行版本中删除。红帽将在当前发行生命周期中提供对这个功能的程序漏洞修复和支持，但这个功能将不再获得改进，并将被删除。作为使用 Elasticsearch Operator 管理默认日志存储的替代选择，您可以使用 Loki Operator。

1.37.2. 程序错误修复

在此次更新之前，OpenShift Logging 仪表板会显示活跃主分片的数量，而不是所有活跃分片。在这个版本中，仪表板显示所有活跃分片。(LOG-2781)
在此次更新之前，elasticsearch-operator 使用的库中的有一个程序错误，它包含一个拒绝服务攻击的安全漏洞。在这个版本中，库已更新至不包含此漏洞的版本。(LOG-2816)
在此次更新之前，当将 Vector 配置为将日志转发到 Loki 时，无法设置自定义 bearer 令牌，如果 Loki 启用了 TLS，则无法使用默认的令牌。在这个版本中，Vector 可以使用启用了 TLS 的令牌将日志转发到 Loki。(LOG-2786
在此次更新之前，Elasticure Operator 在选择 oauth-proxy 镜像时省略 ImageStream 自定义资源的 referencePolicy 属性。这导致 Kibana 部署在特定环境中失败。在这个版本中，使用 referencePolicy 解决了这个问题，Operator 可以成功部署 Kibana。(LOG-2791)
在此次更新之前，ClusterLogForwarder 自定义资源的警报规则不会考虑多个转发输出。这个版本解决了这个问题。(LOG-2640)
在此次更新之前，配置为将日志转发到 Amazon CloudWatch 的集群会将拒绝的日志文件写入到临时存储，从而导致集群变得不稳定。在这个版本中，CloudWatch 的块备份已被禁用，从而解决了这个问题。(LOG-2768)

1.37.3. CVE

例 1.1. 点击以展开 CVE

1.38. Logging 5.4.2

此发行版本包括 RHBA-2022:4874-OpenShift Logging Bug Fix 5.4.2

1.38.1. 程序错误修复

在此次更新之前，使用 oc edit 编辑 Collector 配置非常困难，因为它对空格的使用不一致。这个更改引入了在 Operator 更新前对配置进行规范化和格式化的逻辑，以便使用 oc edit 轻松编辑配置。(LOG-2319)
在此次更新之前，FluentdNodeDown 警报无法正确在 message 部分中提供实例标签。在这个版本中，通过修复警报规则来在部分实例失败时提供实例标签，从而解决了这个问题。(LOG-2607)
在此次更新之前，在文档中声明支持的几个日志级别（如`critical`）实际并不支持。在这个版本中，相关的日志级别已被支持。(LOG-2033)

1.38.2. CVE

例 1.2. 点击以展开 CVE

CVE-2018-25032
CVE-2020-0404
CVE-2020-4788
CVE-2020-13974
CVE-2020-19131
CVE-2020-27820
CVE-2021-0941
CVE-2021-3612
CVE-2021-3634
CVE-2021-3669
CVE-2021-3737
CVE-2021-3743
CVE-2021-3744
CVE-2021-3752
CVE-2021-3759
CVE-2021-3764
CVE-2021-3772
CVE-2021-3773
CVE-2021-4002
CVE-2021-4037
CVE-2021-4083
CVE-2021-4157
CVE-2021-4189
CVE-2021-4197
CVE-2021-4203
CVE-2021-20322
CVE-2021-21781
CVE-2021-23222
CVE-2021-26401
CVE-2021-29154
CVE-2021-37159
CVE-2021-41617
CVE-2021-41864
CVE-2021-42739
CVE-2021-43056
CVE-2021-43389
CVE-2021-43976
CVE-2021-44733
CVE-2021-45485
CVE-2021-45486
CVE-2022-0001
CVE-2022-0002
CVE-2022-0286
CVE-2022-0322
CVE-2022-1011
CVE-2022-1271

1.39. Logging 5.4.1

此发行版本包括 RHSA-2022:2216-OpenShift Logging 程序错误修复 5.4.1。

1.39.1. 程序错误修复

在此次更新之前，日志文件指标 exporter 仅报告在导出器运行期间创建的日志，从而造成日志增长数据不准确。此次更新通过监控 /var/log/pods 解决了这个问题。(LOG-2442)
在此次更新之前，收集器会被阻断，因为它在将日志转发到 fluentd 转发接收器时不断尝试使用过时的连接。在这个版本中，keepalive_timeout 值被设置为 30 秒(30s)，以便收集器回收连接并重新尝试在合理的时间内发送失败消息。(LOG-2534)
在此次更新之前，网关组件强制租期中的错误，用于读取带有 Kubernetes 命名空间的日志的有限访问会导致 "audit" 以及一些 "infrastructure" 日志不可读取。在这个版本中，代理可以正确地检测到具有 admin 访问权限的用户，并允许在没有命名空间的情况下访问日志。(LOG-2448)
在此次更新之前，system:serviceaccount:openshift-monitoring:prometheus-k8s 服务帐户将集群级别权限作为 clusterrole 和 clusterrolebinding。在这个版本中，服务帐户使用角色和 rolebinding 限制到 openshift-logging 命名空间。(LOG-2437)
在此次更新之前，Linux 审计日志时间解析依赖于键/值对的正序位置。此更新会将解析更改为使用正则表达式来查找时间条目。(LOG-2321)

1.39.2. CVE

例 1.3. 点击以展开 CVE

1.40. Logging 5.4

以下公告可用于日志 5.4： Red Hat OpenShift 版本 5.4 的 Logging 子系统

1.40.1. 技术预览

重要

向量只是一个技术预览功能。技术预览功能不受红帽产品服务等级协议（SLA）支持，且功能可能并不完整。红帽不推荐在生产环境中使用它们。这些技术预览功能可以使用户提早试用新的功能，并有机会在开发阶段提供反馈意见。

有关红帽技术预览功能支持范围的更多信息，请参阅技术预览功能支持范围。

1.40.2. 关于向量

向量（vector）是一个日志收集器，它作为一个技术预览替代 logging 子系统的当前默认收集器。

以下输出受支持：

elasticsearch.一个外部 Elasticsearch 实例。elasticsearch 输出可以使用 TLS 连接。
kafka.Kafka 代理。kafka 输出可以使用不安全的或 TLS 连接。
loki。Loki，一个可横向扩展的、高可用性、多租户日志聚合系统。

1.40.2.1. 启用向量

默认不启用向量。使用以下步骤在 OpenShift Container Platform 集群上启用向量。

重要

向量不支持 FIPS 启用集群。

先决条件

OpenShift Container Platform: 4.10
Red Hat OpenShift 的 logging 子系统： 5.4
禁用 FIPS

流程

编辑 openshift-logging 项目中的 ClusterLogging 自定义资源（CR）：
```
$ oc -n openshift-logging edit ClusterLogging instance
```
为 ClusterLogging 自定义资源(CR)添加 logging.openshift.io/preview-vector-collector: enabled 注解。
在 ClusterLogging 自定义资源(CR)中添加 vector 作为集合类型。

  apiVersion: "logging.openshift.io/v1"
  kind: "ClusterLogging"
  metadata:
    name: "instance"
    namespace: "openshift-logging"
    annotations:
      logging.openshift.io/preview-vector-collector: enabled
  spec:
    collection:
      logs:
        type: "vector"
        vector: {}

其他资源

向量文档

重要

Loki Operator 只是一个技术预览功能。技术预览功能不受红帽产品服务等级协议（SLA）支持，且功能可能并不完整。红帽不推荐在生产环境中使用它们。这些技术预览功能可以使用户提早试用新的功能，并有机会在开发阶段提供反馈意见。

有关红帽技术预览功能支持范围的更多信息，请参阅技术预览功能支持范围。

1.40.3. 关于 Loki

Loki 是一个可横向扩展的、高度可用且多租户的日志聚合系统，目前作为日志记录子系统的日志存储提供。

其他资源

Loki 文档

1.40.3.1. 部署 Lokistack

您可以使用 OpenShift Container Platform Web 控制台安装 Loki Operator。

先决条件

OpenShift Container Platform: 4.10
Red Hat OpenShift 的 logging 子系统： 5.4

使用 OpenShift Container Platform Web 控制台安装 Loki Operator：

安装 Loki Operator：
1. 在 OpenShift Container Platform Web 控制台中，点击 Operators → OperatorHub。
2. 从可用的 Operator 列表中选择 Loki Operator，然后点 Install。
3. 在 Installation Mode 下，选择 All namespaces on the cluster。
4. 在 Installed Namespace 下，选择 openshift-operators-redhat。
  您必须指定 openshift-operators-redhat 命名空间。openshift-operators 命名空间可能会包含社区提供的 operator。这些 operator 不被信任，其发布的 metric 可能与 OpenShift Container Platform metric 的名称相同，从而导致冲突。
5. 选择 Enable operator recommended cluster monitoring on this namespace。
  这个选项在 Namespace 对象中设置 openshift.io/cluster-monitoring: "true" 标识。您必须设置这个选项，以确保集群监控提取 openshift-operators-redhat 命名空间。
6. 选择一个批准策略。
  - Automatic 策略允许 Operator Lifecycle Manager（OLM）在有新版本可用时自动更新 Operator。
  - Manual 策略需要拥有适当凭证的用户批准 Operator 更新。
7. 点 Install。
8. 验证您安装了 Loki Operator。访问 Operators → Installed Operators 页面，并查找 "Loki Operator"。
9. 确保 Loki Operator 列在 Status 为 Succeeded 的所有项目中。

1.40.4. 程序错误修复

在此次更新之前，cluster-logging-operator 使用集群范围的角色和绑定来建立 Prometheus 服务帐户的权限，以提取指标。这些权限在使用控制台界面部署 Operator 时创建，但在从命令行部署时缺失。在这个版本中，通过使角色和绑定命名空间范围解决了这个问题。(LOG-2286)
在此次更新之前，修复仪表板协调在命名空间间引入一个 ownerReferences 字段。因此，在命名空间中不会创建配置映射和仪表板。在这个版本中，删除了 ownerReferences 字段可以解决这个问题，OpenShift Logging 仪表板在控制台中可用。(LOG-2163)
在此次更新之前，对指标仪表板的更改不会部署，因为 cluster-logging-operator 无法正确比较包含仪表板的现有和修改后的配置映射。在这个版本中，为对象标签添加唯一的散列值可解决这个问题。(LOG-2071)
在此次更新之前，OpenShift Logging 仪表板没有正确显示表中的 pod 和命名空间，这会显示在最后 24 小时收集的生成容器。在这个版本中，pod 和命名空间会被正确显示。(LOG-2069)
在此次更新之前，当 ClusterLogForwarder 设置为 Elasticsearch OutputDefault 且 Elasticsearch 输出没有结构化键时，生成的配置包含身份验证的错误值。在这个版本中，修正了使用的 secret 和证书。(LOG-2056)
在此次更新之前，OpenShift Logging 仪表板会显示一个空的 CPU 图形，因为引用无效指标。在这个版本中，选择了正确的数据点来解决此问题。(LOG-2026)
在此次更新之前，Fluentd 容器镜像包含在运行时不需要的构建程序工具。这个版本从镜像中删除这些工具。(LOG-1927)
在此次更新之前，在 5.3 版本中部署的收集器的名称更改会导致日志记录收集器生成 FluentdNodeDown 警报。在这个版本中，修复 Prometheus 警报的作业名称解决了这个问题。(LOG-1918)
在此次更新之前，日志收集器因为重构组件名称更改而收集自己的日志。这可能会导致收集器处理自己的日志的潜在反馈循环，这可能会导致内存和日志消息大小问题。在这个版本中解决了这个问题，它会从集合中排除收集器日志。(LOG-1774)
在此次更新之前，Elasticsearch 会生成错误 Unable to create PersistentVolumeClaim due to forbidden: exceeded quota: infra-storage-quota.（如果 PVC 已存在）。在这个版本中，Elasticsearch 会检查现有的 PVC，从而解决了这个问题。(LOG-2131)
在此次更新之前，当 elasticsearch-signing secret 被删除时，Elasticsearch 无法返回 ready 状态。在这个版本中，Elasticsearch 能够在删除该 secret 后返回 ready 状态。(LOG-2171)
在此次更新之前，收集器读取容器日志的路径的更改会导致收集器将一些记录转发到错误的索引。在这个版本中，收集器使用正确的配置来解决这个问题。(LOG-2160)
在此次更新之前，带有大量命名空间的集群会导致 Elasticsearch 停止服务请求，因为命名空间列表达到最大标头大小限制。在这个版本中，标头只包括命名空间名称列表，从而解决了这个问题。(LOG-1899)
在此次更新之前，OpenShift Container Platform Logging 仪表板显示分片"x"数量大于 Elasticsearch 具有 'x' 节点时的实际值。出现这个问题的原因是，它会输出每个 Elasticsearch pod 的所有主分片，并计算出整个 Elasticsearch 集群的总和。在这个版本中，分片数量会被正确计算。(LOG-2156)
在此次更新之前，如果 secret kibana 和 kibana-proxy 被删除，则不会重新创建它们。在这个版本中，elasticsearch-operator 会监视资源，并在删除时自动重新创建这些资源。(LOG-2250)
在此次更新之前，调整缓冲区块大小可能会导致收集器生成超过事件流字节限制的块大小警告。在这个版本中，您还可以调整读行限制，并解决问题。(LOG-2379)
在此次更新之前，OpenShift WebConsole 中的日志记录控制台链接不会被 ClusterLogging CR 删除。在这个版本中，删除 CR 或卸载 Cluster Logging Operator 会删除链接。(LOG-2373)
在此次更新之前，对容器日志路径的更改会导致集合指标始终为零，且使用原始路径配置旧版本。在这个版本中，插件会公开有关收集日志的指标，支持从任一路径中读取来解决这个问题。(LOG-2462)

1.40.5. CVE

1.41. Logging 5.3.14

此发行版本包括 OpenShift Logging 程序错误修复 5.3.14。

1.41.1. 程序错误修复

在此次更新之前，log-file-metrics-exporter 组件生成的日志文件大小映射不会删除已删除文件的条目，从而导致文件大小和进程内存增加。在这个版本中，日志文件大小映射不包含已删除文件的条目。(LOG-3293)

1.41.2. CVE

CVE-2016-3709
CVE-2020-35525
CVE-2020-35527
CVE-2020-36516
CVE-2020-36558
CVE-2021-3640
CVE-2021-30002
CVE-2022-0168
CVE-2022-0561
CVE-2022-0562
CVE-2022-0617
CVE-2022-0854
CVE-2022-0865
CVE-2022-0891
CVE-2022-0908
CVE-2022-0909
CVE-2022-0924
CVE-2022-1016
CVE-2022-1048
CVE-2022-1055
CVE-2022-1184
CVE-2022-1292
CVE-2022-1304
CVE-2022-1355
CVE-2022-1586
CVE-2022-1785
CVE-2022-1852
CVE-2022-1897
CVE-2022-1927
CVE-2022-2068
CVE-2022-2078
CVE-2022-2097
CVE-2022-2509
CVE-2022-2586
CVE-2022-2639
CVE-2022-2938
CVE-2022-3515
CVE-2022-20368
CVE-2022-21499
CVE-2022-21618
CVE-2022-21619
CVE-2022-21624
CVE-2022-21626
CVE-2022-21628
CVE-2022-22624
CVE-2022-22628
CVE-2022-22629
CVE-2022-22662
CVE-2022-22844
CVE-2022-23960
CVE-2022-24448
CVE-2022-25255
CVE-2022-26373
CVE-2022-26700
CVE-2022-26709
CVE-2022-26710
CVE-2022-26716
CVE-2022-26717
CVE-2022-26719
CVE-2022-27404
CVE-2022-27405
CVE-2022-27406
CVE-2022-27950
CVE-2022-28390
CVE-2022-28893
CVE-2022-29581
CVE-2022-30293
CVE-2022-34903
CVE-2022-36946
CVE-2022-37434
CVE-2022-39399
CVE-2022-42898

1.42. Logging 5.3.13

此发行版本包括 RHSA-2022:68828-OpenShift Logging Bug Fix Release 5.3.13。

1.42.1. 程序错误修复

无。

1.43. Logging 5.3.12

此发行版本包括 OpenShift Logging 程序错误修复版本 5.3.12。

1.43.1. 程序错误修复

无。

1.43.2. CVE

1.44. Logging 5.3.11

此发行版本包括 OpenShift Logging 程序错误修复 5.3.11。

1.44.1. 程序错误修复

在此次更新之前，Operator 无法确保 pod 就绪，这会导致集群在集群重启过程中达到可操作的状态。在这个版本中，Operator 会在重启过程中进入新 pod 前将新 pod 标记为 ready，这会解决这个问题。(LOG-2871)

1.44.2. CVE

1.45. Logging 5.3.10

此发行版本包括 RHSA-2022:5908-OpenShift Logging 程序错误修复 5.3.10。

1.45.1. 程序错误修复

BZ-2100495

1.45.2. CVE

例 1.5. 点击以展开 CVE

1.46. Logging 5.3.9

此发行版本包括 RHBA-2022:5557-OpenShift Logging Bug Fix 5.3.9。

1.46.1. 程序错误修复

在此次更新之前，日志记录收集器包含一个路径，作为它生成的指标的标签。此路径经常更改，并会导致 Prometheus 服务器的存储的大量更改。在这个版本中，标签已被丢弃以解决问题并减少存储消耗。(LOG-2682)

1.46.2. CVE

例 1.6. 点击以展开 CVE

1.47. Logging 5.3.8

此发行版本包括 RHBA-2022:5010-OpenShift Logging Bug Fix 5.3.8

1.47.1. 程序错误修复

（无.）

1.47.2. CVE

例 1.7. 点击以展开 CVE

CVE-2018-25032
CVE-2020-0404
CVE-2020-4788
CVE-2020-13974
CVE-2020-19131
CVE-2020-27820
CVE-2021-0941
CVE-2021-3612
CVE-2021-3634
CVE-2021-3669
CVE-2021-3737
CVE-2021-3743
CVE-2021-3744
CVE-2021-3752
CVE-2021-3759
CVE-2021-3764
CVE-2021-3772
CVE-2021-3773
CVE-2021-4002
CVE-2021-4037
CVE-2021-4083
CVE-2021-4157
CVE-2021-4189
CVE-2021-4197
CVE-2021-4203
CVE-2021-20322
CVE-2021-21781
CVE-2021-23222
CVE-2021-26401
CVE-2021-29154
CVE-2021-37159
CVE-2021-41617
CVE-2021-41864
CVE-2021-42739
CVE-2021-43056
CVE-2021-43389
CVE-2021-43976
CVE-2021-44733
CVE-2021-45485
CVE-2021-45486
CVE-2022-0001
CVE-2022-0002
CVE-2022-0286
CVE-2022-0322
CVE-2022-1011
CVE-2022-1271

1.48. OpenShift Logging 5.3.7

此发行版本包括 RHSA-2022:2217 OpenShift Logging 程序错误修复 5.3.7

1.48.1. 程序错误修复

在此次更新之前，Linux 审计日志时间解析依赖于键/值对的正误定位。在这个版本中，解析被修改为使用 regex 来查找时间条目。(LOG-2322)
在此更新前，一些日志转发器输出可能会使用相同的时间戳重新排序日志。在这个版本中，在日志中添加了一个序列号，以订购具有匹配时间戳的条目。(LOG-2334)
在此次更新之前，带有大量命名空间的集群会导致 Elasticsearch 停止服务请求，因为命名空间列表达到最大标头大小限制。在这个版本中，标头只包括命名空间名称列表，从而解决了这个问题。(LOG-2450)
在此次更新之前，system:serviceaccount:openshift-monitoring:prometheus-k8s 有集群级别特权，作为 clusterrole 和 clusterrolebinding。在这个版本中，使用 role 和 rolebinding 将 serviceaccount 限制到 openshift-logging 命名空间。(LOG-2481))

1.48.2. CVE

例 1.8. 点击以展开 CVE

1.49. OpenShift Logging 5.3.6

此发行版本包括 RHBA-2022:1377 OpenShift Logging Bug Fix 5.3.6

1.49.1. 程序错误修复

在此次更新之前，定义没有密钥的容限，且现有 Operator 会导致 Operator 无法完成升级。在这个版本中，这个容限不再阻止升级完成。(LOG-2126)
在此更改前，收集器可能会生成警告，其中块字节限值超过发出的事件。在这个版本中，您可以调整 readline 限制，以根据上游文档建议解决问题。(LOG-2380)

1.50. OpenShift Logging 5.3.5

此发行版本包括 RHSA-2022:0721 OpenShift Logging 程序错误修复 5.3.5

1.50.1. 程序错误修复

在此次更新之前，如果您从 OpenShift Container Platform 中删除了 OpenShift Logging，Web 控制台仍然会显示指向 Logging 页面的链接。在这个版本中，删除或卸载 OpenShift Logging 也会删除该链接。(LOG-2182)

1.50.2. CVE

例 1.9. 点击以展开 CVE

1.51. OpenShift Logging 5.3.4

此发行版本包括 RHBA-2022:0411 OpenShift Logging Bug Fix 5.3.4

1.51.1. 程序错误修复

在此次更新之前，对 metrics 仪表板的更改还没有部署，因为 cluster-logging-operator 没有正确比较包含仪表板的现有和所需的配置映射。在这个版本中，通过在对象标签中添加唯一的 hash 值来解决逻辑。(LOG-2066)
在此次更新之前，Elasticsearch Pod 在启用了 FIPS 更新后无法启动。在这个版本中，Elasticsearch Pod 可以成功启动。(LOG-1974)
在此次更新之前，Elasticsearch 会生成错误 "Unable to create PersistentVolumeClaim due to forbidden: exceeded quota: infra-storage-quota."（如果 PVC 已存在）。在这个版本中，Elasticsearch 会检查现有的 PVC，从而解决了这个问题。(LOG-2127)

1.52. OpenShift Logging 5.3.3

此发行版本包括 RHSA-2022:0227 OpenShift Logging Bug Fix 5.3.3

1.52.1. 程序错误修复

在此次更新之前，对 metrics 仪表板的更改还没有部署，因为 cluster-logging-operator 没有正确地比较包含仪表板的现有和所需 configmaps。在这个版本中，通过将仪表板唯一的哈希值添加到对象标签来修复逻辑。(LOG-2066)
在这个版本中，log4j 依赖项改为 2.17.1 以解决 CVE-2021-44832.(LOG-2102)

1.52.2. CVE

例 1.11. 点击以展开 CVE

1.53. OpenShift Logging 5.3.2

此发行版本包括 RHSA-2022:0044 OpenShift Logging Bug Fix 5.3.2

1.53.1. 程序错误修复

在此次更新之前，因为解析错误，Elasticsearch 会拒绝来自事件路由器的日志。在这个版本中，更改了数据模型来解决这个问题。但是，以前的索引可能会导致 Kibana 中的警告或错误。kubernetes.event.metadata.resourceVersion 字段会导致错误，直到删除现有索引被删除或重新索引为止。如果 Kibana 中没有使用此字段，您可以忽略错误消息。如果您有一个删除旧索引的保留策略，策略最终会删除旧的索引并停止错误消息。或者手动重新索引来停止生成错误消息。(LOG-2087)
在此次更新之前，OpenShift Logging Dashboard 在表中显示错误的 pod 命名空间，该命名空间显示上 24 小时内构建和收集容器。在这个版本中，OpenShift Logging Dashboard 会显示正确的 pod 命名空间。(LOG-2051)
在此次更新之前，如果 ClusterLogForwarder 自定义资源(CR)实例的 outputDefaults.elasticsearch.structuredTypeKey 没有结构化密钥，则 CR 会将输出 secret 替换为用来与默认日志存储通信的默认 secret。在这个版本中，定义的输出 secret 会被正确使用。(LOG-2046)

1.53.2. CVE

例 1.12. 点击以展开 CVE

1.54. OpenShift Logging 5.3.1

此发行版本包括 RHSA-2021:5129 OpenShift Logging 程序错误修复 5.3.1

1.54.1. 程序错误修复

在此次更新之前，Fluentd 容器镜像包含在运行时不需要的构建程序工具。这个版本从镜像中删除这些工具。(LOG-1998)
在此次更新之前，日志记录仪表板会显示空 CPU 图形，因为引用无效指标。在这个版本中，日志记录仪表板可以正确地显示 CPU 图形。(LOG-1925)
在此次更新之前，Elasticsearch Prometheus exporter 插件使用会影响 Elasticsearch 节点性能的高成本查询编译了索引级指标。这个版本实现了更低成本的查询，可提高性能。(LOG-1897)

1.54.2. CVE

例 1.13. 点击以展开 CVE

1.55. OpenShift Logging 5.3.0

此发行版本包括 RHSA-2021:4627 OpenShift Logging 程序错误修复 5.3.0

1.55.1. 新功能及功能增强

在这个版本中，Log Forwarding 的授权选项已被扩展。输出现在可以配置 SASL、用户名/密码或 TLS。

1.55.2. 程序错误修复

在此次更新之前，如果您使用 syslog 协议转发日志，请串行化 ruby 哈希编码的键/值对，使其包含"归档"字符，并使用"#11"替换制表符。在这个版本中解决了这个问题，日志消息被正确序列化为有效的 JSON。(LOG-1494)
在此次更新之前，应用程序日志没有被正确配置，以转发到启用了多行错误检测的正确的 Cloudwatch 流。(LOG-1939)
在此次更新之前，5.3 发行版中部署的收集器的名称更改会导致生成警报 'fluentnodedown'。(LOG-1918)
在此次更新之前，以前的发行配置中引入的回归会导致收集器在关闭前清除其缓冲区信息，从而造成终止并重启收集器 Pod。在这个版本中，fluentd 不再在关闭时清除缓冲区，从而解决了这个问题。(LOG-1735)
在此次更新之前，在以前的版本中会有意禁用 JSON 消息解析。这个版本重新启用 JSON 解析。它还根据解析 JSON 消息中的"level"字段设置日志条目"level"字段，或者使用 regex 从消息字段中提取匹配项。(LOG-1199)
在此次更新之前，ClusterLogging 自定义资源(CR)将 totalLimitSize 字段的值应用到 Fluentd total_limit_size 字段，即使所需的缓冲空间不可用。在这个版本中，CR 会将两个 totalLimitSize 或 'default' 值的 lesser 应用到 Fluentd total_limit_size 字段，从而解决这个问题。(LOG-1776)

1.55.3. 已知问题

如果您将日志转发到外部 Elasticsearch 服务器，然后在管道 secret 中更改配置的值，如用户名和密码，Fluentd forwarder 会加载新 secret，但使用旧值连接到外部 Elasticsearch 服务器。出现这个问题的原因是，Red Hat OpenShift Logging Operator 当前不会监控 secret 的内容更改。(LOG-1652)
作为临时解决方案，如果更改了 secret，您可以强制重新部署 Fluentd Pod：
```
$ oc delete pod -l component=collector
```

1.55.4. 弃用和删除的功能

之前版本中的一些功能已被弃用或删除。

弃用的功能仍然包含在 OpenShift Logging 中，并且仍然被支持。但是，这个功能会在以后的发行版本中被删除，且不建议在新的部署中使用。

1.55.4.1. 使用旧的 Fluentd 和旧的 syslog 方法转发日志已被删除

在 OpenShift Logging 5.3 中，将日志转发到 Syslog 和 Fluentd 的传统方法已被删除。错误修复和支持在 OpenShift Logging 5.2 生命周期结束时提供。之后，不会进行新的功能增强。

反之，使用以下非传统方法：

1.55.4.2. 已删除旧转发方法的配置机制

在 OpenShift Logging 5.3 中，日志转发的传统配置机制已被删除：您不能使用旧的 Fluentd 方法和旧的 Syslog 方法转发日志。使用标准日志转发方法。

1.55.5. CVE

例 1.14. 点击以展开 CVE

CVE-2018-20673
CVE-2018-25009
CVE-2018-25010
CVE-2018-25012
CVE-2018-25013
CVE-2018-25014
CVE-2019-5827
CVE-2019-13750
CVE-2019-13751
CVE-2019-14615
CVE-2019-17594
CVE-2019-17595
CVE-2019-18218
CVE-2019-19603
CVE-2019-20838
CVE-2020-0427
CVE-2020-10001
CVE-2020-12762
CVE-2020-13435
CVE-2020-14145
CVE-2020-14155
CVE-2020-16135
CVE-2020-17541
CVE-2020-24370
CVE-2020-24502
CVE-2020-24503
CVE-2020-24504
CVE-2020-24586
CVE-2020-24587
CVE-2020-24588
CVE-2020-26139
CVE-2020-26140
CVE-2020-26141
CVE-2020-26143
CVE-2020-26144
CVE-2020-26145
CVE-2020-26146
CVE-2020-26147
CVE-2020-27777
CVE-2020-29368
CVE-2020-29660
CVE-2020-35448
CVE-2020-35521
CVE-2020-35522
CVE-2020-35523
CVE-2020-35524
CVE-2020-36158
CVE-2020-36312
CVE-2020-36330
CVE-2020-36331
CVE-2020-36332
CVE-2020-36386
CVE-2021-0129
CVE-2021-3200
CVE-2021-3348
CVE-2021-3426
CVE-2021-3445
CVE-2021-3481
CVE-2021-3487
CVE-2021-3489
CVE-2021-3564
CVE-2021-3572
CVE-2021-3573
CVE-2021-3580
CVE-2021-3600
CVE-2021-3635
CVE-2021-3659
CVE-2021-3679
CVE-2021-3732
CVE-2021-3778
CVE-2021-3796
CVE-2021-3800
CVE-2021-20194
CVE-2021-20197
CVE-2021-20231
CVE-2021-20232
CVE-2021-20239
CVE-2021-20266
CVE-2021-20284
CVE-2021-22876
CVE-2021-22898
CVE-2021-22925
CVE-2021-23133
CVE-2021-23840
CVE-2021-23841
CVE-2021-27645
CVE-2021-28153
CVE-2021-28950
CVE-2021-28971
CVE-2021-29155
lCVE-2021-29646
CVE-2021-29650
CVE-2021-31440
CVE-2021-31535
CVE-2021-31829
CVE-2021-31916
CVE-2021-33033
CVE-2021-33194
CVE-2021-33200
CVE-2021-33560
CVE-2021-33574
CVE-2021-35942
CVE-2021-36084
CVE-2021-36085
CVE-2021-36086
CVE-2021-36087
CVE-2021-42574

1.56. Logging 5.2.13

此发行版本包括 RHSA-2022:5909-OpenShift Logging Bug Fix 5.2.13。

1.56.1. 程序错误修复

BZ-2100495

1.56.2. CVE

例 1.15. 点击以展开 CVE

1.57. Logging 5.2.12

此发行版本包括 RHBA-2022:5558-OpenShift Logging Bug Fix 5.2.12。

1.57.1. 程序错误修复

无。

1.57.2. CVE

例 1.16. 点击以展开 CVE

1.58. Logging 5.2.11

此发行版本包括 RHBA-2022:5012-OpenShift Logging Bug Fix 5.2.11

1.58.1. 程序错误修复

在此次更新之前，配置为执行 CloudWatch 转发的集群会将拒绝的日志文件写入临时存储，从而导致集群因为时间不稳定。在这个版本中，CloudWatch 的块备份已被禁用，从而解决了这个问题。(LOG-2635)

1.58.2. CVE

例 1.17. 点击以展开 CVE

CVE-2018-25032
CVE-2020-0404
CVE-2020-4788
CVE-2020-13974
CVE-2020-19131
CVE-2020-27820
CVE-2021-0941
CVE-2021-3612
CVE-2021-3634
CVE-2021-3669
CVE-2021-3737
CVE-2021-3743
CVE-2021-3744
CVE-2021-3752
CVE-2021-3759
CVE-2021-3764
CVE-2021-3772
CVE-2021-3773
CVE-2021-4002
CVE-2021-4037
CVE-2021-4083
CVE-2021-4157
CVE-2021-4189
CVE-2021-4197
CVE-2021-4203
CVE-2021-20322
CVE-2021-21781
CVE-2021-23222
CVE-2021-26401
CVE-2021-29154
CVE-2021-37159
CVE-2021-41617
CVE-2021-41864
CVE-2021-42739
CVE-2021-43056
CVE-2021-43389
CVE-2021-43976
CVE-2021-44733
CVE-2021-45485
CVE-2021-45486
CVE-2022-0001
CVE-2022-0002
CVE-2022-0286
CVE-2022-0322
CVE-2022-1011
CVE-2022-1271

1.59. OpenShift Logging 5.2.10

此发行版本包括 OpenShift Logging Bug Fix Release 5.2.10]

1.59.1. 程序错误修复

在此更新前，一些日志转发器输出可能会使用相同的时间戳重新排序日志。在这个版本中，在日志中添加了一个序列号，以订购具有匹配时间戳的条目。(LOG-2335)
在此次更新之前，带有大量命名空间的集群会导致 Elasticsearch 停止服务请求，因为命名空间列表达到最大标头大小限制。在这个版本中，标头只包括命名空间名称列表，从而解决了这个问题。(LOG-2475)
在此次更新之前，system:serviceaccount:openshift-monitoring:prometheus-k8s 有集群级别特权，作为 clusterrole 和 clusterrolebinding。在这个版本中，使用 role 和 rolebinding 将 serviceaccount 限制到 openshift-logging 命名空间。(LOG-2480)
在此次更新之前，cluster-logging-operator 使用集群范围的角色和绑定来建立 Prometheus 服务帐户的权限，以提取指标。这些权限只有在使用控制台界面部署 Operator 时创建，在从命令行部署 Operator 时缺失。在这个版本中，这个角色和绑定命名空间范围解决了这个问题。(LOG-1972)

1.59.2. CVE

例 1.18. 点击以展开 CVE

1.60. OpenShift Logging 5.2.9

此发行版本包括 RHBA-2022:1375 OpenShift Logging Bug Fix Release 5.2.9]

1.60.1. 程序错误修复

在此次更新之前，定义没有密钥的容限，且现有 Operator 会导致 Operator 无法完成升级。在这个版本中，这个容限不再阻止升级完成。(LOG-2304)

1.61. OpenShift Logging 5.2.8

此发行版本包括 RHSA-2022:0728 OpenShift Logging Bug Fix 5.2.8

1.61.1. 程序错误修复

在此次更新之前，如果您从 OpenShift Container Platform 中删除了 OpenShift Logging，Web 控制台仍然会显示指向 Logging 页面的链接。在这个版本中，删除或卸载 OpenShift Logging 也会删除该链接。(LOG-2180)

1.61.2. CVE

例 1.19. 点击以展开 CVE

1.62. OpenShift Logging 5.2.7

此发行版本包括 RHBA-2022:0478 OpenShift Logging Bug Fix 5.2.7

1.62.1. 程序错误修复

在此次更新之前，启用了 FIPS 的 Elasticsearch Pod 无法在更新后启动。在这个版本中，Elasticsearch Pod 可以成功启动。(LOG-2000)
在此次更新之前，如果持久性卷声明(PVC)已存在，Elasticsearch 会生成错误，"Unable to create PersistentVolumeClaim due to forbidden: exceeded quota: infra-storage-quota." 在这个版本中，Elasticsearch 会检查现有的 PVC，从而解决了这个问题。(LOG-2118)

1.62.2. CVE

例 1.20. 点击以展开 CVE

1.63. OpenShift Logging 5.2.6

此发行版本包括 RHSA-2022:0230 OpenShift Logging 程序错误修复 5.2.6

1.63.1. 程序错误修复

在此次更新之前，这个版本不包含导致 Fluentd 崩溃的过滤器更改。在这个版本中，缺少的过滤器已被修正。(LOG-2104)
在这个版本中，log4j 依赖项改为 2.17.1 以解决 CVE-2021-44832.(LOG-2101)

1.63.2. CVE

例 1.21. 点击以展开 CVE

1.64. OpenShift Logging 5.2.5

此发行版本包括 RHSA-2022:0043 OpenShift Logging 程序错误修复 5.2.5

1.64.1. 程序错误修复

在此次更新之前，因为解析错误，Elasticsearch 会拒绝来自事件路由器的日志。在这个版本中，更改了数据模型来解决这个问题。但是，以前的索引可能会导致 Kibana 中的警告或错误。kubernetes.event.metadata.resourceVersion 字段会导致错误，直到删除现有索引被删除或重新索引为止。如果 Kibana 中没有使用此字段，您可以忽略错误消息。如果您有一个删除旧索引的保留策略，策略最终会删除旧的索引并停止错误消息。或者手动重新索引来停止生成错误消息。LOG-2087)

1.64.2. CVE

例 1.22. 点击以展开 CVE

1.65. OpenShift Logging 5.2.4

此发行版本包括 RHSA-2021:5127 OpenShift Logging 程序错误修复 5.2.4

1.65.1. 程序错误修复

在更新之前，syslog 附带的更新记录会序列化 ruby 散列编码键/值对，使其包含"存储"字符，并将标签替换为 "#11"。在这个版本中，可以正确地将消息序列化为正确的 JSON。(LOG-1775)
在此次更新之前，Elasticsearch Prometheus exporter 插件使用会影响 Elasticsearch 节点性能的高成本查询编译了索引级指标。这个版本实现了更低成本的查询，可提高性能。(LOG-1970)
在此次更新之前，当 Log Forwarding 配置了多个输出时，Elasticsearch 有时会拒绝消息。这是因为将其中一个输出修改的消息内容配置为单个消息。在这个版本中，日志转发会复制每个输出的消息，以便特定于输出的处理不会影响其他输出。(LOG-1824)

1.65.2. CVE

例 1.23. 点击以展开 CVE

CVE-2018-25009
CVE-2018-25010
CVE-2018-25012
CVE-2018-25013
CVE-2018-25014
CVE-2019-5827
CVE-2019-13750
CVE-2019-13751
CVE-2019-17594
CVE-2019-17595
CVE-2019-18218
CVE-2019-19603
CVE-2019-20838
CVE-2020-12762
CVE-2020-13435
CVE-2020-14145
CVE-2020-14155
CVE-2020-16135
CVE-2020-17541
CVE-2020-24370
CVE-2020-35521
CVE-2020-35522
CVE-2020-35523
CVE-2020-35524
CVE-2020-36330
CVE-2020-36331
CVE-2020-36332
CVE-2021-3200
CVE-2021-3426
CVE-2021-3445
CVE-2021-3481
CVE-2021-3572
CVE-2021-3580
CVE-2021-3712
CVE-2021-3800
CVE-2021-20231
CVE-2021-20232
CVE-2021-20266
CVE-2021-20317
CVE-2021-21409
CVE-2021-22876
CVE-2021-22898
CVE-2021-22925
CVE-2021-27645
CVE-2021-28153
CVE-2021-31535
CVE-2021-33560
CVE-2021-33574
CVE-2021-35942
CVE-2021-36084
CVE-2021-36085
CVE-2021-36086
CVE-2021-36087
CVE-2021-37136
CVE-2021-37137
CVE-2021-42574
CVE-2021-43267
CVE-2021-43527
CVE-2021-44228
CVE-2021-45046

1.66. OpenShift Logging 5.2.3

此发行版本包括 RHSA-2021:4032 OpenShift Logging 程序错误修复 5.2.3

1.66.1. 程序错误修复

在此次更新之前，一些警报不包含命名空间标签。此遗漏不符合 OpenShift 监控团队在 OpenShift Container Platform 中编写警报规则的准则。在这个版本中，Elasticsearch Operator 中的所有警报都包含一个命名空间标签，并遵循在 OpenShift Container Platform 中编写警报规则的所有准则。(LOG-1857)
在此次更新之前，在以前的版本中会有意禁用 JSON 消息解析。这个版本重新启用 JSON 解析。它还根据解析 JSON 消息中的 level 字段设置日志条目 level 字段，或者使用 regex 从消息字段中提取匹配项。(LOG-1759)

1.66.2. CVE

例 1.24. 点击以展开 CVE

1.67. OpenShift Logging 5.2.2

此发行版本包括 RHBA-2021:3747 OpenShift Logging 程序错误修复 5.2.2

1.67.1. 程序错误修复

在此次更新之前，ClusterLogging 自定义资源(CR)将 totalLimitSize 字段的值应用到 Fluentd total_limit_size 字段，即使所需的缓冲空间不可用。在这个版本中，CR 会将两个 totalLimitSize 或 'default' 值的 lesser 应用到 Fluentd total_limit_size 字段，从而解决这个问题。(LOG-1738)
在此次更新之前，以前的发行配置中引入的回归会导致收集器在关闭前清除其缓冲区信息，从而造成终止并重启收集器 Pod。在这个版本中，Fluentd 不再在关闭时清除缓冲区，从而解决了这个问题。(LOG-1739)
在此次更新之前，捆绑包清单中的问题会阻止在 OpenShift Container Platform 4.9 上安装 Elasticsearch Operator。在这个版本中，更正捆绑包清单会在 4.9 中重新启用并升级。(LOG-1780)

1.67.2. CVE

例 1.25. 点击以展开 CVE

1.68. OpenShift Logging 5.2.1

此发行版本包括 RHBA-2021:3550 OpenShift Logging 程序错误修复 5.2.1

1.68.1. 程序错误修复

在此次更新之前，因为发行版本管道脚本中的一个问题，olm.skipRange 字段的值会保持不变（为 5.2.0），而不是反映当前的发行号。在这个版本中修复了管道脚本，在发行号更改时更新此字段的值。(LOG-1743)

1.68.2. CVE

（无）

1.69. OpenShift Logging 5.2.0

此发行版本包括 RHBA-2021:3393 OpenShift Logging 程序错误修复 5.2.0

1.69.1. 新功能及功能增强

在这个版本中，您可以将日志数据转发到 Amazon CloudWatch，它提供应用程序和基础架构监控。如需更多信息，请参阅将日志转发到 Amazon CloudWatch。(LOG-1173)
在这个版本中，您可以将日志数据转发到 Loki，这是一个可横向扩展、高度可用、多租户日志聚合系统。如需更多信息，请参阅将日志转发到 Loki。(LOG-684)
在这个版本中，如果使用 Fluentd forward 协议通过 TLS 加密连接转发日志数据，现在可以使用密码加密的私钥文件并在 Cluster Log Forwarder 配置中指定密码短语。如需更多信息，请参阅使用 Fluentd 转发协议转发日志。(LOG-1525)
在这个版本中，您可以使用用户名和密码来验证与外部 Elasticsearch 实例的日志转发连接。例如，如果无法使用 mutual TLS (mTLS)，因为第三方运行 Elasticsearch 实例，您可以使用 HTTP 或 HTTPS 并设置包含用户名和密码的 secret。如需更多信息，请参阅将日志转发到外部 Elasticsearch 实例。(LOG-1022)
在这个版本中，您可以收集 OVN 网络策略审计日志来转发到日志记录服务器。(LOG-1526)
默认情况下，OpenShift Container Platform 4.5 中引入的数据模型为来自不同命名空间的日志提供一个通用索引。这个变化造成很难看到哪些命名空间生成的日志最多。
当前发行版本在 OpenShift Container Platform 控制台中的 Logging 仪表板中添加命名空间指标。使用这些指标，您可以看到哪个命名空间生成日志，以及每个命名空间为给定时间戳生成的日志数量。
要查看这些指标，请在 OpenShift Container Platform web 控制台中打开 Administrator 视角，再导航到 Observe → Dashboards → Logging/Elasticsearch。(LOG-1680)
当前发行版本 OpenShift Logging 5.2 启用两个新指标：对于给定的时间戳或持续时间，您可以查看各个容器生成或记录的日志总数，以及收集器收集的日志总数。这些指标由命名空间、pod 和容器名称标记，以便您可以查看每个命名空间和 pod 收集和生成的日志数量。(LOG-1213)

1.69.2. 程序错误修复

在更新前，当 OpenShift Elasticsearch Operator 创建索引管理 cronjobs 时，它会添加 POLICY_MAPPING 环境变量两次，这会导致 apiserver 报告重复。在这个版本中解决了这个问题，使得 POLICY_MAPPING 环境变量只为每个 cronjob 设置一次，且 apiserver 报告没有重复。(LOG-1130)
在以前的版本中，将 Elasticsearch 集群挂起到零个节点不会挂起 index-management cronjobs，这会使这些 cronjobs 造成大量 backoff。然后，在取消暂停 Elasticsearch 集群后，这些 cronjobs 会因为达到最大 backoff 而停止。在这个版本中，通过挂起 cronjobs 和集群解决了这个问题。(LOG-1268)
在这个版本中，在 OpenShift Container Platform 控制台中的 Logging 仪表板中，前 10 种日志生成容器列表缺少 "chart namespace" 标签，并提供不正确的指标名称 fluentd_input_status_total_bytes_logged。在这个版本中，chart 显示命名空间标签和正确的指标名称 log_logged_bytes_total。(LOG-1271)
在更新之前，如果索引管理 cronjob 终止并显示错误退出代码，则报告错误退出代码：相反，其作业状态为"complete"。在这个版本中，报告使用错误终止的索引管理 cronjobs 的错误退出代码解决了这个问题。(LOG-1273)
priorityclasses.v1beta1.scheduling.k8s.io 已从 1.22 中删除，并被 priorityclasses.v1.scheduling.k8s.io 替代（v1beta1 被 v1替代）。在更新之前，APIRemovedInNextReleaseInUse 警报是为 priorityclasses 生成的，因为 v1beta1 仍然存在。在这个版本中，将 v1beta1 替换为 v1，解决了这个问题。不再生成警报。(LOG-1385)
在以前的版本中，OpenShift Elasticsearch Operator 和 Red Hat OpenShift Logging Operator 没有所需的注解，它们会显示在断开连接的环境中的 OpenShift Container Platform Web 控制台列表中。在这个版本中，将 operators.openshift.io/infrastructure-features: '["Disconnected"]' 注解添加到这两个 Operator 中，使它们出现在在断开连接的环境中运行的 Operator 列表中。(LOG-1420)
在更新前，Red Hat OpenShift Logging Operator pod 被调度到在性能优化的单节点集群中为客户工作负载保留的 CPU 内核。在这个版本中，集群日志记录操作器 pod 调度到正确的 CPU 内核中。(LOG-1440)
在更新前，一些日志条目没有被识别为 UTF-8 字节，这会导致 Elasticsearch 拒绝消息并阻塞整个缓冲的有效负载。在这个版本中，被拒绝的载荷会丢弃无效的日志条目并重新提交剩余的条目来解决这个问题。(LOG-1499)
在此次更新之前，kibana-proxy pod 有时输入 CrashLoopBackoff 状态，并记录以下消息 Invalid configuration: cookie_secret must be 16, 24, or 32 bytes to create an AES cipher when pass_access_token == true or cookie_refresh != 0, but is 29 bytes.实际的字节数可能有所不同。在这个版本中，Kibana 会话 secret 的生成已被修正，kibana-proxy pod 不再会因为这个错误而进入 CrashLoopBackoff 状态。(LOG-1446)
在这个版本中，AWS CloudWatch Fluentd 插件在所有日志级别记录了对 Fluentd 日志的 AWS API 调用，这会消耗额外的 OpenShift Container Platform 节点资源。在这个版本中，AWS CloudWatch Fluentd 插件仅在"debug"和"trace"日志级别记录 AWS API 调用。这样，在默认的"warn"日志级别中，Fluentd 不会消耗额外的节点资源。(LOG-1071)
在更新前，Elasticsearch OpenDistro 安全插件会导致用户索引迁移失败。在这个版本中，通过提供新版本的插件解决了这个问题。现在，索引迁移可以正常进行。(LOG-1276)
在更新前，在 OpenShift Container Platform 控制台中的 Logging 仪表板中，前 10 种生成日志的容器列表缺少数据点。此更新解决了这个问题，仪表板会显示所有数据点。(LOG-1353)
在更新前，如果您要通过调整 chunkLimitSize 和 totalLimitSize 值来调整 Fluentd 日志转发器的性能，Setting queued_chunks_limit_size for each buffer to 消息报告值太低。当前更新解决了这个问题，此消息可以报告正确的值。(LOG-1411)
在更新前，Kibana OpenDistro 安全插件会导致用户索引迁移失败。在这个版本中，通过提供新版本的插件解决了这个问题。现在，索引迁移可以正常进行。(LOG-1558)
在这个版本中，使用命名空间输入过滤器会阻止该命名空间中的日志出现在其他输入中。在这个版本中，日志会发送到可以接受它们的所有输入。(LOG-1570)
在以前的版本中， viaq/logerr 依赖项缺少许可证文件，这会导致许可证扫描程序在没有成功的情况下被中止。在这个版本中, viaq/logerr 依赖项使用 Apache 2.0 许可，许可证扫描程序可以成功运行。(LOG-1590)
在更新前，elasticsearch-operator-bundle 构建管道中的 curator5 的不正确的 brew 标签会导致拉取镜像被固定到 dummy SHA1 中。在这个版本中，构建管道使用 logging-curator5-rhel8 来引用 curator5，索引管理 cronjobs 可以从 registry.redhat.io 中拉取正确的镜像。(LOG-1624)
在更新前，ServiceAccount 有一个权限问题，这会导致错误，如 no permissions for [indices:admin/aliases/get]。在这个版本中，权限修复解决了这个问题。(LOG-1657)
在更新前，Red Hat OpenShift Logging Operator 的自定义资源定义 (CRD) 缺少 Loki 输出类型，这会导致准入控制器拒绝 ClusterLogForwarder 自定义资源对象。在这个版本中，CRD 包含 Loki 作为输出类型，以便管理员可以配置 ClusterLogForwarder 以将日志发送到 Loki 服务器。(LOG-1683)
在这个版本中，OpenShift Elasticsearch Operator 协调 ServiceAccounts 覆盖了包含 secret 的第三方拥有的字段。这会导致因为频繁重新创建 secret 而导致内存和 CPU 激增。这个版本解决了这个问题。现在，OpenShift Elasticsearch Operator 不会覆盖第三方拥有的字段。(LOG-1714)
在更新前，在 ClusterLogging 自定义资源 (CR) 定义中，如果您指定了 flush_interval 值但没有将 flush_mode 设置为 interval，Red Hat OpenShift Logging Operator 会生成 Fluentd 配置。但是，Fluentd 收集器在运行时生成一个错误。在这个版本中，Red Hat OpenShift Logging Operator 会验证 ClusterLogging CR 定义，只有指定了这两个字段时才会生成 Fluentd 配置。(LOG-1723)

1.69.3. 已知问题

如果您将日志转发到外部 Elasticsearch 服务器，然后在管道 secret 中更改配置的值，如用户名和密码，Fluentd forwarder 会加载新 secret，但使用旧值连接到外部 Elasticsearch 服务器。出现这个问题的原因是，Red Hat OpenShift Logging Operator 当前不会监控 secret 的内容更改。(LOG-1652)
作为临时解决方案，如果更改了 secret，您可以强制重新部署 Fluentd Pod：
```
$ oc delete pod -l component=collector
```

1.69.4. 弃用和删除的功能

之前版本中的一些功能已被弃用或删除。

弃用的功能仍然包含在 OpenShift Logging 中，并且仍然被支持。但是，这个功能会在以后的发行版本中被删除，且不建议在新的部署中使用。

1.69.5. 使用旧的 Fluentd 和旧 syslog 方法转发日志已被弃用

从 OpenShift Container Platform 4.6 升级到现在，使用以下传统方法转发日志已被弃用，并将在以后的发行版本中删除：

使用旧的 Fluentd 方法转发日志
使用旧的 syslog 方法转发日志

反之，使用以下非传统方法：

1.69.6. CVE

例 1.26. 点击以展开 CVE

第 2 章支持

logging 子系统只支持本文档中介绍的配置选项。

不要使用任何其他配置选项，因为它们不被支持。各个 OpenShift Container Platform 发行版本的配置范例可能会有所变化，只有掌握了所有可能的配置，才能稳妥应对这样的配置变化。如果您使用本文档中描述的配置以外的配置，您的更改会被覆盖，因为 Operator 旨在协调差异。

注意

如果必须执行 OpenShift Container Platform 文档中未描述的配置，您需要将 Red Hat OpenShift Logging Operator 设置为 Unmanaged。一个不受管理的 OpenShift Logging 环境不被支持，且不会接收更新，直到 OpenShift Logging 返回到 Managed。

注意

Red Hat OpenShift 的 logging 子系统是一个建议的收集器，以及应用程序、基础架构和审计日志的规范化程序。它旨在将日志转发到各种支持的系统。

Red Hat OpenShift 的 logging 子系统不是：

一个大规模日志收集系统
兼容安全信息和事件监控 (SIEM)
历史或长日志的保留或存储
保证的日志接收器
安全存储 - 默认不存储审计日志

第 3 章 Logging 5.6

3.1. 日志记录 5.6 发行注记

注意

stable 频道只为日志记录的最新版本提供更新。要继续获得之前版本的更新，您必须将订阅频道改为 stable-X，其中 X 是您安装的日志记录版本。

3.1.1. Logging 5.6.11

此发行版本包括 OpenShift Logging 程序错误修复 5.6.11。

3.1.1.1. 程序错误修复

在此次更新之前，LokiStack 网关会广泛缓存授权请求。因此，这会导致错误的授权结果。在这个版本中，Loki 网关缓存以更精细的方式缓存来解决这个问题。(LOG-4435)

3.1.1.2. CVE

3.1.2. Logging 5.6.8

此发行版本包括 OpenShift Logging 程序错误修复 5.6.8。

3.1.2.1. 程序错误修复

在此次更新之前，当输入匹配标签值包含 ClusterLogForwarder 中的 / 字符时，向量收集器意外终止。在这个版本中，通过引用 match 标签解决了这个问题，使收集器能够启动和收集日志。(LOG-4091)
在此次更新之前，当在 OpenShift Container Platform Web 控制台中查看日志时，点更多数据可用选项仅在第一次点击时加载更多日志条目。在这个版本中，每次点击时会加载更多条目。(OU-187)
在此次更新之前，当在 OpenShift Container Platform Web 控制台中查看日志时，点 streaming 选项只显示 流传输 日志消息，而无需显示实际日志。在这个版本中，消息和日志流都会正确显示。(OU-189)
在此次更新之前，Loki Operator 会重置错误，导致识别配置问题很难排除故障。在这个版本中，错误会保留，直到配置错误解决为止。(LOG-4158)
在此次更新之前，具有超过 8,000 个命名空间的集群会导致 Elasticsearch 拒绝查询，因为命名空间列表大于 http.max_header_size 设置。在这个版本中，标头大小的默认值有所增加，从而解决了这个问题。(LOG-4278)

3.1.2.2. CVE

3.1.3. Logging 5.6.7

此发行版本包括 OpenShift Logging 程序错误修复 5.6.7。

3.1.3.1. 程序错误修复

在此次更新之前，LokiStack 网关返回命名空间的标签值，而无需应用用户的访问权限。在这个版本中，Loki 网关应用标签值请求的权限，从而解决了这个问题。(LOG-3728)
在此次更新之前，当消息包含时间戳时，日志消息的 time 字段不会默认解析为 Fluentd 中的 structured.time。在这个版本中，如果输出目的地支持，解析的日志消息将包含一个 structured.time 字段。(LOG-4090)
在此次更新之前，LokiStack 路由配置会导致查询运行时间超过 30 秒。在这个版本中，Loki global 和 per-tenant queryTimeout 设置会影响路由超时设置，从而解决了这个问题。(LOG-4130)
在此次更新之前，带有为租户限制定义的值的 LokiStack CR，但没有全局限制会导致 Loki Operator 崩溃。在这个版本中，Operator 可以处理仅定义租户限制的 LokiStack CR，从而解决了这个问题。(LOG-4199)
在此次更新之前，OpenShift Container Platform Web 控制台会在升级后生成错误，因为 web 浏览器保留了之前版本的缓存文件。在这个版本中，这些文件不再被缓存，从而解决了这个问题。(LOG-4099)
在此次更新之前，Vector 在转发到默认 Loki 实例时会生成证书错误。在这个版本中，可以使用 Vector 将日志在没有错误的情况下转发到 Loki。(LOG-4184)
在此次更新之前，当 tls.insecureSkipVerify 选项被设置为 true 时，Cluster Logging Operator API 需要一个由 secret 提供的证书。在这个版本中，Cluster Logging Operator API 不再需要在这样的情形中由 secret 提供证书。以下配置已添加到 Operator 的 CR 中：
```
tls.verify_certificate = false
tls.verify_hostname = false
```
(LOG-4146)

3.1.3.2. CVE

CVE-2021-26341
CVE-2021-33655
CVE-2021-33656
CVE-2022-1462
CVE-2022-1679
CVE-2022-1789
CVE-2022-2196
CVE-2022-2663
CVE-2022-3028
CVE-2022-3239
CVE-2022-3522
CVE-2022-3524
CVE-2022-3564
CVE-2022-3566
CVE-2022-3567
CVE-2022-3619
CVE-2022-3623
CVE-2022-3625
CVE-2022-3627
CVE-2022-3628
CVE-2022-3707
CVE-2022-3970
CVE-2022-4129
CVE-2022-20141
CVE-2022-25147
CVE-2022-25265
CVE-2022-30594
CVE-2022-36227
CVE-2022-39188
CVE-2022-39189
CVE-2022-41218
CVE-2022-41674
CVE-2022-42703
CVE-2022-42720
CVE-2022-42721
CVE-2022-42722
CVE-2022-43750
CVE-2022-47929
CVE-2023-0394
CVE-2023-0461
CVE-2023-1195
CVE-2023-1582
CVE-2023-2491
CVE-2023-22490
CVE-2023-23454
CVE-2023-23946
CVE-2023-25652
CVE-2023-25815
CVE-2023-27535
CVE-2023-29007

3.1.4. Logging 5.6.6

此发行版本包括 OpenShift Logging 程序错误修复 5.6.6。

3.1.4.1. 程序错误修复

在此次更新之前，在将 ClusterLogForwarder 自定义资源配置为写入与有效负载中键匹配的 Kafka 输出主题时，会丢弃信息，因为出现错误。在这个版本中，这个问题已通过在 Fluentd 的缓冲名称前添加一个下划线前缀来解决。(LOG-3458)
在此次更新之前，当内节点被重复使用并且有多个具有相同内节点的条目时，Fluentd 中会出现监控被提早关闭的问题。在这个版本中，在 Fluentd 位置文件中提早关闭监控的问题已解决。(LOG-3629)
在此次更新之前，Fluentd 的 JavaScript 客户端多行异常的检测会失败，从而导致它们以多行打印。在这个版本中，例外会以一行输出，从而解决了这个问题。(LOG-3761)
在此次更新之前，从 Red Hat Openshift Logging Operator 版本 4.6 直接升级到 5.6 版本，从而导致功能问题。在这个版本中，升级范围被限制在两个版本内，从而解决了这个问题。(LOG-3837)
在此次更新之前，Splun 或 Google Logging 输出不会显示指标。在这个版本中，这个问题已通过为 HTTP 端点发送指标来解决。(LOG-3932)
在此次更新之前，当 ClusterLogForwarder 自定义资源被删除时，收集器 Pod 会继续运行。在这个版本中，在不启用日志转发时，收集器 Pod 不会运行。(LOG-4030)
在此次更新之前，无法通过点击并在日志直方图上拖动，在 OpenShift Container Platform Web 控制台中选择时间范围。在这个版本中，可以使用单击和拖动来成功选择时间范围。(LOG-4101)
在此次更新之前，监视文件的 Fluentd 哈希值是使用对日志文件的路径生成的，从而导致日志轮转时没有唯一的哈希值。在这个版本中，监视文件的哈希值使用内节点号创建，从而解决了这个问题。(LOG-3633)
在此次更新之前，点 OpenShift Container Platform Web 控制台中的 Show Resources 链接不会产生任何影响。在这个版本中，通过修复 Show Resources 链接的功能来解决这个问题，以切换每个日志条目的资源显示。(LOG-4118)

3.1.4.2. CVE

3.1.5. Logging 5.6.5

此发行版本包括 OpenShift Logging 程序错误修复 5.6.5。

3.1.5.1. 程序错误修复

在此次更新之前，模板定义会阻止 Elasticsearch 索引一些标签和 namespace_labels，从而导致数据 ingestion 出现问题。在这个版本中，修复替换了标签中的点和斜杠，以确保正确修正、有效地解决问题。(LOG-3419)
在此次更新之前，如果 OpenShift Web 控制台的 Logs 页面无法连接到 LokiStack，则会显示通用错误消息，从而不提供额外的上下文或故障排除建议。在这个版本中，错误消息已被改进，使其包含更具体的故障排除详情和建议。(LOG-3750)
在此次更新之前，时间范围格式不会被验证，从而导致选择自定义日期范围的错误。在这个版本中，时间格式会被验证，允许用户选择有效的范围。如果选择了无效的时间范围格式，则会向用户显示错误消息。(LOG-3583)
在此次更新之前，当在 Loki 中搜索日志时，即使表达式的长度不超过 5120 个字符，查询也会在很多情况下失败。在这个版本中，查询授权标签匹配程序已被优化，从而解决了这个问题。(LOG-3480)
在此次更新之前，Loki Operator 无法生成一个 memberlist 配置，该配置足以在使用 memberlist 进行私有 IP 时查找所有组件。在这个版本中，确保生成的配置包含公告的端口，从而成功查找所有组件。(LOG-4008)

3.1.5.2. CVE

3.1.6. Logging 5.6.4

此发行版本包括 OpenShift Logging 程序错误修复 5.6.4。

3.1.6.1. 程序错误修复

在此次更新之前，当 LokiStack 部署为日志存储时，Loki pod 生成的日志会被收集并发送到 LokiStack。在这个版本中，Loki 生成的日志不包括在集合中，不会存储。(LOG-3280)
在此次更新之前，当 OpenShift Web 控制台的 Logs 页面中的查询编辑器为空时，下拉菜单不会被填充。在这个版本中，如果尝试空查询，会显示错误消息，且下拉菜单现在会如预期填充。(LOG-3454)
在此次更新之前，当 tls.insecureSkipVerify 选项被设置为 true 时，Cluster Logging Operator 会生成不正确的配置。因此，当尝试跳过证书验证时，Operator 无法将数据发送到 Elasticsearch。在这个版本中，Cluster Logging Operator 会生成正确的 TLS 配置，即使启用了 tls.insecureSkipVerify。因此，即使尝试跳过证书验证，数据也可以成功发送到 Elasticsearch。(LOG-3475)
在此次更新之前，当启用结构化解析且消息转发到多个目的地时，它们不会被深度复制。这会导致一些接收的日志，包括结构化消息，而其他日志则没有。在这个版本中，在 JSON 解析前，配置生成已被修改为深度复制信息。因此，所有收到的消息现在都包含结构化消息，即使它们被转发到多个目的地。(LOG-3640)
在此次更新之前，如果 collection 字段包含 {}，可能会导致 Operator 崩溃。在这个版本中，Operator 将忽略这个值，允许 Operator 在不中断的情况下平稳运行。(LOG-3733)
在此次更新之前，LokiiHost 的 Gateway 组件的 nodeSelector 属性没有任何效果。在这个版本中，nodeSelector 属性可以正常工作。(LOG-3783)
在此次更新之前，静态 LokiStack memberlist 配置只依赖于私有 IP 网络。因此，当 OpenShift Container Platform 集群 pod 网络配置了公共 IP 范围时，Lokiition pod 会出现 crashloop。在这个版本中，Loki 管理员可以选择将 pod 网络用于 memberlist 配置。这解决了这个问题，并防止 LokiStack pod 在 OpenShift Container Platform 集群 pod 网络配置了公共 IP 范围时进入 crashloop 状态。(LOG-3814)
在此次更新之前，如果 tls.insecureSkipVerify 字段设置为 true，Cluster Logging Operator 会生成不正确的配置。因此，当尝试跳过证书验证时，Operator 无法将数据发送到 Elasticsearch。在这个版本中，即使启用了 tls.insecureSkipVerify，Operator 也会生成正确的 TLS 配置。因此，即使尝试跳过证书验证，数据也可以成功发送到 Elasticsearch。(LOG-3838)
在此次更新之前，如果 Cluster Logging Operator (CLO) 安装没有 Elasticsearch Operator，则 CLO pod 会持续显示与删除 Elasticsearch 相关的错误消息。在这个版本中，CLO 在显示任何错误消息前执行额外的检查。因此，没有 Elasticsearch Operator 时不再显示与 Elasticsearch 删除相关的错误消息。(LOG-3763)

3.1.6.2. CVE

3.1.7. Logging 5.6.3

此发行版本包括 OpenShift Logging 程序错误修复 5.6.3。

3.1.7.1. 程序错误修复

在此次更新之前，Operator 将网关租户 secret 信息存储在配置映射中。在这个版本中，Operator 将此信息存储在 secret 中。(LOG-3717)
在此次更新之前，Fluentd 收集器不会捕获存储在 /var/log/auth-server/audit.log 中的 OAuth 登录事件。在这个版本中，Fluentd 会捕获这些 OAuth 登录事件，从而解决了这个问题。(LOG-3729)

3.1.7.2. CVE

3.1.8. 日志记录 5.6.2

此发行版本包括 OpenShift Logging 程序错误修复 5.6.2。

3.1.8.1. 程序错误修复

在此次更新之前，收集器没有根据 systemd 日志的优先级正确设置 level 字段。在这个版本中，level 字段会被正确设置。(LOG-3429)
在此次更新之前，Operator 会错误地在 OpenShift Container Platform 4.12 或更高版本上生成不兼容警告。在这个版本中，Operator 最大 OpenShift Container Platform 版本值已被修正，从而解决了这个问题。(LOG-3584)
在此次更新之前，创建一个带有 default 值的 ClusterLogForwarder 自定义资源(CR)不会生成任何错误。在这个版本中，这个值无效生成的错误警告。(LOG-3437)
在此次更新之前，当 ClusterLogForwarder 自定义资源 (CR) 配置了多个管道时，会将一个输出设置为默认，收集器 Pod 会重启。在这个版本中，输出验证的逻辑已被修正，从而解决了这个问题。(LOG-3559)
在此次更新之前，收集器 Pod 在创建后会重启。在这个版本中，部署的收集器不会自行重启。(LOG-3608)
在此次更新之前，补丁版本会从目录中删除了 Operator 的早期版本。这使得无法安装旧版本。这个版本更改了捆绑包配置，以便以前的同一次版本的发行版本保留在目录中。(LOG-3635)

3.1.8.2. CVE

3.1.9. Logging 5.6.1

此发行版本包括 OpenShift Logging 程序错误修复 5.6.1。

3.1.9.1. 程序错误修复

在此次更新之前，紧凑器会在保留活跃时报告 TLS 证书错误与 querier 通信。在这个版本中，紧凑器和 querier 不再通过 HTTP 进行通信。(LOG-3494)
在此次更新之前，Loki Operator 不会重试设置 LokiStack CR 的状态，这会导致过时的状态信息。在这个版本中，Operator 会重试冲突的状态信息更新。(LOG-3496)
在此次更新之前，当 kube-apiserver-operator Operator 检查 Webhook 的有效性时，Loki Operator Webhook 服务器会导致 TLS 错误。在这个版本中，Loki Operator Webhook PKI 由 Operator Lifecycle Manager (OLM) 管理，从而解决了这个问题。(LOG-3510)
在此次更新之前，LokiStack Gateway Labels Enforcer 会在使用带有布尔值表达式的组合标签过滤器时为有效的 LogQL 查询生成解析错误。在这个版本中，LokiStack LogQL 实现支持带有布尔值表达式的标签过滤器，并解决这个问题。(LOG-3441),(LOG-3397)
在此次更新之前，如果多个标签键具有相同的前缀，一些键包含点，则写入 Elasticsearch 的记录将失败。在这个版本中，下划线替换标签键中的点，从而解决了这个问题。(LOG-3463)
在此次更新之前，因为 OpenShift Container Platform 控制台和 logging-view-plugin 之间的不兼容，Red Hat OpenShift Logging Operator 不适用于 OpenShift Container Platform 4.10 集群。在这个版本中，插件可以与 OpenShift Container Platform 4.10 管理控制台正确集成。(LOG-3447)
在此次更新之前，ClusterLogForwarder 自定义资源的协调会错误地报告引用默认日志存储的管道的降级状态。在这个版本中，管道会正确验证。(LOG-3477)

3.1.9.2. CVE

3.1.10. Logging 5.6.0

此版本包括 OpenShift Logging Release 5.6。

3.1.10.1. 弃用通知

在日志记录版本 5.6 中，Fluentd 已被弃用，计划在以后的发行版本中删除。红帽将在当前发行生命周期中提供对这个功能的程序漏洞修复和支持，但这个功能将不再获得改进，并将被删除。作为 Fluentd 的替代选择，您可以使用 Vector。

3.1.10.2. 功能增强

在这个版本中，日志记录与 OpenShift Container Platform 集群范围的加密策略兼容。(LOG-895)
在这个版本中，您可以通过 LokiStack 自定义资源（按优先级排序）来为每个租户、每个流和全局策略保留策略声明。(LOG-2695)
在这个版本中，Splun 是日志转发的可用输出选项。(LOG-2913)
在这个版本中，Vector 替换了 Fluentd 作为默认的 Collector。(LOG-2222)
在这个版本中，Developer 角色可以访问在运行 OpenShift Container Platform 4.11 及更高版本的集群中将其分配到的 Log Console Plugin 中的每个项目工作负载日志。(LOG-3388)
在这个版本中，任何源的日志包含一个字段 openshift.cluster_id，它是部署 Operator 的集群的唯一标识符。您可以使用以下命令查看 clusterID 值。(LOG-2715)

$ oc get clusterversion/version -o jsonpath='{.spec.clusterID}{"\n"}'

3.1.10.3. 已知问题

在此次更新之前，如果多个标签键具有相同的前缀，并且一些键包含 . 字符，则 Elasticsearch 将拒绝日志。这通过将标签键中的 . 替换为 _ 来解决 Elasticsearch 的限制。这个问题的一个临时解决方案是删除导致错误的标签，或向标签添加一个命名空间。(LOG-3463)

3.1.10.4. 程序错误修复

在此次更新之前，如果您删除了 Kibana 自定义资源，OpenShift Container Platform Web 控制台将继续显示到 Kibana 的链接。在这个版本中，删除 Kibana 自定义资源也会删除该链接。(LOG-2993)
在此次更新之前，用户无法查看其有权访问的命名空间的应用程序日志。在这个版本中，Loki Operator 会自动创建一个集群角色和集群角色绑定，允许用户读取应用程序日志。(LOG-3072)
在此次更新之前，Operator 在使用 LokiStack 作为默认日志存储时删除了 ClusterLogForwarder 自定义资源中定义的任何自定义输出。在这个版本中，Operator 会在处理 ClusterLogForwarder 自定义资源时将自定义输出与默认输出合并。(LOG-3090)
在此次更新之前，CA 密钥用作将 CA 挂载到 Loki 的卷名称，从而导致 CA Key 包含非格式字符（如点）时出现错误状态。在这个版本中，卷名称标准化为一个内部字符串，用于解决这个问题。(LOG-3331)
在此次更新之前，在 LokiStack 自定义资源定义中设置的默认值，会导致无法创建 LokiStack 实例，而无需 ReplicationFactor 为 1。在这个版本中，Operator 为使用的大小设置实际值。(LOG-3296)
在此次更新之前，当启用 JSON 解析时向量解析消息字段，而不定义 structuredTypeKey 或 structuredTypeName 值。在这个版本中，在将结构化日志写入 Elasticsearch 时，structuredTypeKey 或 structuredTypeName 所需的值。(LOG-3195)
在此次更新之前，Elasticsearch Operator 的 secret 创建组件会持续修改的内部 secret。在这个版本中，现有 secret 会被正确处理。(LOG-3161)
在此次更新之前，Operator 可以在 Elasticsearch 或 Kibana 部署改变状态时，输入删除和重新创建收集器 daemonset 的循环。在这个版本中，Operator 状态处理中会解决这个问题。(LOG-3157)
在此次更新之前，Kibana 有一个固定的 24h OAuth cookie 过期时间，当 accessTokenInactivityTimeout 字段被设置为小于 24h 的值时，会导致 Kibana 中的 401 错误。在这个版本中，Kibana 的 OAuth cookie 过期时间与 accessTokenInactivityTimeout 同步，默认值为 24h。(LOG-3129)
在此次更新之前，协调资源的 Operator 常规模式是在尝试获取或更新前尝试和创建，这会导致创建后持续的 HTTP 409 响应。在这个版本中，Operator 会首先尝试检索对象，仅在缺少或未指定对象时创建或更新它。(LOG-2919)
在此次更新之前，Fluentd 中的 .level 和'.structure.level 字段可能包含不同的值。在这个版本中，每个字段的值都相同。(LOG-2819)
在此次更新之前，Operator 不会等待可信 CA 捆绑包填充，并在更新捆绑包后再次部署收集器。在这个版本中，Operator 会在继续收集器部署前，等待简要查看捆绑包是否已填充。(LOG-2789)
在此次更新之前，日志记录遥测信息在检查指标时会出现两次。在这个版本中，日志记录遥测信息会如预期显示。(LOG-2315)
在此次更新之前，Fluentd pod 日志会在启用 JSON 解析添加后包含警告信息。在这个版本中，不会显示警告信息。(LOG-1806)
在此次更新之前，must-gather 脚本无法完成，因为 oc 需要具有写入权限的文件夹来构建其缓存。在这个版本中，oc 对文件夹有写入权限，must-gather 脚本可以成功完成。(LOG-3446)
在此次更新之前，日志收集器 SCC 可以替换为集群上的其他 SCC，从而导致收集器不可用。在这个版本中，设置日志收集器 SCC 的优先级，使其优先于其他 SCC。(LOG-3235)
在此次更新之前，向量缺少字段 sequence，它被添加到 fluentd 中，作为处理缺少实际纳秒精度的方法。在这个版本中，字段 openshift.sequence 已添加到事件日志中。(LOG-3106)

3.1.10.5. CVE

3.2. 日志 5.6 入门

此日志部署过程概述提供了便于参考。它不是完整的文档。对于新的安装，建议使用 Vector 和 LokiStack。

注意

从日志记录版本 5.5 开始，您可以选择从 Fluentd 或 Vector 收集器实现中选择，Elasticsearch 或 LokiStack 作为日志存储。有关日志记录的文档正在更新，以反映这些底层组件更改。

注意

先决条件

日志存储首选项：Elasticsearch 或 LokiStack
收集器实现首选项：Fluentd 或 Vector
日志转发输出的凭证

注意

从日志记录版本 5.4.3 开始，Elasticsearch Operator 已被弃用，计划在以后的发行版本中删除。红帽将在当前发行生命周期中提供对这个功能的程序漏洞修复和支持，但这个功能将不再获得改进，并将被删除。作为使用 Elasticsearch Operator 管理默认日志存储的替代选择，您可以使用 Loki Operator。

为您要使用的日志存储安装 Operator。
- 对于 Elasticsearch，安装 OpenShift Elasticsearch Operator。
- 对于 LokiStack，请安装 Loki Operator。
  - 创建 LokiStack 自定义资源 (CR) 实例。
安装 Red Hat OpenShift Logging Operator。
创建 ClusterLogging 自定义资源 (CR) 实例。
1. 选择您的 Collector 实现。
  注意
  从日志记录版本 5.6 Fluentd 开始，计划在以后的发行版本中删除。红帽将在当前发行生命周期中提供对这个功能的程序漏洞修复和支持，但这个功能将不再获得改进，并将被删除。作为 Fluentd 的替代选择，您可以使用 Vector。
创建 ClusterLogForwarder 自定义资源 (CR) 实例。
为所选输出管道创建 secret。

3.3. 了解日志记录

logging 子系统由这些逻辑组件组成：

collector - 从每个节点读取容器日志数据，并将日志数据转发到配置的输出。
store - 存储用于分析的日志数据；转发器的默认输出。
visualization - 用于搜索、查询和查看存储日志的图形界面。

这些组件由 Operator 和自定义资源 (CR) YAML 文件管理。

Red Hat OpenShift 的 logging 子系统会收集容器日志和节点日志。它们被归类为：

Application - 非基础架构容器生成的容器日志。
Infrastructure - 容器日志来自命名空间 kube-* 和 openshift-\*，节点日志来自 journald。
audit - 日志来自 auditd, kube-apiserver, openshift-apiserver, 和 ovn（如果启用）。

日志记录收集器是一个 daemonset，它将 pod 部署到每个 OpenShift Container Platform 节点。系统及基础架构日志由来自操作系统、容器运行时和 OpenShift Container Platform 的日志消息生成。

容器日志由集群中运行的 pod 中运行的容器生成。每个容器生成单独的日志流。收集器从这些源收集日志，并在 ClusterLogForwarder 自定义资源中内部或外部转发它们。

3.4. 管理日志记录部署

3.4.1. 使用 Web 控制台部署 Red Hat OpenShift Logging Operator

您可以使用 OpenShift Container Platform Web 控制台来部署 Red Hat OpenShift Logging Operator。

先决条件

流程

使用 OpenShift Container Platform Web 控制台部署 Red Hat OpenShift Logging Operator：

安装 Red Hat OpenShift Logging Operator：
1. 在 OpenShift Container Platform Web 控制台中，点击 Operators → OperatorHub。
2. 在 Filter by keyword 字段中输入 Logging。
3. 从可用的 Operator 列表中选择 Red Hat OpenShift Logging，然后点 Install。
4. 选择 stable 或 stable-5.y 作为 更新频道。
  注意
  stable 频道只为日志记录的最新版本提供更新。要继续获得之前版本的更新，您必须将订阅频道改为 stable-X，其中 X 是您安装的日志记录版本。
5. 确保在 Installation Mode 下选择了 A specific namespace on the cluster。
6. 确定在 Installed Namespace 下的 Operator recommended namespace 是 openshift-logging。
7. 选择 Enable Operator recommended cluster monitoring on this Namespace。
8. 为 Update approval 选择一个选项。
  - Automatic 选项允许 Operator Lifecycle Manager (OLM) 在有新版本可用时自动更新 Operator。
  - Manual 选项需要具有适当凭证的用户批准 Operator 更新。
9. 为 Console 插件选择 Enable 或 Disable。
10. 点 Install。
通过切换到 Operators → Installed Operators 页来验证 Red Hat OpenShift Logging Operator 是否已安装。
1. 确保 openshift-logging 项目中列出的 Red Hat OpenShift Logging 的 Status 为 InstallSucceeded。
创建 ClusterLogging 实例。
注意
Web 控制台的表单视图不包括所有可用的选项。建议您使用 YAML 视图 来完成您的设置。
1. 在 collection 部分中，选择一个 Collector Implementation。
  注意
  从日志记录版本 5.6 Fluentd 开始，计划在以后的发行版本中删除。红帽将在当前发行生命周期中提供对这个功能的程序漏洞修复和支持，但这个功能将不再获得改进，并将被删除。作为 Fluentd 的替代选择，您可以使用 Vector。
2. 在 logStore 部分中，选择一个类型。
  注意
  从日志记录版本 5.4.3 开始，Elasticsearch Operator 已被弃用，计划在以后的发行版本中删除。红帽将在当前发行生命周期中提供对这个功能的程序漏洞修复和支持，但这个功能将不再获得改进，并将被删除。作为使用 Elasticsearch Operator 管理默认日志存储的替代选择，您可以使用 Loki Operator。
3. 点 Create。

3.4.2. 使用 Web 控制台部署 Loki Operator

您可以使用 OpenShift Container Platform Web 控制台安装 Loki Operator。

先决条件

支持的日志存储(AWS S3、Google Cloud Storage、Azure、Swift、Minio、OpenShift Data Foundation)

流程

使用 OpenShift Container Platform Web 控制台安装 Loki Operator：

在 OpenShift Container Platform Web 控制台中，点击 Operators → OperatorHub。
在 Filter by keyword 字段中输入 Loki。
1. 从可用的 Operator 列表中选择 Loki Operator，然后点 Install。
选择 stable 或 stable-5.y 作为 更新频道。
注意
stable 频道只为日志记录的最新版本提供更新。要继续获得之前版本的更新，您必须将订阅频道改为 stable-X，其中 X 是您安装的日志记录版本。
确保在 Installation Mode 下选择了 All namespaces on the cluster。
确定在 Installed Namespace 下选择了 openshift-operators-redhat。
选择 Enable Operator recommended cluster monitoring on this Namespace。
这个选项在 Namespace 对象中设置 openshift.io/cluster-monitoring: "true" 标识。您必须设置这个选项，以确保集群监控提取 openshift-operators-redhat 命名空间。
为 Update approval 选择一个选项。
- Automatic 选项允许 Operator Lifecycle Manager (OLM) 在有新版本可用时自动更新 Operator。
- Manual 选项需要具有适当凭证的用户批准 Operator 更新。
点 Install。
通过切换到 Operators → Installed Operators 页来验证 LokiOperator 已被安装。
1. 确定在所有项目中，列出的 LokiOperator 的 Status 为 Succeeded。

创建一个 Secret YAML 文件，它使用 access_key_id 和 access_key_secret 字段指定您的凭证和 bucketnames、endpoint 和 region 来定义对象存储位置。AWS 在以下示例中使用：

apiVersion: v1
kind: Secret
metadata:
  name: logging-loki-s3
  namespace: openshift-logging
stringData:
  access_key_id: AKIAIOSFODNN7EXAMPLE
  access_key_secret: wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY
  bucketnames: s3-bucket-name
  endpoint: https://s3.eu-central-1.amazonaws.com
  region: eu-central-1

在 Details 选项卡中，选择 LokiStack 下的 Create instance。然后选择 YAML 视图。粘贴以下模板，根据实际情况替换相关的值。
```
  apiVersion: loki.grafana.com/v1
  kind: LokiStack
  metadata:
    name: logging-loki 1
    namespace: openshift-logging
  spec:
    size: 1x.small 2
    storage:
      schemas:
      - version: v12
        effectiveDate: '2022-06-01'
      secret:
        name: logging-loki-s3 3
        type: s3 4
    storageClassName: <storage_class_name> 5
    tenants:
      mode: openshift-logging
```
1
名称应该是 logging-loki。
2
选择您的 Loki 部署大小。
3
定义用于日志存储的 secret。
4
定义对应的存储类型。
5
为临时存储输入现有存储类的名称。为获得最佳性能，请指定分配块存储的存储类。可以使用 oc get storageclasses 列出集群的可用存储类。
应用配置：
oc apply -f logging-loki.yaml

创建或编辑 ClusterLogging CR：

  apiVersion: logging.openshift.io/v1
  kind: ClusterLogging
  metadata:
    name: instance
    namespace: openshift-logging
  spec:
    managementState: Managed
    logStore:
      type: lokistack
      lokistack:
        name: logging-loki
      collection:
        type: vector

应用配置：
```
oc apply -f cr-lokistack.yaml
```

3.4.3. 使用 CLI 从 OperatorHub 安装

您可以使用 CLI 从 OperatorHub 安装 Operator，而不必使用 OpenShift Container Platform Web 控制台。使用 oc 命令来创建或更新一个订阅对象。

先决条件

使用具有 cluster-admin 权限的账户访问 OpenShift Container Platform 集群。
在您的本地系统安装 oc 命令。

流程

查看 OperatorHub 中集群可用的 Operator 列表：

$ oc get packagemanifests -n openshift-marketplace

输出示例

NAME                               CATALOG               AGE
3scale-operator                    Red Hat Operators     91m
advanced-cluster-management        Red Hat Operators     91m
amq7-cert-manager                  Red Hat Operators     91m
...
couchbase-enterprise-certified     Certified Operators   91m
crunchy-postgres-operator          Certified Operators   91m
mongodb-enterprise                 Certified Operators   91m
...
etcd                               Community Operators   91m
jaeger                             Community Operators   91m
kubefed                            Community Operators   91m
...

记录下所需 Operator 的目录。

检查所需 Operator，以验证其支持的安装模式和可用频道：
```
$ oc describe packagemanifests <operator_name> -n openshift-marketplace
```
一个 Operator 组（由 OperatorGroup 对象定义），在其中选择目标命名空间，在其中为与 Operator 组相同的命名空间中的所有 Operator 生成所需的 RBAC 访问权限。
订阅 Operator 的命名空间必须具有与 Operator 的安装模式相匹配的 Operator 组，可采用 AllNamespaces 模式，也可采用 SingleNamespace 模式。如果您要使用 AllNamespaces 安装 Operator，则 openshift-operators 命名空间已有适当的 Operator 组。
如果要安装的 Operator 采用 SingleNamespace 模式，而您没有适当的 Operator 组，则必须创建一个。
注意
在选择 SingleNamespace 模式时，该流程的 Web 控制台版本会在后台自动为您处理 OperatorGroup 和 Subscription 对象的创建。
1. 创建 OperatorGroup 对象 YAML 文件，如 operatorgroup.yaml：
  OperatorGroup 对象示例
```
apiVersion: operators.coreos.com/v1
kind: OperatorGroup
metadata:
  name: <operatorgroup_name>
  namespace: <namespace>
spec:
  targetNamespaces:
  - <namespace>
```
2. 创建 OperatorGroup 对象：
```
$ oc apply -f operatorgroup.yaml
```
创建一个 Subscription 对象 YAML 文件，以便为 Operator 订阅一个命名空间，如 sub.yaml：
Subscription 对象示例
```
apiVersion: operators.coreos.com/v1alpha1
kind: Subscription
metadata:
  name: <subscription_name>
  namespace: openshift-operators 1
spec:
  channel: <channel_name> 2
  name: <operator_name> 3
  source: redhat-operators 4
  sourceNamespace: openshift-marketplace 5
  config:
    env: 6
    - name: ARGS
      value: "-v=10"
    envFrom: 7
    - secretRef:
        name: license-secret
    volumes: 8
    - name: <volume_name>
      configMap:
        name: <configmap_name>
    volumeMounts: 9
    - mountPath: <directory_name>
      name: <volume_name>
    tolerations: 10
    - operator: "Exists"
    resources: 11
      requests:
        memory: "64Mi"
        cpu: "250m"
      limits:
        memory: "128Mi"
        cpu: "500m"
    nodeSelector: 12
      foo: bar
```
1
对于 AllNamespaces 安装模式的使用，指定 openshift-operators 命名空间。否则，为 SingleNamespace 安装模式使用指定相关单一命名空间。
2
要订阅的频道的名称。
3
要订阅的 Operator 的名称。
4
提供 Operator 的目录源的名称。
5
目录源的命名空间。将 openshift-marketplace 用于默认的 OperatorHub 目录源。
6
env 参数定义必须存在于由 OLM 创建的 pod 中所有容器中的环境变量列表。
7
envFrom 参数定义要在容器中填充环境变量的源列表。
8
volumes 参数定义 OLM 创建的 pod 上必须存在的卷列表。
9
volumeMounts 参数定义由 OLM 创建的 pod 中必须存在的 VolumeMounts 列表。如果 volumeMount 引用不存在的 卷，OLM 无法部署 Operator。
10
tolerations 参数为 OLM 创建的 pod 定义 Tolerations 列表。
11
resources 参数为 OLM 创建的 pod 中所有容器定义资源限制。
12
nodeSelector 参数为 OLM 创建的 pod 定义 NodeSelector。
创建 Subscription 对象：
```
$ oc apply -f sub.yaml
```
此时，OLM 已了解所选的 Operator。Operator 的集群服务版本（CSV）应出现在目标命名空间中，由 Operator 提供的 API 应可用于创建。

3.4.4. 使用 Web 控制台从集群中删除 Operator

集群管理员可以使用 Web 控制台从所选命名空间中删除已安装的 Operator。

先决条件

使用具有 cluster-admin 权限的账户访问 OpenShift Container Platform 集群 Web 控制台。

流程

进入到 Operators → Installed Operators 页面。
在 Filter by name 字段中滚动或输入关键字以查找您要删除的 Operator。然后点它。
在 Operator Details 页面右侧，从 Actions 列表中选择 Uninstall Operator。
此时会显示 Uninstall Operator? 对话框。
选择 Uninstall 来删除 Operator、Operator 部署和 pod。按照此操作，Operator 将停止运行，不再接收更新。
注意
此操作不会删除 Operator 管理的资源，包括自定义资源定义 (CRD) 和自定义资源 (CR) 。Web 控制台和继续运行的集群资源启用的仪表板和导航项可能需要手动清理。要在卸载 Operator 后删除这些，您可能需要手动删除 Operator CRD。

3.4.5. 使用 CLI 从集群中删除 Operator

集群管理员可以使用 CLI 从所选命名空间中删除已安装的 Operator。

先决条件

使用具有 cluster-admin 权限的账户访问 OpenShift Container Platform 集群。
已在工作站上安装 oc 命令。

流程

通过 currentCSV 字段检查已订阅 Operator 的当前版本（如 jaeger）：

$ oc get subscription jaeger -n openshift-operators -o yaml | grep currentCSV

输出示例

  currentCSV: jaeger-operator.v1.8.2

删除订阅（如 jaeger）:

$ oc delete subscription jaeger -n openshift-operators

输出示例

subscription.operators.coreos.com "jaeger" deleted

使用上一步中的 currentCSV 值来删除目标命名空间中相应 Operator 的 CSV：

$ oc delete clusterserviceversion jaeger-operator.v1.8.2 -n openshift-operators

输出示例

clusterserviceversion.operators.coreos.com "jaeger-operator.v1.8.2" deleted

3.5. 日志记录参考

3.5.1. 收集器功能

输出	协议	测试使用	Fluentd	Vector
Cloudwatch	REST over HTTP(S)		✓	✓
Elasticsearch v6		v6.8.1	✓	✓
Elasticsearch v7		v7.12.2, 7.17.7	✓	✓
Elasticsearch v8		v8.4.3		✓
Fluent Forward	Fluentd forward v1	Fluentd 1.14.6, Logstash 7.10.1	✓
Google Cloud Logging				✓
HTTP	HTTP 1.1	Fluentd 1.14.6, Vector 0.21
Kafka	Kafka 0.11	Kafka 2.4.1, 2.7.0, 3.3.1	✓	✓
Loki	REST over HTTP(S)	Loki 2.3.0, 2.7	✓	✓
Splunk	HEC	v8.2.9, 9.0.0		✓
Syslog	RFC3164, RFC5424	Rsyslog 8.37.0-9.el7	✓

表 3.1. 日志源
功能	Fluentd	Vector
应用程序容器日志	✓	✓
特定于应用程序的路由	✓	✓
命名空间划分应用程序特定路由	✓	✓
Infra 容器日志	✓	✓
Infra 日志	✓	✓
kube API 审计日志	✓	✓
OpenShift API 审计日志	✓	✓
打开虚拟网络 (OVN) 审计日志	✓	✓

表 3.2. 授权和身份验证
功能	Fluentd	Vector
Elasticsearch 证书	✓	✓
Elasticsearch 用户名/密码	✓	✓
Cloudwatch keys	✓	✓
Cloudwatch STS	✓	✓
Kafka 证书	✓	✓
Kafka 用户名/密码	✓	✓
Kafka SASL	✓	✓
Loki bearer 令牌	✓	✓

表 3.3. 规范化和转换
功能	Fluentd	Vector
ViaQ 数据模型 - 应用程序	✓	✓
ViaQ 数据模型 - infra	✓	✓
ViaQ 数据模型 - infra(journal)	✓	✓
ViaQ 数据模型 - Linux 审计	✓	✓
ViaQ 数据模型 - kube-apiserver 审计	✓	✓
ViaQ 数据模型 - OpenShift API 审计	✓	✓
ViaQ 数据模型 - OVN	✓	✓
loglevel Normalization	✓	✓
JSON 解析	✓	✓
结构化索引	✓	✓
多行错误检测	✓
multicontainer/ split 索引	✓	✓
Flatten 标签	✓	✓
CLF 静态标签	✓	✓

表 3.4. Tuning
功能	Fluentd	Vector
Fluentd readlinelimit	✓
Fluentd 缓冲	✓
- chunklimitsize	✓
- totallimitsize	✓
- overflowaction	✓
- flushthreadcount	✓
- flushmode	✓
- flushinterval	✓
- retrywait	✓
- retrytype	✓
- retrymaxinterval	✓
- retrytimeout	✓

表 3.5. 可见性
功能	Fluentd	Vector
指标	✓	✓
Dashboard	✓	✓
警报	✓

表 3.6. 其它
功能	Fluentd	Vector
全局代理支持	✓	✓
x86 支持	✓	✓
ARM 支持	✓	✓
IBM Power 支持	✓	✓
IBM Z 支持	✓	✓
IPv6 支持	✓	✓
日志事件缓冲	✓
断开连接的集群	✓	✓

其他资源

向量文档

3.5.2. Logging 5.6 API 参

3.5.2.1. ClusterLogForwarder

ClusterLogForwarder 是一个 API，用于配置转发日志。

您可以通过指定一个 pipelines 列表来配置转发，该列表从一组命名输入转发到一组命名输出。

常用日志类别有内置输入名称，您可以定义自定义输入来执行额外的过滤。

默认 openshift 日志存储有一个内置输出名称，但您可以使用 URL 和其他连接信息定义您自己的输出，将日志转发到集群内部或处理器的其他连接信息。

如需了解更多详细信息，请参阅 API 字段的文档。

属性	类型	描述
spec	对象	ClusterLogForwarder 所需的行为规格
status	对象	ClusterLogForwarder 的状态

3.5.2.1.1. .spec

3.5.2.1.1.1. 描述

ClusterLogForwarderSpec 定义如何将日志转发到远程目标。

3.5.2.1.1.1.1. 类型

对象

属性	类型	描述
输入	数组	（可选）输入被命名过滤器，用于转发日志消息。
outputDefaults	对象	（可选） DEPRECATED OutputDefaults 为默认存储明确指定 forwarder 配置。
输出	数组	（可选）输出的名称是日志消息的目的地。
pipelines	数组	Pipelines 将一组输入选择的消息转发到一组输出。

3.5.2.1.2. .spec.inputs[]

3.5.2.1.2.1. 描述

InputSpec 定义日志消息的选择器。

3.5.2.1.2.1.1. 类型

数组

属性	类型	描述
application	对象	（可选）如果存在，应用程序启用命名的`应用程序`日志集合
name	字符串	用于引用`管道`输入的名称。

3.5.2.1.3. .spec.inputs[].application

3.5.2.1.3.1. 描述

应用程序日志选择器。必须满足选择器中的所有条件（逻辑 AND）才能选择日志。

3.5.2.1.3.1.1. 类型

对象

属性	类型	描述
命名空间	数组	（可选）从中收集应用程序日志的命名空间。
selector	对象	（可选）匹配标签的 pod 的日志的 Selector。

3.5.2.1.4. .spec.inputs[].application.namespaces[]

3.5.2.1.4.1. 描述

3.5.2.1.4.1.1. 类型

数组

3.5.2.1.5. .spec.inputs[].application.selector

3.5.2.1.5.1. 描述

标签选择器，即一组资源的标签查询。

3.5.2.1.5.1.1. 类型

对象

属性	类型	描述
matchLabels	对象	（可选） matchLabels 是 {key,value} 对的映射。matchLabels 中的单个 {key,value}

3.5.2.1.6. .spec.inputs[].application.selector.matchLabels

3.5.2.1.6.1. 描述

3.5.2.1.6.1.1. 类型

对象

3.5.2.1.7. .spec.outputDefaults

3.5.2.1.7.1. 描述

3.5.2.1.7.1.1. 类型

对象

属性	类型	描述
elasticsearch	对象	（可选） Elasticsearch OutputSpec 默认值

3.5.2.1.8. .spec.outputDefaults.elasticsearch

3.5.2.1.8.1. 描述

ElasticsearchStructuredSpec 与结构化日志更改相关的 spec，以确定 elasticsearch 索引

3.5.2.1.8.1.1. 类型

对象

属性	类型	描述
enableStructuredContainerLogs	bool	（可选）启用StructuredContainerLogs 启用多容器结构化日志来允许
structuredTypeKey	字符串	（可选） StructuredTypeKey 指定要用作 elasticsearch 索引名称的元数据键
structuredTypeName	字符串	（可选） StructuredTypeName 指定 elasticsearch 模式的名称

3.5.2.1.9. .spec.outputs[]

3.5.2.1.9.1. 描述

输出定义日志消息的目的地。

3.5.2.1.9.1.1. 类型

数组

属性	类型	描述
syslog	对象	（可选）
fluentdForward	对象	（可选）
elasticsearch	对象	（可选）
kafka	对象	（可选）
cloudwatch	对象	（可选）
loki	对象	（可选）
googleCloudLogging	对象	（可选）
splunk	对象	（可选）
name	字符串	用于引用来自`管道`的输出的名称。
secret	对象	（可选）用于身份验证的 Secret。
tls	对象	TLS 包含控制 TLS 客户端连接上的选项的设置。
type	字符串	输出插件的类型。
url	字符串	（可选）将日志记录发送到的 URL。

3.5.2.1.10. .spec.outputs[].secret

3.5.2.1.10.1. 描述

OutputSecretSpec 是仅包含名称的一个 secret 引用，没有命名空间。

3.5.2.1.10.1.1. 类型

对象

属性	类型	描述
name	字符串	为日志转发器 secret 配置的命名空间中 secret 的名称。

3.5.2.1.11. .spec.outputs[].tls

3.5.2.1.11.1. 描述

OutputTLSSpec 包含与输出类型无关的 TLS 连接选项。

3.5.2.1.11.1.1. 类型

对象

属性	类型	描述
insecureSkipVerify	bool	如果 InsecureSkipVerify 为 true，则将配置 TLS 客户端来忽略证书的错误。

3.5.2.1.12. .spec.pipelines[]

3.5.2.1.12.1. 描述

PipelinesSpec 将一组输入链接到一组输出。

3.5.2.1.12.1.1. 类型

数组

属性	类型	描述
detectMultilineErrors	bool	（可选） DetectMultilineErrors 启用容器日志的多行错误检测
inputRefs	数组	inputRefs 列出此管道输入的名称 (`input.name`)。
labels	对象	（可选）应用于通过此管道传递的记录的标签。
name	字符串	（可选）名称是可选的，但如果提供，则必须在 `pipelines` 列表中唯一。
outputRefs	数组	outputRefs 列出此管道输出的名称(`output.name`)。
parse	字符串	（可选） Parse 允许将日志条目解析为结构化日志中

3.5.2.1.13. .spec.pipelines[].inputRefs[]

3.5.2.1.13.1. 描述

3.5.2.1.13.1.1. 类型

数组

3.5.2.1.14. .spec.pipelines[].labels

3.5.2.1.14.1. 描述

3.5.2.1.14.1.1. 类型

对象

3.5.2.1.15. .spec.pipelines[].outputRefs[]

3.5.2.1.15.1. 描述

3.5.2.1.15.1.1. 类型

数组

3.5.2.1.16. .status

3.5.2.1.16.1. 描述

ClusterLogForwarderStatus 定义 ClusterLogForwarder 的观察状态

3.5.2.1.16.1.1. 类型

对象

属性	类型	描述
conditions	对象	日志转发器的条件。
输入	Conditions	输入将输入名称映射到输入条件。
输出	Conditions	输出将输出名称映射到输出的条件。
pipelines	Conditions	Pipelines 将管道名称映射到管道的条件。

3.5.2.1.17. .status.conditions

3.5.2.1.17.1. 描述

3.5.2.1.17.1.1. 类型

对象

3.5.2.1.18. .status.inputs

3.5.2.1.18.1. 描述

3.5.2.1.18.1.1. 类型

Conditions

3.5.2.1.19. .status.outputs

3.5.2.1.19.1. 描述

3.5.2.1.19.1.1. 类型

Conditions

3.5.2.1.20. .status.pipelines

3.5.2.1.20.1. 描述

3.5.2.1.20.1.1. 类型

conditions== ClusterLogging 一个 Red Hat OpenShift Logging 实例。ClusterLogging 是 clusterloggings API 的 Schema

属性	类型	描述
spec	对象	ClusterLogging 所需的行为规格
status	对象	Status 定义 ClusterLogging 的观察状态

3.5.2.1.21. .spec

3.5.2.1.21.1. 描述

ClusterLoggingSpec 定义 ClusterLogging 的所需状态

3.5.2.1.21.1.1. 类型

对象

属性	类型	描述
集合	对象	集群的 Collection 组件的规格
curation	对象	(已弃用) （可选）已弃用。集群的 Curation 组件的规格
forwarder	对象	(已弃用) （可选）已弃用。集群的 Forwarder 组件的规格
logStore	对象	（可选）集群的日志存储组件的规格
managementState	字符串	（可选）如果 Operator 是 'Managed' 或 'Unmanaged'，则查询
visualization	对象	（可选）集群的可视化组件的规格

3.5.2.1.22. .spec.collection

3.5.2.1.22.1. 描述

这是包含日志和事件集合信息的结构

3.5.2.1.22.1.1. 类型

对象

属性	类型	描述
资源	对象	（可选）收集器的资源要求
nodeSelector	对象	（可选）定义 Pod 调度到哪些节点上。
容限（tolerations）	数组	（可选）定义 Pod 将接受的容限
fluentd	对象	（可选） Fluentd 代表类型为 fluentd 的转发器的配置。
logs	对象	(已弃用) （可选）已弃用。集群的 Log Collection 规格
type	字符串	（可选）要配置的 Log Collection 类型

3.5.2.1.23. .spec.collection.fluentd

3.5.2.1.23.1. 描述

FluentdForwarderSpec 代表类型为 fluentd 的转发器的配置。

3.5.2.1.23.1.1. 类型

对象

属性	类型	描述
buffer	对象
inFile	对象

3.5.2.1.24. .spec.collection.fluentd.buffer

3.5.2.1.24.1. 描述

FluentdBufferSpec 代表 fluentd 缓冲参数的子集，用于调整所有 fluentd 输出的缓冲配置。它支持参数子集来配置缓冲区和队列大小、清空操作和重试清除。

有关常规参数，请参阅：https://docs.fluentd.org/configuration/buffer-section#buffering-parameters

有关 flush 参数，请参阅：https://docs.fluentd.org/configuration/buffer-section#flushing-parameters

有关重试参数请参考：https://docs.fluentd.org/configuration/buffer-section#retries-parameters

3.5.2.1.24.1.1. 类型

对象

属性	类型	描述
chunkLimitSize	字符串	（可选） ChunkLimitSize 代表每个块的最大大小。事件将是
flushInterval	字符串	（可选） FlushInterval 代表两个连续清除之间等待的时长
flushMode	字符串	（可选） FlushMode 代表要写入块的清除线程的模式。模式
flushThreadCount	int	（可选） FlushThreadCount reprents 缓冲区使用的线程数量
overflowAction	字符串	（可选） OverflowAction 代表 fluentd 缓冲插件的操作
retryMaxInterval	字符串	（可选） RetryMaxInterval 代表 exponential backoff 的最大时间间隔
retryTimeout	字符串	（可选） RetryTimeout 代表在放弃前尝试重试的最长时间
retryType	字符串	（可选） RetryType 代表重试清除操作的类型。flush 操作可以
retryWait	字符串	（可选） RetryWait 代表两个连续重试刷新之间的持续时间
totalLimitSize	字符串	（可选） TotalLimitSize 代表每个 fluentd 允许的节点空间阈值

3.5.2.1.25. .spec.collection.fluentd.inFile

3.5.2.1.25.1. 描述

FluentdInFileSpec 代表 fluentd in-tail 插件参数的子集，用于调整所有 fluentd in-tail 输入的配置。

有关常规参数，请参阅： https://docs.fluentd.org/input/tail#parameters

3.5.2.1.25.1.1. 类型

对象

属性	类型	描述
readLinesLimit	int	（可选） ReadlinesLimit 代表要随每个 I/O 操作读取的行数

3.5.2.1.26. .spec.collection.logs

3.5.2.1.26.1. 描述

3.5.2.1.26.1.1. 类型

对象

属性	类型	描述
fluentd	对象	Fluentd Log Collection 组件的规格
type	字符串	要配置的日志集合类型

3.5.2.1.27. .spec.collection.logs.fluentd

3.5.2.1.27.1. 描述

CollectorSpec 是 spec，用于定义收集器的调度和资源

3.5.2.1.27.1.1. 类型

对象

属性	类型	描述
nodeSelector	对象	（可选）定义 Pod 调度到哪些节点上。
资源	对象	（可选）收集器的资源要求
容限（tolerations）	数组	（可选）定义 Pod 将接受的容限

3.5.2.1.28. .spec.collection.logs.fluentd.nodeSelector

3.5.2.1.28.1. 描述

3.5.2.1.28.1.1. 类型

对象

3.5.2.1.29. .spec.collection.logs.fluentd.resources

3.5.2.1.29.1. 描述

3.5.2.1.29.1.1. 类型

对象

属性	类型	描述
limits	对象	（可选）限制描述了允许的最大计算资源量。
requests	对象	（可选）请求描述了所需的最少计算资源。

3.5.2.1.30. .spec.collection.logs.fluentd.resources.limits

3.5.2.1.30.1. 描述

3.5.2.1.30.1.1. 类型

对象

3.5.2.1.31. .spec.collection.logs.fluentd.resources.requests

3.5.2.1.31.1. 描述

3.5.2.1.31.1.1. 类型

对象

3.5.2.1.32. .spec.collection.logs.fluentd.tolerations[]

3.5.2.1.32.1. 描述

3.5.2.1.32.1.1. 类型

数组

属性	类型	描述
effect	字符串	（可选）效果表示要匹配的污点效果。空意味着匹配所有污点效果。
key	字符串	（可选） key 是容限应用到的污点键。empty 表示与所有污点键匹配。
operator	字符串	（可选） Operator 代表键与值的关系。
tolerationSeconds	int	（可选） TolerationSeconds 代表容限的期间（必须是
value	字符串	（可选）值是容限匹配的污点值。

3.5.2.1.33. .spec.collection.logs.fluentd.tolerations[].tolerationSeconds

3.5.2.1.33.1. 描述

3.5.2.1.33.1.1. 类型

3.5.2.1.34. .spec.curation

3.5.2.1.34.1. 描述

这是包含日志策展信息的结构 (Curator)

3.5.2.1.34.1.1. 类型

对象

属性	类型	描述
curator	对象	要配置的策展规格
type	字符串	要配置的策展类型

3.5.2.1.35. .spec.curation.curator

3.5.2.1.35.1. 描述

3.5.2.1.35.1.1. 类型

对象

属性	类型	描述
nodeSelector	对象	定义 Pod 调度到哪些节点上。
资源	对象	（可选） Curator 的资源要求
调度	字符串	Curator 作业运行的 cron 调度。默认为 "30 3 * * *"
容限（tolerations）	数组

3.5.2.1.36. .spec.curation.curator.nodeSelector

3.5.2.1.36.1. 描述

3.5.2.1.36.1.1. 类型

对象

3.5.2.1.37. .spec.curation.curator.resources

3.5.2.1.37.1. 描述

3.5.2.1.37.1.1. 类型

对象

属性	类型	描述
limits	对象	（可选）限制描述了允许的最大计算资源量。
requests	对象	（可选）请求描述了所需的最少计算资源。

3.5.2.1.38. .spec.curation.curator.resources.limits

3.5.2.1.38.1. 描述

3.5.2.1.38.1.1. 类型

对象

3.5.2.1.39. .spec.curation.curator.resources.requests

3.5.2.1.39.1. 描述

3.5.2.1.39.1.1. 类型

对象

3.5.2.1.40. .spec.curation.curator.tolerations[]

3.5.2.1.40.1. 描述

3.5.2.1.40.1.1. 类型

数组

属性	类型	描述
effect	字符串	（可选）效果表示要匹配的污点效果。空意味着匹配所有污点效果。
key	字符串	（可选） key 是容限应用到的污点键。empty 表示与所有污点键匹配。
operator	字符串	（可选） Operator 代表键与值的关系。
tolerationSeconds	int	（可选） TolerationSeconds 代表容限的期间（必须是
value	字符串	（可选）值是容限匹配的污点值。

3.5.2.1.41. .spec.curation.curator.tolerations[].tolerationSeconds

3.5.2.1.41.1. 描述

3.5.2.1.41.1.1. 类型

3.5.2.1.42. .spec.forwarder

3.5.2.1.42.1. 描述

ForwarderSpec 包含特定转发器实现的全局调优参数。一般用途不需要此字段，用户可以熟悉底层转发器技术的用户进行性能调优。目前支持： fluentd。

3.5.2.1.42.1.1. 类型

对象

属性	类型	描述
fluentd	对象

3.5.2.1.43. .spec.forwarder.fluentd

3.5.2.1.43.1. 描述

FluentdForwarderSpec 代表类型为 fluentd 的转发器的配置。

3.5.2.1.43.1.1. 类型

对象

属性	类型	描述
buffer	对象
inFile	对象

3.5.2.1.44. .spec.forwarder.fluentd.buffer

3.5.2.1.44.1. 描述

FluentdBufferSpec 代表 fluentd 缓冲参数的子集，用于调整所有 fluentd 输出的缓冲配置。它支持参数子集来配置缓冲区和队列大小、清空操作和重试清除。

有关常规参数，请参阅：https://docs.fluentd.org/configuration/buffer-section#buffering-parameters

有关 flush 参数，请参阅：https://docs.fluentd.org/configuration/buffer-section#flushing-parameters

有关重试参数请参考：https://docs.fluentd.org/configuration/buffer-section#retries-parameters

3.5.2.1.44.1.1. 类型

对象

属性	类型	描述
chunkLimitSize	字符串	（可选） ChunkLimitSize 代表每个块的最大大小。事件将是
flushInterval	字符串	（可选） FlushInterval 代表两个连续清除之间等待的时长
flushMode	字符串	（可选） FlushMode 代表要写入块的清除线程的模式。模式
flushThreadCount	int	（可选） FlushThreadCount reprents 缓冲区使用的线程数量
overflowAction	字符串	（可选） OverflowAction 代表 fluentd 缓冲插件的操作
retryMaxInterval	字符串	（可选） RetryMaxInterval 代表 exponential backoff 的最大时间间隔
retryTimeout	字符串	（可选） RetryTimeout 代表在放弃前尝试重试的最长时间
retryType	字符串	（可选） RetryType 代表重试清除操作的类型。flush 操作可以
retryWait	字符串	（可选） RetryWait 代表两个连续重试刷新之间的持续时间
totalLimitSize	字符串	（可选） TotalLimitSize 代表每个 fluentd 允许的节点空间阈值

3.5.2.1.45. .spec.forwarder.fluentd.inFile

3.5.2.1.45.1. 描述

FluentdInFileSpec 代表 fluentd in-tail 插件参数的子集，用于调整所有 fluentd in-tail 输入的配置。

有关常规参数，请参阅： https://docs.fluentd.org/input/tail#parameters

3.5.2.1.45.1.1. 类型

对象

属性	类型	描述
readLinesLimit	int	（可选） ReadlinesLimit 代表要随每个 I/O 操作读取的行数

3.5.2.1.46. .spec.logStore

3.5.2.1.46.1. 描述

LogStoreSpec 包含有关日志存储方式的信息。

3.5.2.1.46.1.1. 类型

对象

属性	类型	描述
elasticsearch	对象	Elasticsearch 日志存储组件的规格
lokistack	对象	LokiStack 包含有关当 Type 设置为 LogStoreTypeLokiStack 时用于日志存储的信息。
retentionPolicy	对象	（可选）保留策略定义了应删除它的索引的最长期限
type	字符串	要配置的日志存储的类型。Operator 目前支持使用 ElasticSearch

3.5.2.1.47. .spec.logStore.elasticsearch

3.5.2.1.47.1. 描述

3.5.2.1.47.1.1. 类型

对象

属性	类型	描述
nodeCount	int	为 Elasticsearch 部署的节点数量
nodeSelector	对象	定义 Pod 调度到哪些节点上。
proxy	对象	Elasticsearch Proxy 组件的规格
redundancyPolicy	字符串	（可选）
资源	对象	（可选） Elasticsearch 的资源要求
storage	对象	（可选） Elasticsearch 数据节点的存储规格
容限（tolerations）	数组

3.5.2.1.48. .spec.logStore.elasticsearch.nodeSelector

3.5.2.1.48.1. 描述

3.5.2.1.48.1.1. 类型

对象

3.5.2.1.49. .spec.logStore.elasticsearch.proxy

3.5.2.1.49.1. 描述

3.5.2.1.49.1.1. 类型

对象

属性	类型	描述
资源	对象

3.5.2.1.50. .spec.logStore.elasticsearch.proxy.resources

3.5.2.1.50.1. 描述

3.5.2.1.50.1.1. 类型

对象

属性	类型	描述
limits	对象	（可选）限制描述了允许的最大计算资源量。
requests	对象	（可选）请求描述了所需的最少计算资源。

3.5.2.1.51. .spec.logStore.elasticsearch.proxy.resources.limits

3.5.2.1.51.1. 描述

3.5.2.1.51.1.1. 类型

对象

3.5.2.1.52. .spec.logStore.elasticsearch.proxy.resources.requests

3.5.2.1.52.1. 描述

3.5.2.1.52.1.1. 类型

对象

3.5.2.1.53. .spec.logStore.elasticsearch.resources

3.5.2.1.53.1. 描述

3.5.2.1.53.1.1. 类型

对象

属性	类型	描述
limits	对象	（可选）限制描述了允许的最大计算资源量。
requests	对象	（可选）请求描述了所需的最少计算资源。

3.5.2.1.54. .spec.logStore.elasticsearch.resources.limits

3.5.2.1.54.1. 描述

3.5.2.1.54.1.1. 类型

对象

3.5.2.1.55. .spec.logStore.elasticsearch.resources.requests

3.5.2.1.55.1. 描述

3.5.2.1.55.1.1. 类型

对象

3.5.2.1.56. .spec.logStore.elasticsearch.storage

3.5.2.1.56.1. 描述

3.5.2.1.56.1.1. 类型

对象

属性	类型	描述
size	对象	要置备的节点的最大存储容量。
storageClassName	字符串	（可选）用于创建节点的 PVC 的存储类的名称。

3.5.2.1.57. .spec.logStore.elasticsearch.storage.size

3.5.2.1.57.1. 描述

3.5.2.1.57.1.1. 类型

对象

属性	类型	描述
æ ¼å¼�	字符串	更改格式将：有关 Reonicalize 的评论信息
d	对象	如果 d.Dec != nil, d 是 inf.Dec 表单的数量
i	int	如果 d.Dec == nil，i 是 int64 扩展形式的数量
s	字符串	s 是生成的这个数量的值，以避免重新计算

3.5.2.1.58. .spec.logStore.elasticsearch.storage.size.d

3.5.2.1.58.1. 描述

3.5.2.1.58.1.1. 类型

对象

属性	类型	描述
Dec	对象

3.5.2.1.59. .spec.logStore.elasticsearch.storage.size.d.Dec

3.5.2.1.59.1. 描述

3.5.2.1.59.1.1. 类型

对象

属性	类型	描述
scale	int
unscaled	对象

3.5.2.1.60. .spec.logStore.elasticsearch.storage.size.d.Dec.unscaled

3.5.2.1.60.1. 描述

3.5.2.1.60.1.1. 类型

对象

属性	类型	描述
abs	Word	sign
neg	bool

3.5.2.1.61. .spec.logStore.elasticsearch.storage.size.d.Dec.unscaled.abs

3.5.2.1.61.1. 描述

3.5.2.1.61.1.1. 类型

Word

3.5.2.1.62. .spec.logStore.elasticsearch.storage.size.i

3.5.2.1.62.1. 描述

3.5.2.1.62.1.1. 类型

属性	类型	描述
scale	int
value	int

3.5.2.1.63. .spec.logStore.elasticsearch.tolerations[]

3.5.2.1.63.1. 描述

3.5.2.1.63.1.1. 类型

数组

属性	类型	描述
effect	字符串	（可选）效果表示要匹配的污点效果。空意味着匹配所有污点效果。
key	字符串	（可选） key 是容限应用到的污点键。empty 表示与所有污点键匹配。
operator	字符串	（可选） Operator 代表键与值的关系。
tolerationSeconds	int	（可选） TolerationSeconds 代表容限的期间（必须是
value	字符串	（可选）值是容限匹配的污点值。

3.5.2.1.64. .spec.logStore.elasticsearch.tolerations[].tolerationSeconds

3.5.2.1.64.1. 描述

3.5.2.1.64.1.1. 类型

3.5.2.1.65. .spec.logStore.lokistack

3.5.2.1.65.1. 描述

LokiStackStoreSpec 用来设置 cluster-logging 以使用 LokiStack 作为日志存储。它指向同一命名空间中的现有 LokiStack。

3.5.2.1.65.1.1. 类型

对象

属性	类型	描述
name	字符串	LokiStack 资源的名称。

3.5.2.1.66. .spec.logStore.retentionPolicy

3.5.2.1.66.1. 描述

3.5.2.1.66.1.1. 类型

对象

属性	类型	描述
application	对象
audit	对象
Infra	对象

3.5.2.1.67. .spec.logStore.retentionPolicy.application

3.5.2.1.67.1. 描述

3.5.2.1.67.1.1. 类型

对象

属性	类型	描述
diskThresholdPercent	int	（可选）一个 ES 磁盘用量的阈值，当达到这个阈值时应该删除旧索引（如 75）
maxAge	字符串	（可选）
namespaceSpec	数组	（可选）每个命名空间规格，用于删除超过给定最小年龄的文档
pruneNamespacesInterval	字符串	（可选）运行新修剪命名空间作业的频率

3.5.2.1.68. .spec.logStore.retentionPolicy.application.namespaceSpec[]

3.5.2.1.68.1. 描述

3.5.2.1.68.1.1. 类型

数组

属性	类型	描述
minAge	字符串	（可选）删除与这个 MinAge 旧的命名空间匹配的记录（例如 1d）
namespace	字符串	目标命名空间删除早于 MinAge 的日志（默认为 7d）

3.5.2.1.69. .spec.logStore.retentionPolicy.audit

3.5.2.1.69.1. 描述

3.5.2.1.69.1.1. 类型

对象

属性	类型	描述
diskThresholdPercent	int	（可选）一个 ES 磁盘用量的阈值，当达到这个阈值时应该删除旧索引（如 75）
maxAge	字符串	（可选）
namespaceSpec	数组	（可选）每个命名空间规格，用于删除超过给定最小年龄的文档
pruneNamespacesInterval	字符串	（可选）运行新修剪命名空间作业的频率

3.5.2.1.70. .spec.logStore.retentionPolicy.audit.namespaceSpec[]

3.5.2.1.70.1. 描述

3.5.2.1.70.1.1. 类型

数组

属性	类型	描述
minAge	字符串	（可选）删除与这个 MinAge 旧的命名空间匹配的记录（例如 1d）
namespace	字符串	目标命名空间删除早于 MinAge 的日志（默认为 7d）

3.5.2.1.71. .spec.logStore.retentionPolicy.infra

3.5.2.1.71.1. 描述

3.5.2.1.71.1.1. 类型

对象

属性	类型	描述
diskThresholdPercent	int	（可选）一个 ES 磁盘用量的阈值，当达到这个阈值时应该删除旧索引（如 75）
maxAge	字符串	（可选）
namespaceSpec	数组	（可选）每个命名空间规格，用于删除超过给定最小年龄的文档
pruneNamespacesInterval	字符串	（可选）运行新修剪命名空间作业的频率

3.5.2.1.72. .spec.logStore.retentionPolicy.infra.namespaceSpec[]

3.5.2.1.72.1. 描述

3.5.2.1.72.1.1. 类型

数组

属性	类型	描述
minAge	字符串	（可选）删除与这个 MinAge 旧的命名空间匹配的记录（例如 1d）
namespace	字符串	目标命名空间删除早于 MinAge 的日志（默认为 7d）

3.5.2.1.73. .spec.visualization

3.5.2.1.73.1. 描述

这是包含日志视觉化信息的结构 (Kibana)

3.5.2.1.73.1.1. 类型

对象

属性	类型	描述
kibana	对象	Kibana 视觉化组件的规格
type	字符串	要配置的可视化类型

3.5.2.1.74. .spec.visualization.kibana

3.5.2.1.74.1. 描述

3.5.2.1.74.1.1. 类型

对象

属性	类型	描述
nodeSelector	对象	定义 Pod 调度到哪些节点上。
proxy	对象	Kibana Proxy 组件的规格
replicas	int	为 Kibana 部署部署的实例数量
资源	对象	（可选） Kibana 的资源要求
容限（tolerations）	数组

3.5.2.1.75. .spec.visualization.kibana.nodeSelector

3.5.2.1.75.1. 描述

3.5.2.1.75.1.1. 类型

对象

3.5.2.1.76. .spec.visualization.kibana.proxy

3.5.2.1.76.1. 描述

3.5.2.1.76.1.1. 类型

对象

属性	类型	描述
资源	对象

3.5.2.1.77. .spec.visualization.kibana.proxy.resources

3.5.2.1.77.1. 描述

3.5.2.1.77.1.1. 类型

对象

属性	类型	描述
limits	对象	（可选）限制描述了允许的最大计算资源量。
requests	对象	（可选）请求描述了所需的最少计算资源。

3.5.2.1.78. .spec.visualization.kibana.proxy.resources.limits

3.5.2.1.78.1. 描述

3.5.2.1.78.1.1. 类型

对象

3.5.2.1.79. .spec.visualization.kibana.proxy.resources.requests

3.5.2.1.79.1. 描述

3.5.2.1.79.1.1. 类型

对象

3.5.2.1.80. .spec.visualization.kibana.replicas

3.5.2.1.80.1. 描述

3.5.2.1.80.1.1. 类型

3.5.2.1.81. .spec.visualization.kibana.resources

3.5.2.1.81.1. 描述

3.5.2.1.81.1.1. 类型

对象

属性	类型	描述
limits	对象	（可选）限制描述了允许的最大计算资源量。
requests	对象	（可选）请求描述了所需的最少计算资源。

3.5.2.1.82. .spec.visualization.kibana.resources.limits

3.5.2.1.82.1. 描述

3.5.2.1.82.1.1. 类型

对象

3.5.2.1.83. .spec.visualization.kibana.resources.requests

3.5.2.1.83.1. 描述

3.5.2.1.83.1.1. 类型

对象

3.5.2.1.84. .spec.visualization.kibana.tolerations[]

3.5.2.1.84.1. 描述

3.5.2.1.84.1.1. 类型

数组

属性	类型	描述
effect	字符串	（可选）效果表示要匹配的污点效果。空意味着匹配所有污点效果。
key	字符串	（可选） key 是容限应用到的污点键。empty 表示与所有污点键匹配。
operator	字符串	（可选） Operator 代表键与值的关系。
tolerationSeconds	int	（可选） TolerationSeconds 代表容限的期间（必须是
value	字符串	（可选）值是容限匹配的污点值。

3.5.2.1.85. .spec.visualization.kibana.tolerations[].tolerationSeconds

3.5.2.1.85.1. 描述

3.5.2.1.85.1.1. 类型

3.5.2.1.86. .status

3.5.2.1.86.1. 描述

ClusterLoggingStatus 定义 ClusterLogging 的观察状态

3.5.2.1.86.1.1. 类型

对象

属性	类型	描述
集合	对象	（可选）
conditions	对象	（可选）
curation	对象	（可选）
logStore	对象	（可选）
visualization	对象	（可选）

3.5.2.1.87. .status.collection

3.5.2.1.87.1. 描述

3.5.2.1.87.1.1. 类型

对象

属性	类型	描述
logs	对象	（可选）

3.5.2.1.88. .status.collection.logs

3.5.2.1.88.1. 描述

3.5.2.1.88.1.1. 类型

对象

属性	类型	描述
fluentdStatus	对象	（可选）

3.5.2.1.89. .status.collection.logs.fluentdStatus

3.5.2.1.89.1. 描述

3.5.2.1.89.1.1. 类型

对象

属性	类型	描述
clusterCondition	对象	（可选）
daemonSet	字符串	（可选）
节点	对象	（可选）
pods	字符串	（可选）

3.5.2.1.90. .status.collection.logs.fluentdStatus.clusterCondition

3.5.2.1.90.1. 描述

operator-sdk generate crds 不允许映射内容，必须使用命名类型。

3.5.2.1.90.1.1. 类型

对象

3.5.2.1.91. .status.collection.logs.fluentdStatus.nodes

3.5.2.1.91.1. 描述

3.5.2.1.91.1.1. 类型

对象

3.5.2.1.92. .status.conditions

3.5.2.1.92.1. 描述

3.5.2.1.92.1.1. 类型

对象

3.5.2.1.93. .status.curation

3.5.2.1.93.1. 描述

3.5.2.1.93.1.1. 类型

对象

属性	类型	描述
curatorStatus	数组	（可选）

3.5.2.1.94. .status.curation.curatorStatus[]

3.5.2.1.94.1. 描述

3.5.2.1.94.1.1. 类型

数组

属性	类型	描述
clusterCondition	对象	（可选）
cronJobs	字符串	（可选）
调度	字符串	（可选）
暂停	bool	（可选）

3.5.2.1.95. .status.curation.curatorStatus[].clusterCondition

3.5.2.1.95.1. 描述

operator-sdk generate crds 不允许映射内容，必须使用命名类型。

3.5.2.1.95.1.1. 类型

对象

3.5.2.1.96. .status.logStore

3.5.2.1.96.1. 描述

3.5.2.1.96.1.1. 类型

对象

属性	类型	描述
elasticsearchStatus	数组	（可选）

3.5.2.1.97. .status.logStore.elasticsearchStatus[]

3.5.2.1.97.1. 描述

3.5.2.1.97.1.1. 类型

数组

属性	类型	描述
cluster	对象	（可选）
clusterConditions	对象	（可选）
clusterHealth	字符串	（可选）
clusterName	字符串	（可选）
部署	数组	（可选）
nodeConditions	对象	（可选）
nodeCount	int	（可选）
pods	对象	（可选）
replicaSets	数组	（可选）
shardAllocationEnabled	字符串	（可选）
statefulSets	数组	（可选）

3.5.2.1.98. .status.logStore.elasticsearchStatus[].cluster

3.5.2.1.98.1. 描述

3.5.2.1.98.1.1. 类型

对象

属性	类型	描述
activePrimaryShards	int	Elasticsearch 集群的活跃主分片数量
activeShards	int	Elasticsearch 集群的活跃分片数量
initializingShards	int	Elasticsearch 集群的 Initializing Shards 数量
numDataNodes	int	Elasticsearch 集群的数据节点数量
numNodes	int	Elasticsearch 集群的节点数量
pendingTasks	int
relocatingShards	int	Elasticsearch 集群的重定位分片的数量
status	字符串	Elasticsearch 集群的当前状态
unassignedShards	int	Elasticsearch 集群的未分配的分片数量

3.5.2.1.99. .status.logStore.elasticsearchStatus[].clusterConditions

3.5.2.1.99.1. 描述

3.5.2.1.99.1.1. 类型

对象

3.5.2.1.100. .status.logStore.elasticsearchStatus[].deployments[]

3.5.2.1.100.1. 描述

3.5.2.1.100.1.1. 类型

数组

3.5.2.1.101. .status.logStore.elasticsearchStatus[].nodeConditions

3.5.2.1.101.1. 描述

3.5.2.1.101.1.1. 类型

对象

3.5.2.1.102. .status.logStore.elasticsearchStatus[].pods

3.5.2.1.102.1. 描述

3.5.2.1.102.1.1. 类型

对象

3.5.2.1.103. .status.logStore.elasticsearchStatus[].replicaSets[]

3.5.2.1.103.1. 描述

3.5.2.1.103.1.1. 类型

数组

3.5.2.1.104. .status.logStore.elasticsearchStatus[].statefulSets[]

3.5.2.1.104.1. 描述

3.5.2.1.104.1.1. 类型

数组

3.5.2.1.105. .status.visualization

3.5.2.1.105.1. 描述

3.5.2.1.105.1.1. 类型

对象

属性	类型	描述
kibanaStatus	数组	（可选）

3.5.2.1.106. .status.visualization.kibanaStatus[]

3.5.2.1.106.1. 描述

3.5.2.1.106.1.1. 类型

数组

属性	类型	描述
clusterCondition	对象	（可选）
部署	字符串	（可选）
pods	字符串	（可选） Visualization 组件的每个 Kibana Pod 的状态
replicaSets	数组	（可选）
replicas	int	（可选）

3.5.2.1.107. .status.visualization.kibanaStatus[].clusterCondition

3.5.2.1.107.1. 描述

3.5.2.1.107.1.1. 类型

对象

3.5.2.1.108. .status.visualization.kibanaStatus[].replicaSets[]

3.5.2.1.108.1. 描述

3.5.2.1.108.1.1. 类型

数组

第 4 章 Logging 5.5

4.1. Logging 5.5 发行注记

注意

4.1.1. Logging 5.5.16

此发行版本包括 OpenShift Logging 程序错误修复 5.5.16。

4.1.1.1. 程序错误修复

在此次更新之前，LokiStack 网关会广泛缓存授权请求。因此，这会导致错误的授权结果。在这个版本中，Loki 网关缓存以更精细的方式缓存来解决这个问题。(LOG-4434)

4.1.1.2. CVE

4.1.2. Logging 5.5.14

此发行版本包括 OpenShift Logging 程序错误修复 5.5.14。

4.1.2.1. 程序错误修复

在此次更新之前，向量收集器偶尔会在日志中出现以下错误信息：thread 'vector-worker' panicked at 'all branch are disabled, no else branch', src/kubernetes/reflector.rs:26:9。在这个版本中，这个错误已解决。(LOG-4279)

4.1.2.2. CVE

CVE-2023-2828

4.1.3. Logging 5.5.13

此发行版本包括 OpenShift Logging 程序错误修复 5.5.13。

4.1.3.1. 程序错误修复

无。

4.1.3.2. CVE

4.1.4. Logging 5.5.11

此发行版本包括 OpenShift Logging 程序错误修复 5.5.11。

4.1.4.1. 程序错误修复

在此次更新之前，无法通过点击并在日志直方图上拖动，在 OpenShift Container Platform Web 控制台中选择时间范围。在这个版本中，可以使用单击和拖动来成功选择时间范围。(LOG-4102)
在此次更新之前，点 OpenShift Container Platform Web 控制台中的 Show Resources 链接不会产生任何影响。在这个版本中，通过修复 Show Resources 链接的功能来解决这个问题，以切换每个日志条目的资源显示。(LOG-4117)

4.1.4.2. CVE

CVE-2021-26341
CVE-2021-33655
CVE-2021-33656
CVE-2022-1462
CVE-2022-1679
CVE-2022-1789
CVE-2022-2196
CVE-2022-2663
CVE-2022-2795
CVE-2022-3028
CVE-2022-3239
CVE-2022-3522
CVE-2022-3524
CVE-2022-3564
CVE-2022-3566
CVE-2022-3567
CVE-2022-3619
CVE-2022-3623
CVE-2022-3625
CVE-2022-3627
CVE-2022-3628
CVE-2022-3707
CVE-2022-3970
CVE-2022-4129
CVE-2022-20141
CVE-2022-24765
CVE-2022-25265
CVE-2022-29187
CVE-2022-30594
CVE-2022-36227
CVE-2022-39188
CVE-2022-39189
CVE-2022-39253
CVE-2022-39260
CVE-2022-41218
CVE-2022-41674
CVE-2022-42703
CVE-2022-42720
CVE-2022-42721
CVE-2022-42722
CVE-2022-43750
CVE-2022-47929
CVE-2023-0394
CVE-2023-0461
CVE-2023-1195
CVE-2023-1582
CVE-2023-2491
CVE-2023-23454
CVE-2023-27535

4.1.5. Logging 5.5.10

此发行版本包括 OpenShift Logging 程序错误修复 5.5.10。

4.1.5.1. 程序错误修复

在此次更新之前，OpenShift Web 控制台的日志记录视图插件在 LokiStack 无法访问时只显示一个错误文本。在这个版本中，插件会显示正确的错误消息，其中包含如何修复不可访问 LokiStack 的详细信息。(LOG-2874)

4.1.5.2. CVE

4.1.6. Logging 5.5.9

此发行版本包括 OpenShift Logging 程序错误修复 5.5.9。

4.1.6.1. 程序错误修复

在此次更新之前，Fluentd 收集器的问题会导致它不会捕获存储在 /var/log/auth-server/audit.log 中的 OAuth 登录事件。这会导致 OAuth 服务中的登录事件集合不完整。在这个版本中，Fluentd 收集器通过从 OAuth 服务捕获所有登录事件来解决这个问题，包括存储在 /var/log/auth-server/audit.log 中的登录事件。(LOG-3730)
在此次更新之前，当启用结构化解析且消息转发到多个目的地时，它们不会被深度复制。这会导致一些接收的日志，包括结构化消息，而其他日志则没有。在这个版本中，在 JSON 解析前，配置生成已被修改为深度复制信息。因此，所有收到的日志现在都包含结构化消息，即使它们被转发到多个目的地。(LOG-3767)

4.1.6.2. CVE

4.1.7. Logging 5.5.8

此发行版本包括 OpenShift Logging 程序错误修复 5.5.8。

4.1.7.1. 程序错误修复

在此次更新之前，systemd 日志中缺少 priority 字段，因为收集器如何设置 level 字段出错。在这个版本中，这些字段会被正确设置，从而解决了这个问题。(LOG-3630)

4.1.7.2. CVE

4.1.8. Logging 5.5.7

此发行版本包括 OpenShift Logging 程序错误修复 5.5.7。

4.1.8.1. 程序错误修复

在此次更新之前，LokiStack Gateway Labels Enforcer 会在使用带有布尔值表达式的组合标签过滤器时为有效的 LogQL 查询生成解析错误。在这个版本中，LokiStack LogQL 实现支持带有布尔值表达式的标签过滤器，并解决这个问题。(LOG-3534)
在此次更新之前，ClusterLogForwarder 自定义资源(CR)不会将 syslog 输出的 TLS 凭证传递给 Fluentd，从而导致转发过程中出现错误。在这个版本中，凭证可以正确地传递给 Fluentd，从而解决了这个问题。(LOG-3533)

4.1.8.2. CVE

CVE-2021-46848 CVE-2022-3821 CVE-2022-35737 CVE-2022-42010 CVE-2022-42011 CVE-2022-42012 CVE-2022-42898 CVE-2022-43680

4.1.9. Logging 5.5.6

此发行版本包括 OpenShift Logging 程序错误修复 5.5.6。

4.1.9.1. 程序错误修复

在此次更新之前，Pod 安全准入控制器会将标签 podSecurityLabelSync = true 添加到 openshift-logging 命名空间中。这会导致我们指定的安全标签被覆盖，因此 Collector pod 不会启动。在这个版本中，标签 podSecurityLabelSync = false 可保留安全标签。收集器 Pod 按预期部署。(LOG-3340)
在此次更新之前，Operator 会安装 console 视图插件，即使在集群中没有启用它。这会导致 Operator 崩溃。在这个版本中，如果集群的帐户没有启用 console 视图，Operator 会正常运行，且不会安装 console 视图。(LOG-3407)
在此次更新之前，以前的一个用于支持部署没有被更新时进行回归的修复会导致 Operator 崩溃，除非部署了 Red Hat Elasticsearch Operator。在这个版本中，这个问题已被恢复，Operator 现在会稳定，但重新引入了以前的与报告状态相关的问题。(LOG-3428)
在此次更新之前，Loki Operator 只部署 LokiStack 网关的一个副本，而不考虑所选的堆栈大小。在这个版本中，根据所选大小正确配置副本数。(LOG-3478)
在此次更新之前，如果多个标签键具有相同的前缀，一些键包含点，则写入 Elasticsearch 的记录将失败。在这个版本中，下划线替换标签键中的点，从而解决了这个问题。(LOG-3341)
在此次更新之前，日志记录视图插件包含与特定版本的 OpenShift Container Platform 不兼容的功能。在这个版本中，插件的正确发行版本流可以解决这个问题。(LOG-3467)
在此次更新之前，ClusterLogForwarder 自定义资源的协调会错误地报告一个或多个管道的降级状态，从而导致收集器 pod 每 8-10 秒重启。在这个版本中，ClusterLogForwarder 自定义资源进程的协调可以正确地解决这个问题。(LOG-3469)
在此更改 ClusterLogForwarder 自定义资源的 outputDefaults 字段的 spec 之前，会将设置应用到每个声明的 Elasticsearch 输出类型。这会变化可以更正行为，使其与设置专门用于默认受管 Elasticsearch 存储的增强规格匹配。(LOG-3342)
在此次更新之前，OpenShift CLI (oc) must-gather 脚本没有完成，因为 OpenShift CLI (oc)需要一个具有写入权限来构建其缓存的文件夹。在这个版本中，OpenShift CLI (oc) 对文件夹有写入权限，must-gather 脚本可以成功完成。(LOG-3472)
在此次更新之前，Loki Operator Webhook 服务器会导致 TLS 错误。在这个版本中，Loki Operator Webhook PKI 由 Operator Lifecycle Manager 的动态 webhook 管理来管理，从而解决了这个问题。(LOG-3511)

4.1.9.2. CVE

4.1.10. Logging 5.5.5

此发行版本包括 OpenShift Logging 程序错误修复 5.5.5。

4.1.10.1. 程序错误修复

在此次更新之前，Kibana 有一个固定的 24h OAuth cookie 过期时间，当 accessTokenInactivityTimeout 字段被设置为小于 24h 的值时，会导致 Kibana 中的 401 错误。在这个版本中，Kibana 的 OAuth cookie 过期时间与 accessTokenInactivityTimeout 同步，默认值为 24h。(LOG-3305)
在此次更新之前，当启用 JSON 解析时向量解析消息字段，而不定义 structuredTypeKey 或 structuredTypeName 值。在这个版本中，在将结构化日志写入 Elasticsearch 时，structuredTypeKey 或 structuredTypeName 所需的值。(LOG-3284)
在此次更新之前，当出现从此警报表达式返回的一组标签时，FluentdQueueLengthIncreasing 警报可能无法触发。在这个版本中，减少了标签，使其只包含警报所需的标签。(LOG-3226)
在此次更新之前，Loki 不支持连接到断开连接的集群中的外部存储。在这个版本中，容器镜像中包含代理环境变量和代理可信 CA 捆绑包来支持这些连接。(LOG-2860)
在此次更新之前，OpenShift Container Platform Web 控制台用户无法选择包含 Loki 的 CA 证书的 ConfigMap 对象，从而导致 pod 在没有 CA 的情况下运行。在这个版本中，Web 控制台用户可以选择配置映射，从而解决了这个问题。(LOG-3310)
在此次更新之前，CA 密钥用作将 CA 挂载到 Loki 中的卷名称，从而导致 CA 密钥包含非格式字符（如点）时出现错误状态。在这个版本中，卷名称标准化为一个内部字符串，用于解决这个问题。(LOG-3332)

4.1.10.2. CVE

CVE-2016-3709
CVE-2020-35525
CVE-2020-35527
CVE-2020-36516
CVE-2020-36558
CVE-2021-3640
CVE-2021-30002
CVE-2022-0168
CVE-2022-0561
CVE-2022-0562
CVE-2022-0617
CVE-2022-0854
CVE-2022-0865
CVE-2022-0891
CVE-2022-0908
CVE-2022-0909
CVE-2022-0924
CVE-2022-1016
CVE-2022-1048
CVE-2022-1055
CVE-2022-1184
CVE-2022-1292
CVE-2022-1304
CVE-2022-1355
CVE-2022-1586
CVE-2022-1785
CVE-2022-1852
CVE-2022-1897
CVE-2022-1927
CVE-2022-2068
CVE-2022-2078
CVE-2022-2097
CVE-2022-2509
CVE-2022-2586
CVE-2022-2639
CVE-2022-2938
CVE-2022-3515
CVE-2022-20368
CVE-2022-21499
CVE-2022-21618
CVE-2022-21619
CVE-2022-21624
CVE-2022-21626
CVE-2022-21628
CVE-2022-22624
CVE-2022-22628
CVE-2022-22629
CVE-2022-22662
CVE-2022-22844
CVE-2022-23960
CVE-2022-24448
CVE-2022-25255
CVE-2022-26373
CVE-2022-26700
CVE-2022-26709
CVE-2022-26710
CVE-2022-26716
CVE-2022-26717
CVE-2022-26719
CVE-2022-27404
CVE-2022-27405
CVE-2022-27406
CVE-2022-27950
CVE-2022-28390
CVE-2022-28893
CVE-2022-29581
CVE-2022-30293
CVE-2022-34903
CVE-2022-36946
CVE-2022-37434
CVE-2022-39399

4.1.11. Logging 5.5.4

此发行版本包括 OpenShift Logging 程序错误修复 5.5.4。

4.1.11.1. 程序错误修复

在此次更新之前，日志记录视图插件的查询解析程序中的错误会导致日志查询的部分部分（如果查询包含大括号 {} ）消失。这会导致查询无效，从而导致为有效查询返回错误。在这个版本中，解析器可以正确地处理这些查询。(LOG-3042)
在此次更新之前，Operator 可以在 Elasticsearch 或 Kibana 部署改变状态时，输入删除和重新创建收集器 daemonset 的循环。在这个版本中，Operator 状态处理中会解决这个问题。(LOG-3049)
在此次更新之前，不会实施警报来支持 Vector 的收集器实现。这个更改会添加 Vector 警报并部署单独的警报，具体取决于所选收集器的实现。(LOG-3127)
在此次更新之前，Elasticsearch Operator 的 secret 创建组件会持续修改的内部 secret。在这个版本中，现有 secret 会被正确处理。(LOG-3138)
在此次更新之前，日志 must-gather 脚本的前重构删除了工件的预期位置。在这个版本中，恢复将工件写入 /must-gather 文件夹的更改。(LOG-3213)
在此次更新之前，在某些集群中，Prometheus exporter 会使用 IPv4 上而不是 IPv6。在这个版本中，Fluentd 会检测 IP 版本，并使用 0.0.0.0 (IPv4) 或 [::] 用于 IPv6。(LOG-3162)

4.1.11.2. CVE

4.1.12. 日志记录 5.5.3

此发行版本包括 OpenShift Logging 程序错误修复 5.5.3。

4.1.12.1. 程序错误修复

在此次更新之前，带有结构化消息的日志条目包含原始消息字段，该字段使条目更大。在这个版本中，删除了结构化日志的 message 字段，以减少增大的大小。(LOG-2759)
在此次更新之前，收集器配置排除了来自 收集器、default-log-store 和 visualization pod 的日志，但无法在 .gz 文件中排除存档的日志。在这个版本中，作为 collector, default-log-store, 和 visualization pod 的 .gz 存储的归档日志也会被排除。(LOG-2844)
在此次更新之前，当请求通过网关发送对不可用 pod 的请求时，不会警告中断。在这个版本中，如果网关在完成写入或读取请求时遇到问题，则单个警报将生成。(LOG-2884)
在此次更新之前，pod 元数据可以被流畅的插件更改，因为通过管道传递的值通过引用。此更新可确保每个日志消息接收 pod 元数据的副本，以便每个消息进程都可以独立使用。(LOG-3046)
在此次更新之前，在 OpenShift Console Logs 视图中选择 unknown severity 排除了 level=unknown 值的日志。在这个版本中，根据未知严重性进行过滤时，可以查看没有级别以及带有 level=unknown 的日志。(LOG-3062)
在此次更新之前，发送到 Elasticsearch 的日志记录有一个名为 write-index 的额外字段，其中包含发送日志所需的索引名称。此字段不是数据模型的一部分。在这个版本中，这个字段将不再发送。(LOG-3075)
随着新的内置 Pod Security Admission Controller 的推出，根据全局或命名空间级别定义的强制安全标准没有配置 Pod。在这个版本中，Operator 和收集器允许特权执行并运行，而不出现安全审计警告或错误。(LOG-3077)
在此次更新之前，Operator 在使用 LokiStack 作为默认日志存储时删除了 ClusterLogForwarder 自定义资源中定义的任何自定义输出。在这个版本中，Operator 会在处理 ClusterLogForwarder 自定义资源时将自定义输出与默认输出合并。(LOG-3095)

4.1.12.2. CVE

4.1.13. Logging 5.5.2

此发行版本包括 OpenShift Logging 程序错误修复 5.5.2。

4.1.13.1. 程序错误修复

在此次更新之前，Fluentd 收集器的警报规则不遵循 OpenShift Container Platform 监控风格的准则。此更新会修改这些警报，使其包含命名空间标签，从而解决了这个问题。(LOG-1823)
在此次更新之前，索引管理滚动脚本会在索引名称中有多个连字符时生成新的索引名称。在这个版本中，索引名称会正确生成。(LOG-2644)
在此次更新之前，Kibana 路由会在没有证书的情况下设置 caCertificate 值。在这个版本中，不会设置 caCertificate 值。(LOG-2661)
在此次更新之前，收集器依赖项的更改会导致它为未使用的参数发出警告消息。在这个版本中，删除未使用的配置参数可以解决这个问题。(LOG-2859)
在此次更新之前，为 Loki Operator 创建的部署创建的 pod 被错误地调度到没有 Linux 操作系统的节点（如果这些节点已在运行 Operator 的集群中可用）。在这个版本中，Operator 将额外的 node-selector 附加到 pod 定义，该定义仅允许将 pod 调度到基于 Linux 的节点上。(LOG-2895)
在此次更新之前，OpenShift 控制台日志视图不会根据严重性过滤日志，因为 LokiStack 网关中存在 LogQL 解析器问题。在这个版本中，解析器修复了这个问题，OpenShift Console Logs 视图可以根据严重性进行过滤。(LOG-2908)
在此次更新之前，重构 Fluentd 收集器插件会删除事件的时间戳字段。在这个版本中，恢复从事件收到的时间提供的 timestamp 字段。(LOG-2923)
在此次更新之前，审计日志中没有 level 字段会导致向量日志出现错误。在这个版本中，在审计日志记录中添加 level 字段可以解决这个问题。(LOG-2961)
在此次更新之前，如果您删除了 Kibana 自定义资源，OpenShift Container Platform Web 控制台将继续显示到 Kibana 的链接。在这个版本中，删除 Kibana 自定义资源也会删除该链接。(LOG-3053)
在此次更新之前，当 ClusterLogForwarder 自定义资源定义了 JSON 解析时，每个 rollover 任务都会创建空索引。在这个版本中，新的索引不为空。(LOG-3063)
在此次更新之前，当用户在 Loki Operator 5.5 更新后删除了 LokiStack 时，最初由 Loki Operator 5.4 创建的资源仍保留。在这个版本中，资源的 owner-references 指向 5.5 LokiStack。(LOG-2945)
在此次更新之前，用户无法查看其有权访问的命名空间的应用程序日志。在这个版本中，Loki Operator 会自动创建一个集群角色和集群角色绑定，允许用户读取应用程序日志。(LOG-2918)
在此次更新之前，具有 cluster-admin 特权的用户无法使用日志记录控制台正确查看基础架构和审计日志。在这个版本中，授权检查已被扩展，还可将 cluster-admin 和 dedicated-admin 组中的用户识别为 admins。(LOG-2970)

4.1.13.2. CVE

4.1.14. Logging 5.5.1

此发行版本包括 OpenShift Logging 程序错误修复 5.5.1。

4.1.14.1. 功能增强

当日志记录控制台（Logging Console）插件被使用时，此增强会将 Aggregated Logs 选项卡添加到 OpenShift Container Platform Web 控制台的 Pod Details 页面中。此功能增强仅适用于 OpenShift Container Platform 4.10 及更新的版本。(LOG-2647)
此功能增强将 Google Cloud Logging 添加为日志转发的输出选项。(LOG-1482)

4.1.14.2. 程序错误修复

在此次更新之前，Operator 无法确保 pod 就绪，这会导致集群在集群重启过程中达到可操作的状态。在这个版本中，Operator 会在重启过程中进入新 pod 前将新 pod 标记为 ready，这会解决这个问题。(LOG-2745)
在此次更新之前，Fluentd 有时无法识别 Kubernetes 平台轮转日志文件，且不会读取日志消息。在这个版本中，通过设置上游开发团队所推荐的配置参数修正。(LOG-2995)
在此次更新之前，添加多行错误检测会导致内部路由更改并将记录转发到错误的目的地。在这个版本中，内部路由正确。(LOG-2801)
在此次更新之前，更改 OpenShift Container Platform Web 控制台的刷新间隔会在 Query 字段为空时造成错误。在这个版本中，当 Query 字段为空时，更改间隔不是可用的选项。(LOG-2917)

4.1.14.3. CVE

4.1.15. Logging 5.5.0

此发行版本包括：OpenShift Logging 程序错误修复 5.5.0。

4.1.15.1. 功能增强

在这个版本中，您可以将来自同一 pod 的不同容器的结构化日志转发到不同的索引。要使用此功能，您必须使用多容器支持配置管道并注解 pod。(LOG-1296)

重要

在这个版本中，您可以使用 Kubernetes 的普通标签，app.kubernetes.io/component, app.kubernetes.io/managed-by, app.kubernetes.io/part-of, 和 app.kubernetes.io/version 来过滤 Elasticsearch 输出的日志。非 Elasticsearch 输出类型可以使用 kubernetes.labels 中包含的所有标签。(LOG-2388)
在这个版本中，启用了 AWS Security Token Service (STS) 的集群可能会使用 STS 验证将日志转发到 Amazon CloudWatch。(LOG-1976)
在这个版本中，"LokiOperator" Operator 和 Vector 收集器从技术预览变为正式发布 (GA)。与之前版本相关的全部仍处于会待处理的状态，一些 API 仍为技术预览。详情请参阅 带有 LokiStack 的日志记录部分。

4.1.15.2. 程序错误修复

在此次更新之前，配置为将日志转发到 Amazon CloudWatch 的集群会将拒绝的日志文件写入到临时存储，从而导致集群变得不稳定。在这个版本中，所有存储选项的块备份已被禁用，从而解决了这个问题。(LOG-2746)
在此次更新之前，Operator 使用的一些 API 的版本已弃用，并计划在以后的 OpenShift Container Platform 版本中删除。在这个版本中，依赖项被移到受支持的 API 版本。(LOG-2656)
在此次更新之前，为多行错误检测配置了多个 ClusterLogForwarder 管道，会导致收集器进入 crashloopbackoff 错误状态。在这个版本中解决了这个问题，多个配置部分具有相同的唯一 ID。(LOG-2241)
在此次更新之前，收集器无法将非 UTF-8 符号保存到 Elasticsearch 存储日志中。在这个版本中，收集器对非 UTF-8 符号进行编码，从而解决此问题。(LOG-2203)
在此次更新之前，非拉丁字符在 Kibana 中无法正确显示。在这个版本中，Kibana 可以正确地显示所有有效的 UTF-8 字符。(LOG-2784)

4.1.15.3. CVE

4.2. 日志记录 5.5 入门

此日志部署过程概述提供了便于参考。它不是完整的文档。对于新的安装，建议使用 Vector 和 LokiStack。

注意

先决条件

日志存储首选项：Elasticsearch 或 LokiStack
收集器实现首选项：Fluentd 或 Vector
日志转发输出的凭证

注意

为您要使用的日志存储安装 Operator。
- 对于 Elasticsearch，安装 OpenShift Elasticsearch Operator。
- 对于 LokiStack，请安装 Loki Operator。
  - 创建 LokiStack 自定义资源 (CR) 实例。
安装 Red Hat OpenShift Logging Operator。
创建 ClusterLogging 自定义资源 (CR) 实例。
1. 选择您的 Collector 实现。
  注意
  从日志记录版本 5.6 Fluentd 开始，计划在以后的发行版本中删除。红帽将在当前发行生命周期中提供对这个功能的程序漏洞修复和支持，但这个功能将不再获得改进，并将被删除。作为 Fluentd 的替代选择，您可以使用 Vector。
创建 ClusterLogForwarder 自定义资源 (CR) 实例。
为所选输出管道创建 secret。

4.3. 了解日志记录架构

logging 子系统由这些逻辑组件组成：

collector - 从每个节点读取容器日志数据，并将日志数据转发到配置的输出。
store - 存储用于分析的日志数据；转发器的默认输出。
visualization - 用于搜索、查询和查看存储日志的图形界面。

这些组件由 Operator 和自定义资源 (CR) YAML 文件管理。

Red Hat OpenShift 的 logging 子系统会收集容器日志和节点日志。它们被归类为：

Application - 非基础架构容器生成的容器日志。
Infrastructure - 容器日志来自命名空间 kube-* 和 openshift-\*，节点日志来自 journald。
audit - 日志来自 auditd, kube-apiserver, openshift-apiserver, 和 ovn（如果启用）。

4.4. 管理日志记录部署

4.4.1. 使用 Web 控制台部署 Red Hat OpenShift Logging Operator

您可以使用 OpenShift Container Platform Web 控制台来部署 Red Hat OpenShift Logging Operator。

先决条件

流程

使用 OpenShift Container Platform Web 控制台部署 Red Hat OpenShift Logging Operator：

安装 Red Hat OpenShift Logging Operator：
1. 在 OpenShift Container Platform Web 控制台中，点击 Operators → OperatorHub。
2. 在 Filter by keyword 字段中输入 Logging。
3. 从可用的 Operator 列表中选择 Red Hat OpenShift Logging，然后点 Install。
4. 选择 stable 或 stable-5.y 作为 更新频道。
  注意
  stable 频道只为日志记录的最新版本提供更新。要继续获得之前版本的更新，您必须将订阅频道改为 stable-X，其中 X 是您安装的日志记录版本。
5. 确保在 Installation Mode 下选择了 A specific namespace on the cluster。
6. 确定在 Installed Namespace 下的 Operator recommended namespace 是 openshift-logging。
7. 选择 Enable Operator recommended cluster monitoring on this Namespace。
8. 为 Update approval 选择一个选项。
  - Automatic 选项允许 Operator Lifecycle Manager (OLM) 在有新版本可用时自动更新 Operator。
  - Manual 选项需要具有适当凭证的用户批准 Operator 更新。
9. 为 Console 插件选择 Enable 或 Disable。
10. 点 Install。
通过切换到 Operators → Installed Operators 页来验证 Red Hat OpenShift Logging Operator 是否已安装。
1. 确保 openshift-logging 项目中列出的 Red Hat OpenShift Logging 的 Status 为 InstallSucceeded。
创建 ClusterLogging 实例。
注意
Web 控制台的表单视图不包括所有可用的选项。建议您使用 YAML 视图 来完成您的设置。
1. 在 collection 部分中，选择一个 Collector Implementation。
  注意
  从日志记录版本 5.6 Fluentd 开始，计划在以后的发行版本中删除。红帽将在当前发行生命周期中提供对这个功能的程序漏洞修复和支持，但这个功能将不再获得改进，并将被删除。作为 Fluentd 的替代选择，您可以使用 Vector。
2. 在 logStore 部分中，选择一个类型。
  注意
  从日志记录版本 5.4.3 开始，Elasticsearch Operator 已被弃用，计划在以后的发行版本中删除。红帽将在当前发行生命周期中提供对这个功能的程序漏洞修复和支持，但这个功能将不再获得改进，并将被删除。作为使用 Elasticsearch Operator 管理默认日志存储的替代选择，您可以使用 Loki Operator。
3. 点 Create。

4.4.2. 使用 Web 控制台部署 Loki Operator

您可以使用 OpenShift Container Platform Web 控制台安装 Loki Operator。

先决条件

支持的日志存储(AWS S3、Google Cloud Storage、Azure、Swift、Minio、OpenShift Data Foundation)

流程

使用 OpenShift Container Platform Web 控制台安装 Loki Operator：

在 OpenShift Container Platform Web 控制台中，点击 Operators → OperatorHub。
在 Filter by keyword 字段中输入 Loki。
1. 从可用的 Operator 列表中选择 Loki Operator，然后点 Install。
选择 stable 或 stable-5.y 作为 更新频道。
注意
stable 频道只为日志记录的最新版本提供更新。要继续获得之前版本的更新，您必须将订阅频道改为 stable-X，其中 X 是您安装的日志记录版本。
确保在 Installation Mode 下选择了 All namespaces on the cluster。
确定在 Installed Namespace 下选择了 openshift-operators-redhat。
选择 Enable Operator recommended cluster monitoring on this Namespace。
这个选项在 Namespace 对象中设置 openshift.io/cluster-monitoring: "true" 标识。您必须设置这个选项，以确保集群监控提取 openshift-operators-redhat 命名空间。
为 Update approval 选择一个选项。
- Automatic 选项允许 Operator Lifecycle Manager (OLM) 在有新版本可用时自动更新 Operator。
- Manual 选项需要具有适当凭证的用户批准 Operator 更新。
点 Install。
通过切换到 Operators → Installed Operators 页来验证 LokiOperator 已被安装。
1. 确定在所有项目中，列出的 LokiOperator 的 Status 为 Succeeded。

apiVersion: v1
kind: Secret
metadata:
  name: logging-loki-s3
  namespace: openshift-logging
stringData:
  access_key_id: AKIAIOSFODNN7EXAMPLE
  access_key_secret: wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY
  bucketnames: s3-bucket-name
  endpoint: https://s3.eu-central-1.amazonaws.com
  region: eu-central-1

在 Details 选项卡中，选择 LokiStack 下的 Create instance。然后选择 YAML 视图。粘贴以下模板，根据实际情况替换相关的值。
```
  apiVersion: loki.grafana.com/v1
  kind: LokiStack
  metadata:
    name: logging-loki 1
    namespace: openshift-logging
  spec:
    size: 1x.small 2
    storage:
      schemas:
      - version: v12
        effectiveDate: '2022-06-01'
      secret:
        name: logging-loki-s3 3
        type: s3 4
    storageClassName: <storage_class_name> 5
    tenants:
      mode: openshift-logging
```
1
名称应该是 logging-loki。
2
选择您的 Loki 部署大小。
3
定义用于日志存储的 secret。
4
定义对应的存储类型。
5
为临时存储输入现有存储类的名称。为获得最佳性能，请指定分配块存储的存储类。可以使用 oc get storageclasses 列出集群的可用存储类。
应用配置：
oc apply -f logging-loki.yaml

创建或编辑 ClusterLogging CR：

  apiVersion: logging.openshift.io/v1
  kind: ClusterLogging
  metadata:
    name: instance
    namespace: openshift-logging
  spec:
    managementState: Managed
    logStore:
      type: lokistack
      lokistack:
        name: logging-loki
      collection:
        type: vector

应用配置：
```
oc apply -f cr-lokistack.yaml
```

4.4.3. 使用 CLI 从 OperatorHub 安装

您可以使用 CLI 从 OperatorHub 安装 Operator，而不必使用 OpenShift Container Platform Web 控制台。使用 oc 命令来创建或更新一个订阅对象。

先决条件

使用具有 cluster-admin 权限的账户访问 OpenShift Container Platform 集群。
在您的本地系统安装 oc 命令。

流程

查看 OperatorHub 中集群可用的 Operator 列表：

$ oc get packagemanifests -n openshift-marketplace

输出示例

NAME                               CATALOG               AGE
3scale-operator                    Red Hat Operators     91m
advanced-cluster-management        Red Hat Operators     91m
amq7-cert-manager                  Red Hat Operators     91m
...
couchbase-enterprise-certified     Certified Operators   91m
crunchy-postgres-operator          Certified Operators   91m
mongodb-enterprise                 Certified Operators   91m
...
etcd                               Community Operators   91m
jaeger                             Community Operators   91m
kubefed                            Community Operators   91m
...

记录下所需 Operator 的目录。

检查所需 Operator，以验证其支持的安装模式和可用频道：
```
$ oc describe packagemanifests <operator_name> -n openshift-marketplace
```
一个 Operator 组（由 OperatorGroup 对象定义），在其中选择目标命名空间，在其中为与 Operator 组相同的命名空间中的所有 Operator 生成所需的 RBAC 访问权限。
订阅 Operator 的命名空间必须具有与 Operator 的安装模式相匹配的 Operator 组，可采用 AllNamespaces 模式，也可采用 SingleNamespace 模式。如果您要使用 AllNamespaces 安装 Operator，则 openshift-operators 命名空间已有适当的 Operator 组。
如果要安装的 Operator 采用 SingleNamespace 模式，而您没有适当的 Operator 组，则必须创建一个。
注意
在选择 SingleNamespace 模式时，该流程的 Web 控制台版本会在后台自动为您处理 OperatorGroup 和 Subscription 对象的创建。
1. 创建 OperatorGroup 对象 YAML 文件，如 operatorgroup.yaml：
  OperatorGroup 对象示例
```
apiVersion: operators.coreos.com/v1
kind: OperatorGroup
metadata:
  name: <operatorgroup_name>
  namespace: <namespace>
spec:
  targetNamespaces:
  - <namespace>
```
2. 创建 OperatorGroup 对象：
```
$ oc apply -f operatorgroup.yaml
```
创建一个 Subscription 对象 YAML 文件，以便为 Operator 订阅一个命名空间，如 sub.yaml：
Subscription 对象示例
```
apiVersion: operators.coreos.com/v1alpha1
kind: Subscription
metadata:
  name: <subscription_name>
  namespace: openshift-operators 1
spec:
  channel: <channel_name> 2
  name: <operator_name> 3
  source: redhat-operators 4
  sourceNamespace: openshift-marketplace 5
  config:
    env: 6
    - name: ARGS
      value: "-v=10"
    envFrom: 7
    - secretRef:
        name: license-secret
    volumes: 8
    - name: <volume_name>
      configMap:
        name: <configmap_name>
    volumeMounts: 9
    - mountPath: <directory_name>
      name: <volume_name>
    tolerations: 10
    - operator: "Exists"
    resources: 11
      requests:
        memory: "64Mi"
        cpu: "250m"
      limits:
        memory: "128Mi"
        cpu: "500m"
    nodeSelector: 12
      foo: bar
```
1
对于 AllNamespaces 安装模式的使用，指定 openshift-operators 命名空间。否则，为 SingleNamespace 安装模式使用指定相关单一命名空间。
2
要订阅的频道的名称。
3
要订阅的 Operator 的名称。
4
提供 Operator 的目录源的名称。
5
目录源的命名空间。将 openshift-marketplace 用于默认的 OperatorHub 目录源。
6
env 参数定义必须存在于由 OLM 创建的 pod 中所有容器中的环境变量列表。
7
envFrom 参数定义要在容器中填充环境变量的源列表。
8
volumes 参数定义 OLM 创建的 pod 上必须存在的卷列表。
9
volumeMounts 参数定义由 OLM 创建的 pod 中必须存在的 VolumeMounts 列表。如果 volumeMount 引用不存在的 卷，OLM 无法部署 Operator。
10
tolerations 参数为 OLM 创建的 pod 定义 Tolerations 列表。
11
resources 参数为 OLM 创建的 pod 中所有容器定义资源限制。
12
nodeSelector 参数为 OLM 创建的 pod 定义 NodeSelector。
创建 Subscription 对象：
```
$ oc apply -f sub.yaml
```
此时，OLM 已了解所选的 Operator。Operator 的集群服务版本（CSV）应出现在目标命名空间中，由 Operator 提供的 API 应可用于创建。

4.4.4. 使用 Web 控制台从集群中删除 Operator

集群管理员可以使用 Web 控制台从所选命名空间中删除已安装的 Operator。

先决条件

使用具有 cluster-admin 权限的账户访问 OpenShift Container Platform 集群 Web 控制台。

流程

进入到 Operators → Installed Operators 页面。
在 Filter by name 字段中滚动或输入关键字以查找您要删除的 Operator。然后点它。
在 Operator Details 页面右侧，从 Actions 列表中选择 Uninstall Operator。
此时会显示 Uninstall Operator? 对话框。
选择 Uninstall 来删除 Operator、Operator 部署和 pod。按照此操作，Operator 将停止运行，不再接收更新。
注意
此操作不会删除 Operator 管理的资源，包括自定义资源定义 (CRD) 和自定义资源 (CR) 。Web 控制台和继续运行的集群资源启用的仪表板和导航项可能需要手动清理。要在卸载 Operator 后删除这些，您可能需要手动删除 Operator CRD。

4.4.5. 使用 CLI 从集群中删除 Operator

集群管理员可以使用 CLI 从所选命名空间中删除已安装的 Operator。

先决条件

使用具有 cluster-admin 权限的账户访问 OpenShift Container Platform 集群。
已在工作站上安装 oc 命令。

流程

通过 currentCSV 字段检查已订阅 Operator 的当前版本（如 jaeger）：

$ oc get subscription jaeger -n openshift-operators -o yaml | grep currentCSV

输出示例

  currentCSV: jaeger-operator.v1.8.2

删除订阅（如 jaeger）:

$ oc delete subscription jaeger -n openshift-operators

输出示例

subscription.operators.coreos.com "jaeger" deleted

使用上一步中的 currentCSV 值来删除目标命名空间中相应 Operator 的 CSV：

$ oc delete clusterserviceversion jaeger-operator.v1.8.2 -n openshift-operators

输出示例

clusterserviceversion.operators.coreos.com "jaeger-operator.v1.8.2" deleted

第 5 章了解 Red Hat OpenShift 的日志记录子系统

作为集群管理员，您可以部署 logging 子系统来聚合 OpenShift Container Platform 集群中的所有日志，如节点系统日志、应用程序容器日志和基础架构日志等。logging 子系统会汇总整个集群中的这些日志，并将它们存储在默认日志存储中。您可以使用 Kibana web 控制台来视觉化日志数据。

logging 子系统聚合了以下类型的日志：

application - 由集群中运行的用户应用程序生成的容器日志（基础架构容器应用程序除外）。
infrastructure - 在集群和 OpenShift Container Platform 节点上运行的基础架构组件生成的日志，如 journal 日志。基础架构组件是在 openshift*、kube* 或 default 项目中运行的 pod。
audit - 由 auditd 生成的日志，节点审计系统存储在 /var/log/audit/audit.log 文件中，以及 Kubernetes apiserver 和 OpenShift apiserver 的审计日志。

注意

由于内部 OpenShift Container Platform Elasticsearch 日志存储无法为审计日志提供安全存储，所以审计日志默认不会存储在内部 Elasticsearch 实例中。如果要将审计日志发送到默认的内部 Elasticsearch 日志存储，例如要在 Kibana 中查看审计日志，则必须使用 Log Forwarding API，如将审计日志转发到日志存储中所述。

5.1. OpenShift Container Platform Logging 常用术语表

此术语表定义了 OpenShift Container Platform Logging 内容中使用的常用术语。

注解: 您可以使用注解将元数据附加到对象。
Cluster Logging Operator (CLO): Cluster Logging Operator 提供了一组 API，用于控制应用程序、基础架构和审计日志的集合和转发。
自定义资源 (CR): CR 是 Kubernetes API 的扩展。要配置 OpenShift Container Platform Logging 和日志转发，您可以自定义 ClusterLogging 和 ClusterLogForwarder 自定义资源。
事件路由器: 事件路由器是一个 pod，它监视 OpenShift Container Platform 事件。它使用 OpenShift Container Platform Logging 收集日志。
Fluentd: Fluentd 是一个日志收集器，它驻留在每个 OpenShift Container Platform 节点上。它收集应用程序、基础架构和审计日志并将其转发到不同的输出。
垃圾回收: 垃圾回收是清理集群资源的过程，如终止的容器和没有被任何正在运行的 pod 引用的镜像。
Elasticsearch: Elasticsearch 是一个分布式搜索和分析引擎。OpenShift Container Platform 使用 ELasticsearch 作为 OpenShift Container Platform Logging 的默认日志存储。
Elasticsearch Operator: Elasticsearch Operator 用于在 OpenShift Container Platform 上运行 Elasticsearch 集群。Elasticsearch Operator 为 Elasticsearch 集群操作提供自助服务，供 OpenShift Container Platform Logging 使用。
索引: 索引是一种数据结构技术，用于快速查找和访问数据。索引通过最大程度减少处理查询时所需的磁盘访问量来优化性能。
JSON 日志记录: OpenShift Container Platform Logging Log Forwarding API 可让您将 JSON 日志解析到结构化对象，并将其转发到 OpenShift Container Platform Logging 管理的 Elasticsearch 或 Log Forwarding API 支持的任何其他第三方系统。
Kibana: Kibana 是基于浏览器的控制台界面，可通过直方图、行图和 pie chart 查询、发现和视觉化您的 Elasticsearch 数据。
Kubernetes API 服务器: Kubernetes API 服务器验证并配置 API 对象的数据。
标签: 标签是可用于组织和选择对象子集（如 pod）的键值对。
日志记录: 通过 OpenShift Container Platform Logging，您可以聚合应用程序、基础架构和审计日志。您还可以将它们存储在默认日志存储中，将它们转发到第三方系统，并查询和视觉化存储在默认日志存储中的存储日志。
日志记录收集器: 日志记录收集器从集群收集日志，对其进行格式化，并将它们转发到日志存储或第三方系统。
日志存储: 日志存储用于存储聚合的日志。您可以使用默认的 Elasticsearch 日志存储，或将日志转发到外部日志存储。默认日志存储经过优化并测试以进行简短存储。
日志可视化工具: 日志可视化工具是用户界面 (UI) 组件，可用于查看日志、图形、图表和其他指标等信息。当前的实现是 Kibana。
node: 节点是 OpenShift Container Platform 集群中的 worker 机器。节点是虚拟机 (VM) 或物理计算机。
Operator: Operator 是 OpenShift Container Platform 集群中打包、部署和管理 Kubernetes 应用程序的首选方法。Operator 将人类操作知识编码到一个软件程序中，易于打包并与客户共享。
pod: pod 是 Kubernetes 中的最小逻辑单元。pod 由一个或多个容器组成，并在 worker 节点上运行。
基于角色的访问控制 (RBAC): RBAC 是一个关键安全控制，可确保集群用户和工作负载只能访问执行其角色所需的资源。
分片: Elasticsearch 将日志数据从 Fluentd 整理到数据存储或索引中，然后将每个索引划分为多个碎片，称为分片 (shard)。
taint: 污点可确保 pod 调度到适当的节点上。您可以在节点上应用一个或多个污点。
容限 (tolerations): 您可以将容限应用到 pod。容限 (toleration) 允许调度程序调度具有匹配污点的 pod。
Web 控制台: 用于管理 OpenShift Container Platform 的用户界面(UI)。

5.2. 关于为 Red Hat OpenShift 部署日志记录子系统

OpenShift Container Platform 集群管理员可以使用 OpenShift Container Platform Web 控制台或 CLI 部署 logging 子系统，以安装 OpenShift Elasticsearch Operator 和 Red Hat OpenShift Logging Operator。安装 Operator 后，您可以创建一个 ClusterLogging 自定义资源 (CR) 来调度 logging 子系统 pod 和支持 logging 子系统所需的其他资源。Operator 负责部署、升级和维护日志记录子系统。

ClusterLogging CR 定义包括日志记录堆栈的所有组件在内的完整日志记录子系统环境，以收集、存储和视觉化日志。Red Hat OpenShift Logging Operator 会监视 logging 子系统 CR，并相应地调整日志记录部署。

管理员和应用程序开发人员可以查看他们具有查看访问权限的项目的日志。

如需更多信息，请参阅配置日志收集器。

5.2.1. 关于 JSON OpenShift Container Platform Logging

您可以使用 JSON 日志记录配置 Log Forwarding API，将 JSON 字符串解析为结构化对象。您可以执行以下任务：

解析 JSON 日志
为 Elasticsearch 配置 JSON 日志数据
将 JSON 日志转发到 Elasticsearch 日志存储

5.2.2. 关于收集并存储 Kubernetes 事件

OpenShift Container Platform 事件路由器是一个 pod，它监视 Kubernetes 事件，并在 OpenShift Container Platform Logging 中记录它们以收集。您必须手动部署 Event Router。

如需更多信息，请参阅关于收集和存储 Kubernetes 事件。

5.2.3. 关于更新 OpenShift Container Platform Logging

OpenShift Container Platform 允许您更新 OpenShift Container Platform 日志记录。您必须在更新 OpenShift Container Platform Logging 时更新以下 Operator：

Elasticsearch Operator
Cluster Logging Operator

如需更多信息，请参阅关于更新 OpenShift Container Platform Logging。

5.2.4. 关于查看集群仪表板

OpenShift Container Platform Logging 仪表板包含 chart，在集群级别显示 Elasticsearch 实例的详情。这些图表可帮助您诊断和预测问题。

如需更多信息，请参阅关于查看集群仪表板。

5.2.5. 关于 OpenShift Container Platform Logging 故障排除

您可以通过执行以下任务排除日志问题：

查看日志记录状态
查看日志存储的状态
了解日志记录警报
为红帽支持收集日志记录数据
关键警报故障排除

5.2.6. 关于卸载 OpenShift Container Platform Logging

您可以通过删除 ClusterLogging 自定义资源(CR)来停止日志聚合。在删除 CR 后，还有其它保留集群日志记录组件，您可以选择性地删除它们。

如需更多信息，请参阅卸载 OpenShift Container Platform Logging。

5.2.7. 关于导出字段

日志记录系统导出字段。导出的字段出现在日志记录中，可从 Elasticsearch 和 Kibana 搜索。

如需更多信息，请参阅关于导出字段。

5.2.8. 关于日志记录子系统组件

logging 子系统组件包括部署到 OpenShift Container Platform 集群中每个节点的收集器，用于收集所有节点和容器日志并将其写入日志存储。您可以使用集中 web UI 使用汇总的数据创建丰富的视觉化和仪表板。

logging 子系统的主要组件为：

collection（收集） - 此组件从集群中收集日志，格式化日志并将其转发到日志存储。当前的实现是 Fluentd。
log store（日志存储） - 存储日志的位置。默认是 Elasticsearch。您可以使用默认的 Elasticsearch 日志存储，或将日志转发到外部日志存储。默认日志存储经过优化并测试以进行简短存储。
visualization（可视化） - 此 UI 组件用于查看日志、图形和图表等。当前的实现是 Kibana。

在本文中我们可能会互换使用日志存储或 Elasticsearch、视觉化或 Kibana、collection 或 Fluentd、收集或 Fluentd。

5.2.9. 关于日志记录收集器

Red Hat OpenShift 的 logging 子系统会收集容器和节点日志。

默认情况下，日志收集器使用以下源：

所有系统的日志记录的 journald
/var/log/containers/*.log 用于所有容器日志

如果您配置了日志收集器来收集审计日志，它会从 /var/log/audit/audit.log 中获取日志信息。

日志记录收集器是一个守护进程集，它将 pod 部署到每个 OpenShift Container Platform 节点。系统及基础架构日志由来自操作系统、容器运行时和 OpenShift Container Platform 的日志消息生成。应用程序日志由 CRI-O 容器引擎生成。Fluentd 从这些源收集日志，并在内部或外部转发 OpenShift Container Platform 中配置的日志。

容器运行时提供少许信息来标识日志消息的来源，如项目、容器名称和容器 ID。这些信息不足以区分日志的来源。如果在日志收集器开始处理日志之前删除了具有指定名称和项目的 Pod，则来自 API 服务器的信息（如标签和注解）可能会不可用。可能没有办法区分来自名称相似的 Pod 和项目的日志消息，也无法追溯日志的来源。这种局限性意味着日志收集和规范化仅属于尽力而为。

重要

可用的容器运行时提供少许信息来标识日志消息来源，无法确保唯一的个别日志消息，也不能保证可以追溯这些消息的来源。

如需更多信息，请参阅配置日志收集器。

5.2.10. 关于日志存储

OpenShift Container Platform 使用 Elasticsearch (ES) 来存储和整理日志数据。（可选）您可以使用 Log Forwarder API 将日志转发到外部存储。支持多种存储类型，包括 fluentd、rsyslog、kafka 和其他类型。

日志记录子系统 Elasticsearch 实例经过优化并测试，用于大约 7 天的简短存储。如果要更长时间保留日志，建议您将数据移至第三方存储系统。

Elasticsearch 将日志数据从 Fluentd 整理到数据存储或索引中，然后将每个索引分成多个碎片（称为 shard(分片) ）,分散到 Elasticsearch 集群中的一组 Elasticsearch 节点上。您可以配置 Elasticsearch 来为分片制作备份（称为 replica(副本) ）,Elasticsearch 也会分散到 Elasticsearch 节点上。ClusterLogging 自定义资源（CR）允许您指定如何复制分片，以提供数据冗余和故障恢复能力。您还可以使用 ClusterLogging CR 中的保留策略来指定不同类型的日志的保留的时长。

注意

索引模板的主分片数量等于 Elasticsearch 数据节点的数目。

Red Hat OpenShift Logging Operator 和相应的 OpenShift Elasticsearch Operator 确保每个 Elasticsearch 节点都使用带有自身存储卷的唯一部署来进行部署。在需要时，可以使用 ClusterLogging 自定义资源（CR）来增加 Elasticsearch 节点的数量。有关配置存储的注意事项，请参阅 Elasticsearch 文档。

注意

高可用性 Elasticsearch 环境需要至少三个 Elasticsearch 节点，各自在不同的主机上。

Elasticsearch 索引中应用的基于角色的访问控制 (RBAC) 可让开发人员控制对日志的访问。管理员可以获取所有日志，开发人员只能访问自己项目中的日志。

如需更多信息，请参阅配置日志存储。

5.2.11. 关于日志记录视觉化

OpenShift Container Platform 使用 Kibana 显示由 Fluentd 收集并由 Elasticsearch 索引的日志数据。

Kibana 是基于浏览器的控制台界面，可通过直方图、折线图、饼图、其他视觉化方式，来查询、发现和视觉化您的 Elasticsearch 数据。

如需更多信息，请参阅配置日志可视化工具。

5.2.12. 关于事件路由

Event Router 是一个 pod，它监视 OpenShift Container Platform 事件，以便可以通过 Red Hat OpenShift 的 logging 子系统来收集这些事件。Event Router 从所有项目收集事件，并将其写入 STDOUT。Fluentd 收集这些事件并将其转发到 OpenShift Container Platform Elasticsearch 实例。Elasticsearch 将事件索引到 infra 索引。

您必须手动部署 Event Router。

如需更多信息，请参阅收集并存储 Kubernetes 事件。

5.2.13. 关于日志转发

默认情况下，Red Hat OpenShift 的日志记录子系统将日志发送到 ClusterLogging 自定义资源(CR)中定义的默认内部 Elasticsearch 日志存储。如果要将日志转发到其他日志聚合器，您可以使用日志转发功能将日志发送到集群内部或外部的特定端点。

如需更多信息，请参阅将日志转发到第三方系统。

5.3. 关于向量

Vector 是一个日志收集器，是作为日志记录子系统的 Fluentd 的一个替代方案。

以下输出受支持：

elasticsearch.一个外部 Elasticsearch 实例。elasticsearch 输出可以使用 TLS 连接。
kafka.Kafka 代理。kafka 输出可以使用不安全的或 TLS 连接。
loki。Loki，可横向扩展、高度可用、多租户日志聚合系统。

5.3.1. 启用向量

默认不启用向量。使用以下步骤在 OpenShift Container Platform 集群上启用向量。

重要

向量不支持 FIPS 启用集群。

先决条件

OpenShift Container Platform: 4.11
Red Hat OpenShift 的 logging 子系统： 5.4
禁用 FIPS

流程

编辑 openshift-logging 项目中的 ClusterLogging 自定义资源（CR）：
```
$ oc -n openshift-logging edit ClusterLogging instance
```
为 ClusterLogging 自定义资源(CR)添加 logging.openshift.io/preview-vector-collector: enabled 注解。
在 ClusterLogging 自定义资源(CR)中添加 vector 作为集合类型。

  apiVersion: "logging.openshift.io/v1"
  kind: "ClusterLogging"
  metadata:
    name: "instance"
    namespace: "openshift-logging"
    annotations:
      logging.openshift.io/preview-vector-collector: enabled
  spec:
    collection:
    logs:
      type: "vector"
      vector: {}

其他资源

向量文档

5.3.2. 收集器功能

表 5.1. 日志源
功能	Fluentd	Vector
应用程序容器日志	✓	✓
特定于应用程序的路由	✓	✓
命名空间划分应用程序特定路由	✓	✓
Infra 容器日志	✓	✓
Infra 日志	✓	✓
kube API 审计日志	✓	✓
OpenShift API 审计日志	✓	✓
打开虚拟网络 (OVN) 审计日志	✓	✓

表 5.2. 输出
功能	Fluentd	Vector
Elasticsearch v5-v7	✓	✓
Fluent 转发	✓
Syslog RFC3164	✓
Syslog RFC5424	✓
Kafka	✓	✓
Cloudwatch	✓	✓
Loki	✓	✓

表 5.3. 授权和身份验证
功能	Fluentd	Vector
Elasticsearch 证书	✓	✓
Elasticsearch 用户名/密码	✓	✓
Cloudwatch keys	✓	✓
Cloudwatch STS	✓
Kafka 证书	✓	✓
Kafka 用户名/密码	✓	✓
Kafka SASL	✓	✓
Loki bearer 令牌	✓	✓

表 5.4. 规范化和转换
功能	Fluentd	Vector
ViaQ 数据模型 - 应用程序	✓	✓
ViaQ 数据模型 - infra	✓	✓
ViaQ 数据模型 - infra(journal)	✓	✓
ViaQ 数据模型 - Linux 审计	✓	✓
ViaQ 数据模型 - kube-apiserver 审计	✓	✓
ViaQ 数据模型 - OpenShift API 审计	✓	✓
ViaQ 数据模型 - OVN	✓	✓
loglevel Normalization	✓	✓
JSON 解析	✓	✓
结构化索引	✓	✓
多行错误检测	✓
multicontainer/ split 索引	✓	✓
Flatten 标签	✓	✓
CLF 静态标签	✓	✓

表 5.5. Tuning
功能	Fluentd	Vector
Fluentd readlinelimit	✓
Fluentd 缓冲	✓
- chunklimitsize	✓
- totallimitsize	✓
- overflowaction	✓
- flushthreadcount	✓
- flushmode	✓
- flushinterval	✓
- retrywait	✓
- retrytype	✓
- retrymaxinterval	✓
- retrytimeout	✓

表 5.6. 可见性
功能	Fluentd	Vector
指标	✓	✓
Dashboard	✓	✓
警报	✓

表 5.7. 其它
功能	Fluentd	Vector
全局代理支持	✓	✓
x86 支持	✓	✓
ARM 支持	✓	✓
PowerPC 支持	✓	✓
IBM Z 支持	✓	✓
IPv6 支持	✓	✓
日志事件缓冲	✓
断开连接的集群	✓	✓

第 6 章为 Red Hat OpenShift 安装 logging 子系统

您可以通过部署 OpenShift Elasticsearch 和 Red Hat OpenShift Logging Operator 来安装 Red Hat OpenShift 的日志记录子系统。OpenShift Elasticsearch Operator 会创建和管理 OpenShift Logging 使用的 Elasticsearch 集群。Logging 子系统 Operator 会创建和管理日志记录堆栈的组件。

将日志记录子系统部署到 OpenShift Container Platform 的过程涉及以下任务：

查阅 Logging 子系统存储注意事项。
使用 OpenShift Container Platform Web 控制台或 CLI 安装 OpenShift Elasticsearch Operator 和 Red Hat OpenShift Logging Operator。

6.1. 使用 Web 控制台为 Red Hat OpenShift 安装 logging 子系统

您可以使用 OpenShift Container Platform Web 控制台安装 OpenShift Elasticsearch 和 Red Hat OpenShift Logging Operator。

注意

如果您不希望使用默认的 Elasticsearch 日志存储，您可以从 ClusterLogging 自定义资源 (CR) 中删除内部 Elasticsearch logStore 和 Kibana visualization 组件。删除这些组件是可选的，但会保存资源。如需更多信息，请参阅在没有使用默认的 Elasticsearch 日志存储时删除未使用的组件。

先决条件

确保具有 Elasticsearch 所需的持久性存储。注意每个 Elasticsearch 节点都需要自己的存储卷。
注意
如果将本地卷用于持久性存储，请不要使用原始块卷，这在 LocalVolume 对象中的 volumeMode: block 描述。Elasticsearch 无法使用原始块卷。
Elasticsearch 是内存密集型应用程序。默认情况下，OpenShift Container Platform 安装 3 个 Elasticsearch 节点，其内存请求和限制为 16 GB。初始设置的三个 OpenShift Container Platform 节点可能没有足够的内存在集群中运行 Elasticsearch。如果遇到与 Elasticsearch 相关的内存问题，在集群中添加更多 Elasticsearch 节点，而不是增加现有节点上的内存。

流程

使用 OpenShift Container Platform Web 控制台安装 OpenShift Elasticsearch Operator 和 Red Hat OpenShift Logging Operator：

安装 OpenShift Elasticsearch Operator:
1. 在 OpenShift Container Platform Web 控制台中，点击 Operators → OperatorHub。
2. 从可用的 Operator 列表中选择 OpenShift Elasticsearch Operator，然后点 Install。
3. 确定在 Installation Mode 下选择了 All namespaces on the cluster。
4. 确定在 Installed Namespace 下选择了 openshift-operators-redhat。
  您必须指定 openshift-operators-redhat 命名空间。openshift-operators 命名空间可能会包含社区提供的 operator。这些 operator 不被信任，其发布的 metric 可能与 OpenShift Container Platform metric 的名称相同，从而导致冲突。
5. 选择 Enable operator recommended cluster monitoring on this namespace。
  这个选项在 Namespace 对象中设置 openshift.io/cluster-monitoring: "true" 标识。您必须设置这个选项，以确保集群监控提取 openshift-operators-redhat 命名空间。
6. 选择 stable-5.x 作为 更新频道。
7. 选择一个批准策略。
  - Automatic 策略允许 Operator Lifecycle Manager（OLM）在有新版本可用时自动更新 Operator。
  - Manual 策略需要拥有适当凭证的用户批准 Operator 更新。
8. 点 Install。
9. 通过切换到 Operators → Installed Operators 页来验证 OpenShift Elasticsearch Operator 已被安装。
10. 确定 OpenShift Elasticsearch Operator 在所有项目中被列出，请 Status 为 Succeeded。
安装 Red Hat OpenShift Logging Operator：
1. 在 OpenShift Container Platform Web 控制台中，点击 Operators → OperatorHub。
2. 从可用的 Operator 列表中选择 Red Hat OpenShift Logging，然后点 Install。
3. 确定在 Installation Mode 下选择了 A specific namespace on the cluster。
4. 确定在 Installed Namespace 下的 Operator recommended namespace 是 openshift-logging。
5. 选择 Enable operator recommended cluster monitoring on this namespace。
  这个选项在 Namespace 对象中设置 openshift.io/cluster-monitoring: "true" 标识。您必须选择这个选项，以确保集群监控提取 openshift-logging 命名空间。
6. 选择 stable-5.x 作为 更新频道。
7. 选择一个批准策略。
  - Automatic 策略允许 Operator Lifecycle Manager（OLM）在有新版本可用时自动更新 Operator。
  - Manual 策略需要拥有适当凭证的用户批准 Operator 更新。
8. 点 Install。
9. 通过切换到 Operators → Installed Operators 页来验证 Red Hat OpenShift Logging Operator 已被安装。
10. 确保 openshift-logging 项目中列出的 Red Hat OpenShift Logging 的 Status 为 InstallSucceeded。
  如果 Operator 没有被成功安装，请按照以下步骤进行故障排除：
  - 切换到 Operators → Installed Operators 页面，并检查 Status 列中是否有任何错误或故障。
  - 切换到 Workloads → Pods 页面，并检查 openshift-logging 项目中报告问题的 pod 的日志。
创建 OpenShift Logging 实例：
1. 切换到 Administration → Custom Resource Definitions 页面。
2. 在 Custom Resource Definitions 页面上，点 ClusterLogging。
3. 在 Custom Resource Definition details 页中，从 Actions 菜单中选择 View Instances。
4. 在 ClusterLoggings 页中，点 Create ClusterLogging。
  您可能需要刷新页面来加载数据。
5. 将 YAML 项中的代码替换为以下内容：
  注意
  此默认 OpenShift Logging 配置应该可以支持各种环境。参阅有关调优和配置日志记录子系统组件的主题，以了解有关可对 OpenShift Logging 集群进行修改的信息。
```
apiVersion: "logging.openshift.io/v1"
kind: "ClusterLogging"
metadata:
  name: "instance" 1
  namespace: "openshift-logging"
spec:
  managementState: "Managed"  2
  logStore:
    type: "elasticsearch"  3
    retentionPolicy: 4
      application:
        maxAge: 1d
      infra:
        maxAge: 7d
      audit:
        maxAge: 7d
    elasticsearch:
      nodeCount: 3 5
      storage:
        storageClassName: "<storage_class_name>" 6
        size: 200G
      resources: 7
          limits:
            memory: "16Gi"
          requests:
            memory: "16Gi"
      proxy: 8
        resources:
          limits:
            memory: 256Mi
          requests:
            memory: 256Mi
      redundancyPolicy: "SingleRedundancy"
  visualization:
    type: "kibana"  9
    kibana:
      replicas: 1
  collection:
    logs:
      type: "fluentd"  10
      fluentd: {}
```
  1
  名称必须是 instance。
  2
  OpenShift Logging 管理状态。在一些数情况下，如果更改了 OpenShift Logging 的默认值，则必须将其设置为 Unmanaged。但是，非受管部署不接收更新，直到 OpenShift Logging 重新变为受管状态为止。
  3
  用于配置 Elasticsearch 的设置。通过使用 CR，您可以配置分片复制策略和持久性存储。
  4
  指定 Elasticsearch 应该保留每个日志源的时间长度。输入一个整数和时间单位：周(w)、小时(h/H)、分钟(m)和秒。例如，7d 代表 7 天。时间超过 maxAge 的旧日志会被删除。您必须为每个日志源指定一个保留策略，否则不会为该源创建 Elasticsearch 索引。
  5
  指定 Elasticsearch 节点的数量。请参阅此列表后面的备注。
  6
  为 Elasticsearch 存储输入现有存储类的名称。为获得最佳性能，请指定分配块存储的存储类。如果没有指定存储类，OpenShift Logging 将使用临时存储。
  7
  根据需要指定 Elasticsearch 的 CPU 和内存请求。如果这些值留白，则 OpenShift Elasticsearch Operator 会设置默认值，它们应足以满足大多数部署的需要。内存请求的默认值为 16Gi，CPU 请求为 1。
  8
  根据需要指定 Elasticsearch 代理的 CPU 和内存请求。如果这些值留白，则 OpenShift Elasticsearch Operator 会设置默认值，它们应足以满足大多数部署的需要。内存请求的默认值为 256Mi，CPU 请求的默认值为 100m。
  9
  用于配置 Kibana 的设置。通过使用 CR，您可以扩展 Kibana 来实现冗余性，并为 Kibana 节点配置 CPU 和内存。如需更多信息，请参阅配置日志可视化工具。
  10
  用于配置 Fluentd 的设置。通过使用 CR，您可以配置 Fluentd CPU 和内存限值。如需更多信息，请参阅配置 Fluentd。
  注意
  Elasticsearch control plane 节点的最大数量为三个。如果您将 nodeCount 指定为大于 3，OpenShift Container Platform 只会创建三个符合 Master 节点条件的 Elasticsearch 节点（具有 master、client 和 data 角色）。其余 Elasticsearch 节点创建为“仅数据”节点，使用 client 和 data 角色。control plane 节点执行集群范围的操作，如创建或删除索引、分片分配和跟踪节点。数据节点保管分片，并执行与数据相关的操作，如 CRUD、搜索和聚合等。与数据相关的操作会占用大量 I/O、内存和 CPU。务必要监控这些资源，并在当前节点过载时添加更多数据节点。
  例如，如果 nodeCount = 4，则创建以下节点：
  $ oc get deployment
  输出示例
  
  cluster-logging-operator 1/1 1 1 18h elasticsearch-cd-x6kdekli-1 0/1 1 0 6m54s elasticsearch-cdm-x6kdekli-1 1/1 1 1 18h elasticsearch-cdm-x6kdekli-2 0/1 1 0 6m49s elasticsearch-cdm-x6kdekli-3 0/1 1 0 6m44s
  
  索引模板的主分片数量等于 Elasticsearch 数据节点的数目。
6. 点击 Create。这会创建 logging 子系统组件、Elasticsearch 自定义资源和组件以及 Kibana 接口。
验证安装：
1. 切换到 Workloads → Pods 页面。
2. 选择 openshift-logging 项目。
  您应该会看到几个用于 OpenShift Logging、Elasticsearch、Fluentd 和 Kibana 的 pod，类似于以下列表：
  - cluster-logging-operator-cb795f8dc-xkckc
  - elasticsearch-cdm-b3nqzchd-1-5c6797-67kfz
  - elasticsearch-cdm-b3nqzchd-2-6657f4-wtprv
  - elasticsearch-cdm-b3nqzchd-3-588c65-clg7g
  - fluentd-2c7dg
  - fluentd-9z7kk
  - fluentd-br7r2
  - fluentd-fn2sb
  - fluentd-pb2f8
  - fluentd-zqgqx
  - kibana-7fb4fd4cc9-bvt4p

其他资源

安装来自 OperatorHub 的 Operator

6.2. 安装后的任务

如果计划使用 Kibana，必须手动创建 Kibana 索引模式和视觉化，以便在 Kibana 中探索和视觉化数据。

如果您的集群网络供应商强制实施网络隔离，允许包含日志记录子系统 Operator 的项目之间的网络流量。

6.3. 使用 CLI 安装 Red Hat OpenShift 的 logging 子系统

您可以使用 OpenShift Container Platform CLI 安装 OpenShift Elasticsearch 和 Red Hat OpenShift Logging Operator。

先决条件

确保具有 Elasticsearch 所需的持久性存储。注意每个 Elasticsearch 节点都需要自己的存储卷。
注意
如果将本地卷用于持久性存储，请不要使用原始块卷，这在 LocalVolume 对象中的 volumeMode: block 描述。Elasticsearch 无法使用原始块卷。
Elasticsearch 是内存密集型应用程序。默认情况下，OpenShift Container Platform 安装 3 个 Elasticsearch 节点，其内存请求和限制为 16 GB。初始设置的三个 OpenShift Container Platform 节点可能没有足够的内存在集群中运行 Elasticsearch。如果遇到与 Elasticsearch 相关的内存问题，在集群中添加更多 Elasticsearch 节点，而不是增加现有节点上的内存。

流程

使用 CLI 安装 OpenShift Elasticsearch Operator 和 Red Hat OpenShift Logging Operator：

为 OpenShift Elasticsearch Operator 创建命名空间。
1. 为 OpenShift Elasticsearch Operator 创建一个命名空间对象 YAML 文件（例如 eo-namespace.yaml）:
```
apiVersion: v1
kind: Namespace
metadata:
  name: openshift-operators-redhat 1
  annotations:
    openshift.io/node-selector: ""
  labels:
    openshift.io/cluster-monitoring: "true" 2
```
  1
  您必须指定 openshift-operators-redhat 命名空间。为了防止可能与指标（metrics）冲突，您应该将 Prometheus Cluster Monitoring 堆栈配置为从 openshift-operators-redhat 命名空间中提取指标数据，而不是从 openshift-operators 命名空间中提取。openshift-operators 命名空间可能包含社区 Operator，这些 Operator 不被信任，并可能会发布与 OpenShift Container Platform 指标相同的名称，从而导致冲突。
  2
  字符串.您必须按照所示指定该标签，以确保集群监控提取 openshift-operators-redhat 命名空间。
2. 创建命名空间：
```
$ oc create -f <file-name>.yaml
```
  例如：
```
$ oc create -f eo-namespace.yaml
```

为 Red Hat OpenShift Logging Operator 创建命名空间：

为 Red Hat OpenShift Logging Operator 创建一个命名空间对象 YAML 文件（例如，olo-namespace.yaml）：

apiVersion: v1
kind: Namespace
metadata:
  name: openshift-logging
  annotations:
    openshift.io/node-selector: ""
  labels:
    openshift.io/cluster-monitoring: "true"

创建命名空间：

$ oc create -f <file-name>.yaml

例如：

$ oc create -f olo-namespace.yaml

通过创建以下对象来安装 OpenShift Elasticsearch Operator:

为 OpenShift Elasticsearch Operator 创建 Operator Group 对象 YAML 文件（例如 eo-og.yaml）:
```
apiVersion: operators.coreos.com/v1
kind: OperatorGroup
metadata:
  name: openshift-operators-redhat
  namespace: openshift-operators-redhat 1
spec: {}
```
1
您必须指定 openshift-operators-redhat 命名空间。

创建 Operator Group 对象：

$ oc create -f <file-name>.yaml

例如：

$ oc create -f eo-og.yaml

创建一个 Subscription 对象 YAML 文件（例如 eo-sub.yaml）来订阅 OpenShift Elasticsearch Operator 的命名空间。
订阅示例
```
apiVersion: operators.coreos.com/v1alpha1
kind: Subscription
metadata:
  name: "elasticsearch-operator"
  namespace: "openshift-operators-redhat" 1
spec:
  channel: "stable-5.1" 2
  installPlanApproval: "Automatic" 3
  source: "redhat-operators" 4
  sourceNamespace: "openshift-marketplace"
  name: "elasticsearch-operator"
```
1
您必须指定 openshift-operators-redhat 命名空间。
2
指定 stable, 或 stable-5.<x> 作为频道。请参见以下注释。
3
Automatic 允许 Operator Lifecycle Manager (OLM) 在有新版本可用时自动更新 Operator。Manual 要求具有适当凭证的用户批准 Operator 更新。
4
指定 redhat-operators。如果 OpenShift Container Platform 集群安装在受限网络中（也称为断开连接的集群），请指定配置 Operator Lifecycle Manager (OLM) 时创建的 CatalogSource 对象的名称。
注意
指定 stable 安装最新稳定版本的当前版本。使用带有 installPlanApproval: "Automatic" 的 stable 会自动将 Operator 升级到最新的稳定主版本和次发行版本。
指定 stable-5.<x> 会安装特定主版本的当前次版本。使用带有 installPlanApproval: "Automatic" 的 stable-5.<x> 会在您使用 x 指定的主版本中自动将 Operator 升级到最新的稳定次版本。
创建订阅对象：
```
$ oc create -f <file-name>.yaml
```
例如：
```
$ oc create -f eo-sub.yaml
```
OpenShift Elasticsearch Operator 已安装到 openshift-operators-redhat 命名空间，并复制到集群中的每个项目。

验证 Operator 安装：

$ oc get csv --all-namespaces

输出示例

NAMESPACE                                               NAME                                            DISPLAY                  VERSION               REPLACES   PHASE
default                                                 elasticsearch-operator.5.1.0-202007012112.p0    OpenShift Elasticsearch Operator   5.1.0-202007012112.p0               Succeeded
kube-node-lease                                         elasticsearch-operator.5.1.0-202007012112.p0    OpenShift Elasticsearch Operator   5.1.0-202007012112.p0               Succeeded
kube-public                                             elasticsearch-operator.5.1.0-202007012112.p0    OpenShift Elasticsearch Operator   5.1.0-202007012112.p0               Succeeded
kube-system                                             elasticsearch-operator.5.1.0-202007012112.p0    OpenShift Elasticsearch Operator   5.1.0-202007012112.p0               Succeeded
openshift-apiserver-operator                            elasticsearch-operator.5.1.0-202007012112.p0    OpenShift Elasticsearch Operator   5.1.0-202007012112.p0               Succeeded
openshift-apiserver                                     elasticsearch-operator.5.1.0-202007012112.p0    OpenShift Elasticsearch Operator   5.1.0-202007012112.p0               Succeeded
openshift-authentication-operator                       elasticsearch-operator.5.1.0-202007012112.p0    OpenShift Elasticsearch Operator   5.1.0-202007012112.p0               Succeeded
openshift-authentication                                elasticsearch-operator.5.1.0-202007012112.p0    OpenShift Elasticsearch Operator   5.1.0-202007012112.p0               Succeeded
...

每个命名空间中都应该有一个 OpenShift Elasticsearch Operator。版本号可能与所示不同。

通过创建以下对象来安装 Red Hat OpenShift Logging Operator：
1. 为 Red Hat OpenShift Logging Operator 创建 Operator Group 对象 YAML 文件（如 olo-og.yaml）:
```
apiVersion: operators.coreos.com/v1
kind: OperatorGroup
metadata:
  name: cluster-logging
  namespace: openshift-logging 1
spec:
  targetNamespaces:
  - openshift-logging 2
```
  1 2
  您必须指定 openshift-logging 命名空间。
2. 创建 OperatorGroup 对象：
```
$ oc create -f <file-name>.yaml
```
  例如：
```
$ oc create -f olo-og.yaml
```
3. 创建一个订阅对象 YAML 文件（例如 olo-sub.yaml）来订阅 Red Hat OpenShift Logging Operator 的命名空间。
```
apiVersion: operators.coreos.com/v1alpha1
kind: Subscription
metadata:
  name: cluster-logging
  namespace: openshift-logging 1
spec:
  channel: "stable" 2
  name: cluster-logging
  source: redhat-operators 3
  sourceNamespace: openshift-marketplace
```
  1
  您必须指定 openshift-logging 命名空间。
  2
  指定 stable, 或 stable-5.<x> 作为频道。
  3
  指定 redhat-operators。如果 OpenShift Container Platform 集群安装在受限网络中（也称为断开连接的集群），请指定配置 Operator Lifecycle Manager (OLM) 时创建的 CatalogSource 对象的名称。
```
$ oc create -f <file-name>.yaml
```
  例如：
```
$ oc create -f olo-sub.yaml
```
  Red Hat OpenShift Logging Operator 已安装到 openshift-logging 命名空间中。
4. 验证 Operator 安装。
  openshift-logging 命名空间中应该有一个 Red Hat OpenShift Logging Operator。版本号可能与所示不同。
```
$ oc get csv -n openshift-logging
```
  输出示例
```
NAMESPACE                                               NAME                                         DISPLAY                  VERSION               REPLACES   PHASE
...
openshift-logging                                       clusterlogging.5.1.0-202007012112.p0         OpenShift Logging          5.1.0-202007012112.p0              Succeeded
...
```
创建 OpenShift Logging 实例：
1. 为 Red Hat OpenShift Logging Operator 创建实例对象 YAML 文件（如 olo-instance.yaml）:
  注意
  此默认 OpenShift Logging 配置应该可以支持各种环境。参阅有关调优和配置日志记录子系统组件的主题，以了解有关可对 OpenShift Logging 集群进行修改的信息。
```
apiVersion: "logging.openshift.io/v1"
kind: "ClusterLogging"
metadata:
  name: "instance" 1
  namespace: "openshift-logging"
spec:
  managementState: "Managed"  2
  logStore:
    type: "elasticsearch"  3
    retentionPolicy: 4
      application:
        maxAge: 1d
      infra:
        maxAge: 7d
      audit:
        maxAge: 7d
    elasticsearch:
      nodeCount: 3 5
      storage:
        storageClassName: "<storage-class-name>" 6
        size: 200G
      resources: 7
        limits:
          memory: "16Gi"
        requests:
          memory: "16Gi"
      proxy: 8
        resources:
          limits:
            memory: 256Mi
          requests:
             memory: 256Mi
      redundancyPolicy: "SingleRedundancy"
  visualization:
    type: "kibana"  9
    kibana:
      replicas: 1
  collection:
    logs:
      type: "fluentd"  10
      fluentd: {}
```
  1
  名称必须是 instance。
  2
  OpenShift Logging 管理状态。在一些数情况下，如果更改了 OpenShift Logging 的默认值，则必须将其设置为 Unmanaged。但是，非受管部署不接收更新，直到 OpenShift Logging 重新变为受管状态为止。将部署重新置于受管状态可能会使您所做的任何修改被恢复。
  3
  用于配置 Elasticsearch 的设置。通过使用子定义资源（CR），您可以配置分片复制策略和持久性存储。
  4
  指定 Elasticsearch 应该保留每个日志源的时间长度。输入一个整数和时间单位：周(w)、小时(h/H)、分钟(m)和秒。例如，7d 代表 7 天。时间超过 maxAge 的旧日志会被删除。您必须为每个日志源指定一个保留策略，否则不会为该源创建 Elasticsearch 索引。
  5
  指定 Elasticsearch 节点的数量。请参阅此列表后面的备注。
  6
  为 Elasticsearch 存储输入现有存储类的名称。为获得最佳性能，请指定分配块存储的存储类。如果没有指定存储类，OpenShift Container Platform 只会使用临时存储部署 OpenShift Logging。
  7
  根据需要指定 Elasticsearch 的 CPU 和内存请求。如果这些值留白，则 OpenShift Elasticsearch Operator 会设置默认值，它们应足以满足大多数部署的需要。内存请求的默认值为 16Gi，CPU 请求为 1。
  8
  根据需要指定 Elasticsearch 代理的 CPU 和内存请求。如果这些值留白，则 OpenShift Elasticsearch Operator 会设置默认值，它们应足以满足大多数部署的需要。内存请求的默认值为 256Mi，CPU 请求的默认值为 100m。
  9
  用于配置 Kibana 的设置。通过使用 CR，您可以扩展 Kibana 来实现冗余性，并为 Kibana Pod 配置 CPU 和内存。如需更多信息，请参阅配置日志可视化工具。
  10
  用于配置 Fluentd 的设置。通过使用 CR，您可以配置 Fluentd CPU 和内存限值。如需更多信息，请参阅配置 Fluentd。
  注意
  Elasticsearch control plane 节点的最大数量为三个。如果您将 nodeCount 指定为大于 3，OpenShift Container Platform 只会创建三个符合 Master 节点条件的 Elasticsearch 节点（具有 master、client 和 data 角色）。其余 Elasticsearch 节点创建为“仅数据”节点，使用 client 和 data 角色。control plane 节点执行集群范围的操作，如创建或删除索引、分片分配和跟踪节点。数据节点保管分片，并执行与数据相关的操作，如 CRUD、搜索和聚合等。与数据相关的操作会占用大量 I/O、内存和 CPU。务必要监控这些资源，并在当前节点过载时添加更多数据节点。
  例如，如果 nodeCount = 4，则创建以下节点：
  $ oc get deployment
  输出示例
  
  cluster-logging-operator 1/1 1 1 18h elasticsearch-cd-x6kdekli-1 1/1 1 0 6m54s elasticsearch-cdm-x6kdekli-1 1/1 1 1 18h elasticsearch-cdm-x6kdekli-2 1/1 1 0 6m49s elasticsearch-cdm-x6kdekli-3 1/1 1 0 6m44s
  
  索引模板的主分片数量等于 Elasticsearch 数据节点的数目。
2. 创建实例：
```
$ oc create -f <file-name>.yaml
```
  例如：
```
$ oc create -f olo-instance.yaml
```
  这会创建 logging 子系统组件、Elasticsearch 自定义资源和组件以及 Kibana 接口。

通过列出 openshift-logging 项目中的 pod 来验证安装。

对于 Logging subsystem 的组件，应使用多个 pod，类似于以下列表：

$ oc get pods -n openshift-logging

输出示例

NAME                                            READY   STATUS    RESTARTS   AGE
cluster-logging-operator-66f77ffccb-ppzbg       1/1     Running   0          7m
elasticsearch-cdm-ftuhduuw-1-ffc4b9566-q6bhp    2/2     Running   0          2m40s
elasticsearch-cdm-ftuhduuw-2-7b4994dbfc-rd2gc   2/2     Running   0          2m36s
elasticsearch-cdm-ftuhduuw-3-84b5ff7ff8-gqnm2   2/2     Running   0          2m4s
collector-587vb                                   1/1     Running   0          2m26s
collector-7mpb9                                   1/1     Running   0          2m30s
collector-flm6j                                   1/1     Running   0          2m33s
collector-gn4rn                                   1/1     Running   0          2m26s
collector-nlgb6                                   1/1     Running   0          2m30s
collector-snpkt                                   1/1     Running   0          2m28s
kibana-d6d5668c5-rppqm                          2/2     Running   0          2m39s

6.4. 安装后的任务

如果计划使用 Kibana，必须手动创建 Kibana 索引模式和视觉化，以便在 Kibana 中探索和视觉化数据。

如果您的集群网络供应商强制实施网络隔离，允许包含日志记录子系统 Operator 的项目之间的网络流量。

6.4.1. 定义 Kibana 索引模式

索引模式定义了您要视觉化的 Elasticsearch 索引。要在 Kibana 中探索和视觉化数据，您必须创建索引模式。

先决条件

用户必须具有 cluster-admin 角色、cluster-reader 角色或这两个角色，才能在 Kibana 中查看 infra 和 audit 索引。默认 kubeadmin 用户具有查看这些索引的权限。
如果可以查看 default、kube- 和 openshift- 项目中的 pod 和日志，则应该可以访问这些索引。您可以使用以下命令检查当前用户是否有适当的权限：
```
$ oc auth can-i get pods/log -n <project>
```
输出示例
```
yes
```
注意
默认情况下，审计日志不会存储在 OpenShift Container Platform 内部 Elasticsearch 实例中。要在 Kibana 中查看审计日志，您必须使用 Log Forward API 配置使用审计日志的 default 输出的管道。
在创建索引模式前，Elasticsearch 文档必须被索引。这会自动完成，但在一个新的或更新的集群中可能需要几分钟。

流程

在 Kibana 中定义索引模式并创建视觉化：

在 OpenShift Container Platform 控制台中点 Application Launcher 并选择 Logging。
点 Management → Index Patterns → Create index pattern 创建 Kibana 索引模式:
- 首次登录 Kibana 时，每个用户必须手动创建索引模式才能查看其项目的日志。用户必须创建一个名为 app 的索引模式，并使用 @timestamp 时间字段查看其容器日志。
- 每个 admin 用户在首次登录 Kibana 时，必须使用 @timestamp 时间字段为 app、infra 和 audit 索引创建索引模式。
从新的索引模式创建 Kibana 视觉化。

6.4.2. 启用网络隔离时允许项目间的流量

集群网络供应商可能会强制实施网络隔离。如果是这样，您必须允许包含 OpenShift Logging 部署的 Operator 的项目间的网络流量。

网络隔离会阻止位于不同项目中的 pod 或服务之间的网络流量。logging 子系统在 openshift-operators-redhat 项目中安装 OpenShift Elasticsearch Operator，并在 openshift-logging 项目中安装 Red Hat OpenShift Logging Operator。因此,您必须允许这两个项目之间的流量。

OpenShift Container Platform 为默认 Container Network Interface（CNI）网络供应商（OpenShift SDN 和 OVN-Kubernetes）提供两个支持的选择。这两个提供程序实施各种网络隔离策略。

OpenShift SDN 有三种模式：

网络策略: 这是默认的模式。如果没有定义策略，它将允许所有流量。但是，如果用户定义了策略，它们通常先拒绝所有流量，然后再添加例外。此过程可能会破坏在不同项目中运行的应用。因此，显式配置策略以允许从一个与日志记录相关的项目出口到另一个项目的流量。
多租户: 这个模式强制实施网络隔离。您必须加入两个与日志记录相关的项目，以允许它们之间的流量。
subnet: 此模式允许所有流量。它不强制实施网络隔离。不需要操作。

OVN-Kubernetes 始终使用网络策略。因此，与 OpenShift SDN 一样，您必须配置策略，以允许流量从一个与日志相关的项目出口到另一个项目。

流程

如果您以多租户（multitenant）模式使用 OpenShift SDN，请加入这两个项目。例如：
```
$ oc adm pod-network join-projects --to=openshift-operators-redhat openshift-logging
```

否则，对于网络策略模式的 OpenShift SDN 以及 OVN-Kubernetes，请执行以下操作：

在 openshift-operators-redhat 命名空间中设置标签。例如：

$ oc label namespace openshift-operators-redhat project=openshift-operators-redhat

在 openshift-logging 命名空间中创建一个网络策略对象，它允许从 openshift-operators-redhat、openshift-monitoring 和 openshift-ingress 项目的入站流量到 openshift-logging 项目。例如：

apiVersion: networking.k8s.io/v1
kind: NetworkPolicy
metadata:
  name: allow-from-openshift-monitoring-ingress-operators-redhat
spec:
  ingress:
  - from:
    - podSelector: {}
  - from:
    - namespaceSelector:
        matchLabels:
          project: "openshift-operators-redhat"
  - from:
    - namespaceSelector:
        matchLabels:
          name: "openshift-monitoring"
  - from:
    - namespaceSelector:
        matchLabels:
          network.openshift.io/policy-group: ingress
  podSelector: {}
  policyTypes:
  - Ingress

其他资源

第 7 章配置日志部署

7.1. 集群日志记录自定义资源（CR）

要为 Red Hat OpenShift 配置日志记录子系统，您需要自定义 ClusterLogging 自定义资源(CR)。

7.1.1. 关于 ClusterLogging 自定义资源

要更改日志记录子系统环境，请创建并修改 ClusterLogging 自定义资源(CR)。

本文根据需要提供了有关创建或修改 CR 的说明。

以下示例显示了 logging 子系统的典型自定义资源。

ClusterLogging 自定义资源（CR）示例

apiVersion: "logging.openshift.io/v1"
kind: "ClusterLogging"
metadata:
  name: "instance" 1
  namespace: "openshift-logging" 2
spec:
  managementState: "Managed" 3
  logStore:
    type: "elasticsearch" 4
    retentionPolicy:
      application:
        maxAge: 1d
      infra:
        maxAge: 7d
      audit:
        maxAge: 7d
    elasticsearch:
      nodeCount: 3
      resources:
        limits:
          memory: 16Gi
        requests:
          cpu: 500m
          memory: 16Gi
      storage:
        storageClassName: "gp2"
        size: "200G"
      redundancyPolicy: "SingleRedundancy"
  visualization: 5
    type: "kibana"
    kibana:
      resources:
        limits:
          memory: 736Mi
        requests:
          cpu: 100m
          memory: 736Mi
      replicas: 1
  collection: 6
    logs:
      type: "fluentd"
      fluentd:
        resources:
          limits:
            memory: 736Mi
          requests:
            cpu: 100m
            memory: 736Mi

1: 名称必须是 instance。
2: CR 必须安装到 openshift-logging 命名空间。
3: Red Hat OpenShift Logging Operator 管理状态。当设置为 非受管状态（unmanaged） 时，Operator 处于不被支持的状态且不会获取更新。
4: 日志存储的设置，包括保留策略、节点数、资源请求和限值以及存储类。
5: 视觉化工具的设置，包括资源请求和限值，以及 pod 副本数。
6: 日志收集器的设置，包括资源请求和限值。

7.2. 配置日志记录收集器

Red Hat OpenShift 的 logging 子系统从集群中收集操作和应用程序日志，并使用 Kubernetes pod 和项目元数据丰富数据。

您可以为日志收集器配置 CPU 和内存限值，并将日志收集器 Pod 移到特定的节点。所有支持的对日志收集器的修改，均可通过 ClusterLogging 自定义资源（CR）中的 spec.collection.log.fluentd 小节来执行。

7.2.1. 不支持的配置

为 Red Hat OpenShift 配置日志记录子系统的支持方法是使用本文档中介绍的选项进行配置。请勿使用其他配置，因为不受支持。各个 OpenShift Container Platform 发行版本的配置范例可能会有所变化，只有掌握了所有可能的配置，才能稳妥应对这样的配置变化。如果使用本文档中描述的配置以外的配置，您的更改可能会丢失，因为 OpenShift Elasticsearch Operator 和 Red Hat OpenShift Logging Operator 会调节差异。按照设计，Operator 会默认将一切还原到定义的状态。

注意

如果必须执行 OpenShift Container Platform 文档中没有描述的配置，您必须将 Red Hat OpenShift Logging Operator 或 OpenShift Elasticsearch Operator 设置为 Unmanaged。一个不受管理的 OpenShift Logging 环境 不被支持，且不会接收更新，直到 OpenShift Logging 返回到 Managed。

7.2.2. 查看日志记录收集器 Pod

您可以查看 Fluentd 日志记录收集器 Pod 以及它们正在运行的对应节点。Fluentd 日志记录收集器 Pod 仅在 openshift-logging 项目中运行。

流程

在 openshift-logging 项目中运行以下命令来查看 Fluentd 日志记录收集器 Pod 及其详情：

$ oc get pods --selector component=collector -o wide -n openshift-logging

输出示例

NAME           READY  STATUS    RESTARTS   AGE     IP            NODE                  NOMINATED NODE   READINESS GATES
fluentd-8d69v  1/1    Running   0          134m    10.130.2.30   master1.example.com   <none>           <none>
fluentd-bd225  1/1    Running   0          134m    10.131.1.11   master2.example.com   <none>           <none>
fluentd-cvrzs  1/1    Running   0          134m    10.130.0.21   master3.example.com   <none>           <none>
fluentd-gpqg2  1/1    Running   0          134m    10.128.2.27   worker1.example.com   <none>           <none>
fluentd-l9j7j  1/1    Running   0          134m    10.129.2.31   worker2.example.com   <none>           <none>

7.2.3. 配置日志收集器 CPU 和内存限值

日志收集器允许对 CPU 和内存限值进行调整。

流程

编辑 openshift-logging 项目中的 ClusterLogging 自定义资源（CR）：

$ oc -n openshift-logging edit ClusterLogging instance

apiVersion: "logging.openshift.io/v1"
kind: "ClusterLogging"
metadata:
  name: "instance"
  namespace: openshift-logging

...

spec:
  collection:
    logs:
      fluentd:
        resources:
          limits: 1
            memory: 736Mi
          requests:
            cpu: 100m
            memory: 736Mi

1: 根据需要指定 CPU 和内存限值及请求。显示的值是默认值。

7.2.4. 日志转发器的高级配置

Red Hat OpenShift 的 logging 子系统包括多个 Fluentd 参数，可用于调整 Fluentd 日志转发器的性能。通过这些参数，可以更改以下 Fluentd 行为：

块和块缓冲大小
块清除行为
块转发重试行为

Fluentd 在名为 chunk（块） 的单个 blob 中收集日志数据。当 Fluentd 创建一个块时，块被视为处于 stage，在这个阶段，数据会被填充到块中。当块已满时，Fluentd 会将块移到 queue，在块被清除或将其写入其目的地前，数据会被保存在这里。有一些原因会导致 Fluentd 清除块，如网络问题或目的地的容量问题。如果无法清除块，Fluentd 会按照配置重试清除操作（ flushing）。

在 OpenShift Container Platform 中，Fluentd 会使用 exponential backoff 方法来重试清理（flushing）操作，Fluentd 会加倍尝试重试清理操作之间的等待时间，这有助于减少到目的地的连接请求。您可以禁用 exponential backoff 的方法，并使用定期重试的方法。它可在指定的时间间隔里重试 flush 块。

这些参数可帮助您权衡延迟和吞吐量之间的利弊。

要优化 Fluentd 的吞吐量，您可以使用这些参数通过配置较大的缓冲和队列、延迟清除以及设置重试间隔间的更多时间来减少网络数据包的数量。请注意，大型缓冲区需要在节点文件系统有更多空间。
要优化低延迟，您可以使用参数尽快发送数据，避免批量的构建，具有较短的队列和缓冲，并使用更频繁的清理和重试。

您可以使用 ClusterLogging 自定义资源（CR）中的以下参数配置 chunking 和 flushing 行为。然后这些参数会自动添加到 Fluentd 配置映射中，供 Fluentd 使用。

注意

这些参数：

与大多数用户无关。默认设置应该就可以提供良好的一般性能。
只适用于对 Fluentd 配置和性能有详细了解的高级用户。
仅用于性能调整。它们对日志的功能性没有影响。

表 7.1. 高级 Fluentd 配置参数
参数	描述	默认
`chunkLimitSize`	每个块的最大值。当数据达到这个大小时，Fluentd 会停止将数据写入一个块。然后，Fluentd 将块发送到队列并打开一个新的块。	`8m`
`totalLimitSize`	缓冲区的最大大小，即阶段（stage）和队列（stage）的总大小。如果缓冲区的大小超过这个值，Fluentd 会停止将数据添加到块，并显示错误失败。所有不在块中的数据都丢失。	`8G`
`flushInterval`	块清除之间的间隔。您可以使用 `s`（秒）、`m`（分钟）、`h`（小时）或 `d` （天）。	`1s`
`flushMode`	执行清除的方法： `lazy`:基于 `timekey` 参数对块进行清理。您无法修改 `timekey` 参数。 `interval`：基于 `flushInterval` 参数清理块。 `Immediate`: 在将数据添加到一个块后马上清理块。	`interval`
`flushThreadCount`	执行块清除（flushing）的线程数量。增加线程数量可提高冲刷吞吐量，这会隐藏网络延迟的情况。	`2`
`overflowAction`	当队列满时块的行为： `throw_exception`：发出一个异常并在日志中显示。 `block`：停止对数据进行块除了，直到缓冲区已用完的问题被解决为止。 `drop_oldest_chunk`：删除旧的块以接受新传入的块。旧块的价值比新块要小。	`block`
`retryMaxInterval`	`exponential_backoff` 重试方法的最大时间（以秒为单位）。	`300s`
`retryType`	flushing 失败时重试的方法： `exponential_backoff`：增加每次重新清理操作的间隔时间。Fluentd 会加倍到下一次重试需要等待的时间，直到达到 `retry_max_interval` 参数指定的值。 `periodic`：基于 `retryWait` 参数，定期重试清理操作。	`exponential_backoff`
`retryTimeOut`	在放弃记录前尝试重试的最长时间。	`60m`
`retryWait`	下一次块清除前的时间（以秒为单位）。	`1s`

如需有关 Fluentd 块生命周期的更多信息，请参阅 Fluentd 文档中的缓冲插件。

流程

编辑 openshift-logging 项目中的 ClusterLogging 自定义资源（CR）：
```
$ oc edit ClusterLogging instance
```
添加或修改以下任何参数：
```
apiVersion: logging.openshift.io/v1
kind: ClusterLogging
metadata:
  name: instance
  namespace: openshift-logging
spec:
  forwarder:
    fluentd:
      buffer:
        chunkLimitSize: 8m 1
        flushInterval: 5s 2
        flushMode: interval 3
        flushThreadCount: 3 4
        overflowAction: throw_exception 5
        retryMaxInterval: "300s" 6
        retryType: periodic 7
        retryWait: 1s 8
        totalLimitSize: 32m 9
...
```
1
请指定每个块在排队进行清除前的最大大小。
2
指定块清除之间间隔。
3
指定执行块清除的方法： lazy、interval 或 immediate。
4
指定用于块清除的线程数量。
5
指定当队列满时的块行为：throw_exception、block 或 drop_oldest_chunk。
6
指定使用 exponential_backoff 块清理方法时的最大间隔时间（以秒为单位）。
7
指定当块清除失败时重试的类型： exponential_backoff 或 periodic。
8
指定下一次块清除前的时间（以秒为单位）。
9
指定块缓冲区的最大大小。

验证 Fluentd Pod 是否已重新部署：

$ oc get pods -l component=collector -n openshift-logging

检查 fluentd 配置映射中的新值：

$ oc extract configmap/fluentd --confirm

fluentd.conf 示例

<buffer>
 @type file
 path '/var/lib/fluentd/default'
 flush_mode interval
 flush_interval 5s
 flush_thread_count 3
 retry_type periodic
 retry_wait 1s
 retry_max_interval 300s
 retry_timeout 60m
 queued_chunks_limit_size "#{ENV['BUFFER_QUEUE_LIMIT'] || '32'}"
 total_limit_size 32m
 chunk_limit_size 8m
 overflow_action throw_exception
</buffer>

7.2.5. 如果不使用默认的 Elasticsearch 日志存储，请删除未使用的组件

作为管理员，在非常罕见的情况下，当您将日志转发到第三方日志存储且不使用默认的 Elasticsearch 存储时，您可以从日志集群中移除几个未使用的组件。

换句话说，如果没有使用默认的 Elasticsearch 日志存储，您可以从 ClusterLogging 自定义资源 (CR) 中删除内部 Elasticsearch logStore 和 Kibana visualization 组件。删除这些组件是可选的，但会保存资源。

先决条件

验证您的日志转发程序没有将日志数据发送到默认的内部 Elasticsearch 集群。检查您用来配置日志转发的 ClusterLogForwarder CR YAML 文件。验证它没有指定 default 的 outputRefs 元素。例如：
```
outputRefs:
- default
```

警告

假定 ClusterLogForwarder CR 将日志数据转发到内部 Elasticsearch 集群，并从 ClusterLogging CR 中删除 logStore 组件。在这种情况下，内部 Elasticsearch 集群将不存在来存储日志数据。这会导致数据丢失。

流程

编辑 openshift-logging 项目中的 ClusterLogging 自定义资源（CR）：
```
$ oc edit ClusterLogging instance
```
如果存在，请从 ClusterLogging CR 中删除 logStore 和 visualization 小节。

保留 ClusterLogging CR 的 collection 小节。结果应类似以下示例：

apiVersion: "logging.openshift.io/v1"
kind: "ClusterLogging"
metadata:
  name: "instance"
  namespace: "openshift-logging"
spec:
  managementState: "Managed"
  collection:
    logs:
      type: "fluentd"
      fluentd: {}

验证收集器 Pod 是否已重新部署：

$ oc get pods -l component=collector -n openshift-logging

其他资源

将日志转发到第三方系统

7.3. 配置日志存储

Red Hat OpenShift 的 logging 子系统使用 Elasticsearch 6(ES)来存储和整理日志数据。

您可以修改日志存储，包括：

Elasticsearch 集群的存储
在集群中的数据节点间复制分片，从完整复制到不复制
外部访问 Elasticsearch 数据

Elasticsearch 是内存密集型应用程序。每个 Elasticsearch 节点都需要至少 16G 内存来满足内存请求和限值的需要，除非 ClusterLogging 自定义资源中另有指定。最初的 OpenShift Container Platform 节点组可能不足以支持 Elasticsearch 集群。您必须在 OpenShift Container Platform 集群中添加额外的节点才能使用推荐或更高的内存运行，每个 Elasticsearch 节点最多可使用 64G 个内存。

每个 Elasticsearch 节点都可以在较低的内存设置下运行，但在生产环境中不建议这样做。

7.3.1. 将审计日志转发到日志存储

默认情况下，OpenShift Logging 不会将审计日志存储在内部 OpenShift Container Platform Elasticsearch 日志存储中。您可以将审计日志发送到此日志存储，例如，您可以在 Kibana 中查看它们。

要将审计日志发送到默认的内部 Elasticsearch 日志存储，例如要在 Kibana 中查看审计日志，您必须使用 Log Forwarding API。

重要

内部 OpenShift Container Platform Elasticsearch 日志存储不为审计日志提供安全存储。验证您转发审计日志的系统是否符合您的机构和政府法规，并获得适当的保护。Red Hat OpenShift 的 logging 子系统不符合这些规范。

流程

使用 Log Forward API 将审计日志转发到内部 Elasticsearch 实例：

创建或编辑定义 ClusterLogForwarder CR 对象的 YAML 文件：

创建 CR 以将所有日志类型发送到内部 Elasticsearch 实例。您可以在不进行任何更改的情况下使用以下示例：
```
apiVersion: logging.openshift.io/v1
kind: ClusterLogForwarder
metadata:
  name: instance
  namespace: openshift-logging
spec:
  pipelines: 1
  - name: all-to-default
    inputRefs:
    - infrastructure
    - application
    - audit
    outputRefs:
    - default
```
1
管道（pipeline）定义使用指定输出转发的日志类型。默认输出将日志转发到内部 Elasticsearch 实例。
注意
您必须在管道中指定所有三种类型的日志：应用程序、基础架构和审核。如果没有指定日志类型，这些日志将不会被存储并丢失。

如果您有一个现有的 ClusterLogForwarder CR，请将管道添加到审计日志的默认输出中。您不需要定义默认输出。例如：

apiVersion: "logging.openshift.io/v1"
kind: ClusterLogForwarder
metadata:
  name: instance
  namespace: openshift-logging
spec:
  outputs:
   - name: elasticsearch-insecure
     type: "elasticsearch"
     url: http://elasticsearch-insecure.messaging.svc.cluster.local
     insecure: true
   - name: elasticsearch-secure
     type: "elasticsearch"
     url: https://elasticsearch-secure.messaging.svc.cluster.local
     secret:
       name: es-audit
   - name: secureforward-offcluster
     type: "fluentdForward"
     url: https://secureforward.offcluster.com:24224
     secret:
       name: secureforward
  pipelines:
   - name: container-logs
     inputRefs:
     - application
     outputRefs:
     - secureforward-offcluster
   - name: infra-logs
     inputRefs:
     - infrastructure
     outputRefs:
     - elasticsearch-insecure
   - name: audit-logs
     inputRefs:
     - audit
     outputRefs:
     - elasticsearch-secure
     - default 1

1: 此管道除外部实例外，还会将审计日志发送到内部 Elasticsearch 实例。

其他资源

有关 Log Forwarding API 的更多信息，请参阅使用 Log Forwarding API 转发日志。

7.3.2. 配置日志保留时间

您可以配置保留策略，指定默认 Elasticsearch 日志存储保留三个日志源的索引的时长：基础架构日志、应用程序日志和审计日志。

要配置保留策略，您需要为 ClusterLogging 自定义资源 (CR) 中的每个日志源设置 maxAge 参数。CR 将这些值应用到 Elasticsearch 滚动调度，它决定 Elasticsearch 何时删除滚动索引。

如果索引与以下条件之一匹配，Elasticsearch 会滚动索引，移动当前的索引并创建新索引：

索引早于 Elasticsearch CR 中的 rollover.maxAge 值。
索引大小超过主分片数乘以 40GB 的值。
索引的 doc 数大于主分片数乘以 40960 KB 的值。

Elasticsearch 会根据您配置的保留策略删除滚动索引。如果您没有为任何日志源创建保留策略，则默认在 7 天后删除日志。

先决条件

必须安装 Red Hat OpenShift 和 OpenShift Elasticsearch Operator 的 logging 子系统。

流程

配置日志保留时间：

编辑 ClusterLogging CR，以添加或修改 reservedPolicy 参数：
```
apiVersion: "logging.openshift.io/v1"
kind: "ClusterLogging"
...
spec:
  managementState: "Managed"
  logStore:
    type: "elasticsearch"
    retentionPolicy: 1
      application:
        maxAge: 1d
      infra:
        maxAge: 7d
      audit:
        maxAge: 7d
    elasticsearch:
      nodeCount: 3
...
```
1
指定 Elasticsearch 应该保留每个日志源的时间。输入一个整数和时间单位：周(w)、小时(h/H)、分钟(m)和秒。例如，1d 代表一天。时间超过 maxAge 的旧日志会被删除。默认情况下，日志会保留 7 天。
您可以验证 Elasticsearch 自定义资源（CR）中的设置。
例如，Red Hat OpenShift Logging Operator 更新了以下 Elasticsearch CR 以配置保留策略，包括设置以每八小时滚动基础架构日志的活跃索引，并在滚动后 7 天删除滚动的索引。OpenShift Container Platform 每 15 分钟检查一次，以确定是否需要滚动索引。
```
apiVersion: "logging.openshift.io/v1"
kind: "Elasticsearch"
metadata:
  name: "elasticsearch"
spec:
...
  indexManagement:
    policies: 1
      - name: infra-policy
        phases:
          delete:
            minAge: 7d 2
          hot:
            actions:
              rollover:
                maxAge: 8h 3
        pollInterval: 15m 4
...
```
1
对于每个日志源，保留策略代表何时删除和滚动该源的日志。
2
什么时候 OpenShift Container Platform 删除滚动索引。此设置是在 ClusterLogging CR 中设置的 maxAge。
3
当滚动索引时，OpenShift Container Platform 需要考虑的索引年龄。此值由 ClusterLogging CR 中的 maxAge 决定。
4
OpenShift Container Platform 什么时候检查应该检查滚动索引。这是默认设置，不可更改。
注意
不支持修改 Elasticsearch CR。对保留策略的所有更改都必须在 ClusterLogging CR 中进行。
OpenShift Elasticsearch Operator 部署 cron job，以使用定义的策略为每个映射滚动索引,并使用 pollInterval 调度。
```
$ oc get cronjob
```
输出示例
```
NAME                     SCHEDULE       SUSPEND   ACTIVE   LAST SCHEDULE   AGE
elasticsearch-im-app     */15 * * * *   False     0        <none>          4s
elasticsearch-im-audit   */15 * * * *   False     0        <none>          4s
elasticsearch-im-infra   */15 * * * *   False     0        <none>          4s
```

7.3.3. 为日志存储配置 CPU 和内存请求

每个组件规格都允许调整 CPU 和内存请求。您不应该手动调整这些值，因为 OpenShift Elasticsearch Operator 会设置适当的值以满足环境的要求。

注意

在大型集群中，Elasticsearch 代理容器的默认内存限值可能不足，从而导致代理容器被 OOMKilled。如果您遇到这个问题，请提高 Elasticsearch 代理的内存请求和限值。

每个 Elasticsearch 节点都可以在较低的内存设置下运行，但在生产部署中不建议这样做。对于生产环境，为每个 pod 应该分配的数量应不少于默认的 16Gi。最好为每个 pod 分配不超过 64Gi 的尽量多的数量。

先决条件

必须安装 Red Hat OpenShift Logging 和 Elasticsearch Operator。

流程

编辑 openshift-logging 项目中的 ClusterLogging 自定义资源（CR）：
```
$ oc edit ClusterLogging instance
```
```
apiVersion: "logging.openshift.io/v1"
kind: "ClusterLogging"
metadata:
  name: "instance"
....
spec:
    logStore:
      type: "elasticsearch"
      elasticsearch:1
        resources:
          limits: 2
            memory: "32Gi"
          requests: 3
            cpu: "1"
            memory: "16Gi"
        proxy: 4
          resources:
            limits:
              memory: 100Mi
            requests:
              memory: 100Mi
```
1
根据需要指定 Elasticsearch 的 CPU 和内存请求。如果这些值留白，则 OpenShift Elasticsearch Operator 会设置默认值，它们应足以满足大多数部署的需要。内存请求的默认值为 16Gi，CPU 请求为 1。
2
pod 可以使用的最大资源量。
3
调度 pod 所需的最小资源。
4
根据需要指定 Elasticsearch 代理的 CPU 和内存请求。如果这些值留白，则 OpenShift Elasticsearch Operator 会设置默认值，它们应足以满足大多数部署的需要。内存请求的默认值为 256Mi，CPU 请求的默认值为 100m。

在调整 Elasticsearch 内存量时，相同的值应该用于请求和限值。

例如：

      resources:
        limits: 1
          memory: "32Gi"
        requests: 2
          cpu: "8"
          memory: "32Gi"

1: 资源的最大数量。
2: 最低要求。

Kubernetes 一般遵循节点配置，不允许 Elasticsearch 使用指定的限值。为 请求（request） 和 限值（limit） 设置相同的值可确保 Elasticsearch 可以使用您想要的内存，假设节点具有可用内存。

7.3.4. 为日志存储配置复制策略

您可以定义如何在集群中的数据节点之间复制 Elasticsearch 分片：

先决条件

必须安装 Red Hat OpenShift Logging 和 Elasticsearch Operator。

流程

编辑 openshift-logging 项目中的 ClusterLogging 自定义资源（CR）：
```
$ oc edit clusterlogging instance
```
```
apiVersion: "logging.openshift.io/v1"
kind: "ClusterLogging"
metadata:
  name: "instance"

....

spec:
  logStore:
    type: "elasticsearch"
    elasticsearch:
      redundancyPolicy: "SingleRedundancy" 1
```
1
为分片指定冗余策略。更改会在保存后应用。
FullRedundancy：Elasticsearch 将每个索引的主分片完整复制到每个数据节点。这可提供最高的安全性，但代价是需要最大数量的磁盘并且性能最差。
MultipleRedundancy：Elasticsearch 将每个索引的主分片完整复制到一半的数据节点。这可在安全性和性能之间提供很好的折衷。
SingleRedundancy：Elasticsearch 为每个索引的主分片制作一个副本。只要存在至少两个数据节点，日志就能始终可用且可恢复。使用 5 个或更多节点时，性能胜过 MultipleRedundancy。您不能将此策略应用于单个 Elasticsearch 节点的部署。
ZeroRedundancy：Elasticsearch 不制作主分片的副本。如果节点关闭或发生故障，则可能无法获得日志数据。如果您更关注性能而非安全性，或者实施了自己的磁盘/PVC 备份/恢复策略，可以考虑使用此模式。

注意

索引模板的主分片数量等于 Elasticsearch 数据节点的数目。

7.3.5. 缩减 Elasticsearch pod

减少集群中的 Elasticsearch pod 数量可能会导致数据丢失或 Elasticsearch 性能下降。

如果缩减，应该一次缩减一个 pod，并允许集群重新平衡分片和副本。Elasticsearch 健康状态返回绿色后，您可以根据另一个 pod 进行缩减。

注意

如果 Elasticsearch 集群设置为 ZeroRedundancy，则不应缩减 Elasticsearch pod。

7.3.6. 为日志存储配置持久性存储

Elasticsearch 需要持久性存储。存储速度越快，Elasticsearch 性能越高。

警告

在 Elasticsearch 存储中不支持将 NFS 存储用作卷或持久性卷（或者通过 NAS 比如 Gluster），因为 Lucene 依赖于 NFS 不提供的文件系统行为。数据崩溃和其他问题可能会发生。

先决条件

必须安装 Red Hat OpenShift Logging 和 Elasticsearch Operator。

流程

编辑 ClusterLogging CR，将集群中的每个数据节点指定为绑定到持久性卷声明。

apiVersion: "logging.openshift.io/v1"
kind: "ClusterLogging"
metadata:
  name: "instance"
# ...
spec:
  logStore:
    type: "elasticsearch"
    elasticsearch:
      nodeCount: 3
      storage:
        storageClassName: "gp2"
        size: "200G"

本例中指定，集群中的每个数据节点都绑定到请求“200G”的 AWS 通用 SSD (gp2) 存储的 PVC。

注意

如果将本地卷用于持久性存储，请不要使用原始块卷，这在 LocalVolume 对象中的 volumeMode: block 描述。Elasticsearch 无法使用原始块卷。

7.3.7. 为 emptyDir 存储配置日志存储

您可以将 emptyDir 与日志存储搭配使用来创建一个临时部署，临时部署一旦重启其中所有 Pod 的数据都会丢失。

注意

使用 emptyDir 时，如果重启或重新部署日志存储，数据将会丢失。

先决条件

必须安装 Red Hat OpenShift Logging 和 Elasticsearch Operator。

流程

编辑 ClusterLogging CR 以指定 emptyDir:

 spec:
    logStore:
      type: "elasticsearch"
      elasticsearch:
        nodeCount: 3
        storage: {}

7.3.8. 执行 Elasticsearch 集群滚动重启

在更改 elasticsearch 配置映射或任何 elasticsearch-* 部署配置时，执行滚动重启。

此外，如果运行 Elasticsearch Pod 的节点需要重启，则建议滚动重启。

先决条件

必须安装 Red Hat OpenShift Logging 和 Elasticsearch Operator。

流程

执行集群滚动重启：

进入 openshift-logging 项目：
```
$ oc project openshift-logging
```

获取 Elasticsearch Pod 的名称：

$ oc get pods -l component=elasticsearch-

缩减收集器 Pod，以便它们停止向 Elasticsearch 发送新日志：

$ oc -n openshift-logging patch daemonset/collector -p '{"spec":{"template":{"spec":{"nodeSelector":{"logging-infra-collector": "false"}}}}}'

使用 OpenShift Container Platform es_util 工具执行分片同步刷新，确保在关机之前没有等待写入磁盘的待定操作：

$ oc exec <any_es_pod_in_the_cluster> -c elasticsearch -- es_util --query="_flush/synced" -XPOST

例如：

$ oc exec -c elasticsearch-cdm-5ceex6ts-1-dcd6c4c7c-jpw6  -c elasticsearch -- es_util --query="_flush/synced" -XPOST

输出示例

{"_shards":{"total":4,"successful":4,"failed":0},".security":{"total":2,"successful":2,"failed":0},".kibana_1":{"total":2,"successful":2,"failed":0}}

使用 OpenShift Container Platform es_util 工具防止在有意关闭节点时进行分片平衡：

$ oc exec <any_es_pod_in_the_cluster> -c elasticsearch -- es_util --query="_cluster/settings" -XPUT -d '{ "persistent": { "cluster.routing.allocation.enable" : "primaries" } }'

例如：

$ oc exec elasticsearch-cdm-5ceex6ts-1-dcd6c4c7c-jpw6 -c elasticsearch -- es_util --query="_cluster/settings" -XPUT -d '{ "persistent": { "cluster.routing.allocation.enable" : "primaries" } }'

输出示例

{"acknowledged":true,"persistent":{"cluster":{"routing":{"allocation":{"enable":"primaries"}}}},"transient":

完成后，会在每个部署中都有一个 ES 集群：

默认情况下，OpenShift Container Platform Elasticsearch 集群会阻止向其节点推出部署。使用以下命令来允许推出部署并允许 Pod 获取更改：

$ oc rollout resume deployment/<deployment-name>

例如：

$ oc rollout resume deployment/elasticsearch-cdm-0-1

输出示例

deployment.extensions/elasticsearch-cdm-0-1 resumed

部署了一个新 Pod。当 Pod 具有就绪的容器后，就能继续进行下一部署。

$ oc get pods -l component=elasticsearch-

输出示例

NAME                                            READY   STATUS    RESTARTS   AGE
elasticsearch-cdm-5ceex6ts-1-dcd6c4c7c-jpw6k    2/2     Running   0          22h
elasticsearch-cdm-5ceex6ts-2-f799564cb-l9mj7    2/2     Running   0          22h
elasticsearch-cdm-5ceex6ts-3-585968dc68-k7kjr   2/2     Running   0          22h

部署完成后，重置 Pod 以禁止推出部署：

$ oc rollout pause deployment/<deployment-name>

例如：

$ oc rollout pause deployment/elasticsearch-cdm-0-1

输出示例

deployment.extensions/elasticsearch-cdm-0-1 paused

检查 Elasticsearch 集群是否处于 green 或 yellow 状态：

$ oc exec <any_es_pod_in_the_cluster> -c elasticsearch -- es_util --query=_cluster/health?pretty=true

注意

如果您对先前命令中使用的 Elasticsearch Pod 执行了推出部署，该 Pod 将不再存在，并且此处需要使用新的 Pod 名称。

例如：

$ oc exec elasticsearch-cdm-5ceex6ts-1-dcd6c4c7c-jpw6 -c elasticsearch -- es_util --query=_cluster/health?pretty=true

{
  "cluster_name" : "elasticsearch",
  "status" : "yellow", 1
  "timed_out" : false,
  "number_of_nodes" : 3,
  "number_of_data_nodes" : 3,
  "active_primary_shards" : 8,
  "active_shards" : 16,
  "relocating_shards" : 0,
  "initializing_shards" : 0,
  "unassigned_shards" : 1,
  "delayed_unassigned_shards" : 0,
  "number_of_pending_tasks" : 0,
  "number_of_in_flight_fetch" : 0,
  "task_max_waiting_in_queue_millis" : 0,
  "active_shards_percent_as_number" : 100.0
}

1: 在继续操作前，请确保此参数值为 green 或者 yellow。

如果更改了 Elasticsearch 配置映射，请对每个 Elasticsearch Pod 重复这些步骤。

推出集群的所有部署后，重新启用分片平衡：

$ oc exec <any_es_pod_in_the_cluster> -c elasticsearch -- es_util --query="_cluster/settings" -XPUT -d '{ "persistent": { "cluster.routing.allocation.enable" : "all" } }'

例如：

$ oc exec elasticsearch-cdm-5ceex6ts-1-dcd6c4c7c-jpw6 -c elasticsearch -- es_util --query="_cluster/settings" -XPUT -d '{ "persistent": { "cluster.routing.allocation.enable" : "all" } }'

输出示例

{
  "acknowledged" : true,
  "persistent" : { },
  "transient" : {
    "cluster" : {
      "routing" : {
        "allocation" : {
          "enable" : "all"
        }
      }
    }
  }
}

扩展收集器 Pod，以便它们会将新日志发送到 Elasticsearch。

$ oc -n openshift-logging patch daemonset/collector -p '{"spec":{"template":{"spec":{"nodeSelector":{"logging-infra-collector": "true"}}}}}'

7.3.9. 将日志存储服务公开为路由

默认情况下，无法从日志记录集群外部访问部署了 Red Hat OpenShift 的 logging 子系统的日志存储。您可以启用一个 re-encryption termination 模式的路由，以实现外部对日志存储服务的访问来获取数据。

另外，还可以在外部创建一个重新加密路由，使用 OpenShift Container Platform 令牌和已安装的 Elasticsearch CA 证书以从外部访问日志存储。然后，使用包含以下内容的 cURL 请求访问托管日志存储服务的节点：

Authorization: Bearer ${token}
Elasticsearch 重新加密路由和 Elasticsearch API 请求。

在内部，可以使用日志存储集群 IP 访问日志存储服务。您可以使用以下命令之一获取它：

$ oc get service elasticsearch -o jsonpath={.spec.clusterIP} -n openshift-logging

输出示例

172.30.183.229

$ oc get service elasticsearch -n openshift-logging

输出示例

NAME            TYPE        CLUSTER-IP       EXTERNAL-IP   PORT(S)    AGE
elasticsearch   ClusterIP   172.30.183.229   <none>        9200/TCP   22h

您可以使用类似如下的命令检查集群 IP 地址：

$ oc exec elasticsearch-cdm-oplnhinv-1-5746475887-fj2f8 -n openshift-logging -- curl -tlsv1.2 --insecure -H "Authorization: Bearer ${token}" "https://172.30.183.229:9200/_cat/health"

输出示例

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100    29  100    29    0     0    108      0 --:--:-- --:--:-- --:--:--   108

先决条件

必须安装 Red Hat OpenShift Logging 和 Elasticsearch Operator。
您必须具有项目的访问权限，以便能访问其日志。

流程

对外部公开日志存储：

进入 openshift-logging 项目：
```
$ oc project openshift-logging
```
从日志存储提取 CA 证书并写入 admin-ca 文件：
```
$ oc extract secret/elasticsearch --to=. --keys=admin-ca
```
输出示例
```
admin-ca
```
以 YAML 文件形式创建日志存储服务的路由：
1. 使用以下内容创建一个 YAML文件：
```
apiVersion: route.openshift.io/v1
kind: Route
metadata:
  name: elasticsearch
  namespace: openshift-logging
spec:
  host:
  to:
    kind: Service
    name: elasticsearch
  tls:
    termination: reencrypt
    destinationCACertificate: | 1
```
  1
  添加日志存储 CA 证书或使用下一步中的命令。您不必设置一些重新加密路由所需的 spec.tls.key、spec.tls.certificate 和 spec.tls.caCertificate 参数。
2. 运行以下命令，将日志存储 CA 证书添加到您在上一步中创建的路由 YAML 中：
```
$ cat ./admin-ca | sed -e "s/^/      /" >> <file-name>.yaml
```
3. 创建路由：
```
$ oc create -f <file-name>.yaml
```
  输出示例
```
route.route.openshift.io/elasticsearch created
```

检查是否公开了 Elasticsearch 服务：

获取此服务帐户的令牌，以便在请求中使用：
```
$ token=$(oc whoami -t)
```

将您创建的 Elasticsearch 路由设置为环境变量。

$ routeES=`oc get route elasticsearch -o jsonpath={.spec.host}`

要验证路由是否创建成功，请运行以下命令来通过公开的路由访问 Elasticsearch：

curl -tlsv1.2 --insecure -H "Authorization: Bearer ${token}" "https://${routeES}"

其响应类似于如下：

输出示例

{
  "name" : "elasticsearch-cdm-i40ktba0-1",
  "cluster_name" : "elasticsearch",
  "cluster_uuid" : "0eY-tJzcR3KOdpgeMJo-MQ",
  "version" : {
  "number" : "6.8.1",
  "build_flavor" : "oss",
  "build_type" : "zip",
  "build_hash" : "Unknown",
  "build_date" : "Unknown",
  "build_snapshot" : true,
  "lucene_version" : "7.7.0",
  "minimum_wire_compatibility_version" : "5.6.0",
  "minimum_index_compatibility_version" : "5.0.0"
},
  "<tagline>" : "<for search>"
}

7.4. 配置日志可视化工具

OpenShift Container Platform 使用 Kibana 显示 logging 子系统收集的日志数据。

您可以扩展 Kibana 来实现冗余性，并为 Kibana 节点配置 CPU 和内存。

7.4.1. 配置 CPU 和内存限值

logging 子系统组件允许对 CPU 和内存限值进行调整。

流程

编辑 openshift-logging 项目中的 ClusterLogging 自定义资源（CR）：

$ oc -n openshift-logging edit ClusterLogging instance

apiVersion: "logging.openshift.io/v1"
kind: "ClusterLogging"
metadata:
  name: "instance"
  namespace: openshift-logging

...

spec:
  managementState: "Managed"
  logStore:
    type: "elasticsearch"
    elasticsearch:
      nodeCount: 3
      resources: 1
        limits:
          memory: 16Gi
        requests:
          cpu: 200m
          memory: 16Gi
      storage:
        storageClassName: "gp2"
        size: "200G"
      redundancyPolicy: "SingleRedundancy"
  visualization:
    type: "kibana"
    kibana:
      resources: 2
        limits:
          memory: 1Gi
        requests:
          cpu: 500m
          memory: 1Gi
      proxy:
        resources: 3
          limits:
            memory: 100Mi
          requests:
            cpu: 100m
            memory: 100Mi
      replicas: 2
  collection:
    logs:
      type: "fluentd"
      fluentd:
        resources: 4
          limits:
            memory: 736Mi
          requests:
            cpu: 200m
            memory: 736Mi

1: 根据需要指定日志存储的 CPU 和内存限值及请求。对于 Elasticsearch，您必须调整请求值和限制值。
2 3: 根据需要为日志 visualizer 指定 CPU 和内存限值和请求。
4: 根据需要指定日志收集器的 CPU 和内存限值及请求。

7.4.2. 为日志可视化器节点扩展冗余性

您可以扩展托管日志视觉化器的 pod 以增加它的冗余性。

流程

编辑 openshift-logging 项目中的 ClusterLogging 自定义资源（CR）：

$ oc edit ClusterLogging instance

$ oc edit ClusterLogging instance

apiVersion: "logging.openshift.io/v1"
kind: "ClusterLogging"
metadata:
  name: "instance"

....

spec:
    visualization:
      type: "kibana"
      kibana:
        replicas: 1 1

1: 指定 Kibana 节点的数量。

7.5. 配置日志记录子系统存储

Elasticsearch 是内存密集型应用程序。默认日志记录子系统安装为内存请求和内存限值部署 16G 内存。最初的 OpenShift Container Platform 节点组可能不足以支持 Elasticsearch 集群。您必须在 OpenShift Container Platform 集群中添加额外的节点，才能使用建议或更高的内存来运行。每个 Elasticsearch 节点都可以在较低的内存设置下运行，但在生产环境中不建议这样做。

7.5.1. Red Hat OpenShift 日志记录子系统的存储注意事项

每个 Elasticsearch 部署配置都需要一个持久性卷。在 OpenShift Container Platform 中，这可以使用 PVC 来实现。

注意

如果将本地卷用于持久性存储，请不要使用原始块卷，这在 LocalVolume 对象中的 volumeMode: block 描述。Elasticsearch 无法使用原始块卷。

OpenShift Elasticsearch Operator 使用 Elasticsearch 资源名称为 PVC 命名。

Fluentd 将 systemd journal 和 /var/log/containers/ 的所有日志都传输到 Elasticsearch。

Elasticsearch 需要足够内存来执行大型合并操作。如果没有足够的内存，它将会变得无响应。要避免这个问题，请评估应用程序日志数据的数量，并分配大约两倍的可用存储容量。

默认情况下，当存储容量为 85% 满时，Elasticsearch 会停止向节点分配新数据。90% 时，Elasticsearch 会在可能的情况下将现有分片重新定位到其他节点。但是，如果存储消耗低于 85％时无节点有可用存储空间，Elasticsearch 会拒绝创建新索引并且变为 RED。

注意

这些高、低水位线值是当前版本中的 Elasticsearch 默认值。您可以修改这些默认值。虽然警报使用相同的默认值，但无法在警报中更改这些值。

7.5.2. 其他资源

为日志存储配置持久性存储

7.6. 为日志记录子系统组件配置 CPU 和内存限值

您可以根据需要配置每个日志记录子系统组件的 CPU 和内存限值。

7.6.1. 配置 CPU 和内存限值

logging 子系统组件允许对 CPU 和内存限值进行调整。

流程

编辑 openshift-logging 项目中的 ClusterLogging 自定义资源（CR）：

$ oc -n openshift-logging edit ClusterLogging instance

apiVersion: "logging.openshift.io/v1"
kind: "ClusterLogging"
metadata:
  name: "instance"
  namespace: openshift-logging

...

spec:
  managementState: "Managed"
  logStore:
    type: "elasticsearch"
    elasticsearch:
      nodeCount: 3
      resources: 1
        limits:
          memory: 16Gi
        requests:
          cpu: 200m
          memory: 16Gi
      storage:
        storageClassName: "gp2"
        size: "200G"
      redundancyPolicy: "SingleRedundancy"
  visualization:
    type: "kibana"
    kibana:
      resources: 2
        limits:
          memory: 1Gi
        requests:
          cpu: 500m
          memory: 1Gi
      proxy:
        resources: 3
          limits:
            memory: 100Mi
          requests:
            cpu: 100m
            memory: 100Mi
      replicas: 2
  collection:
    logs:
      type: "fluentd"
      fluentd:
        resources: 4
          limits:
            memory: 736Mi
          requests:
            cpu: 200m
            memory: 736Mi

1: 根据需要指定日志存储的 CPU 和内存限值及请求。对于 Elasticsearch，您必须调整请求值和限制值。
2 3: 根据需要为日志 visualizer 指定 CPU 和内存限值和请求。
4: 根据需要指定日志收集器的 CPU 和内存限值及请求。

7.7. 使用容忍度来控制 OpenShift Logging pod 放置

您可以使用污点和容限来确保 logging 子系统 pod 在特定节点上运行，并确保其他工作负载不在这些节点上运行。

污点和容忍度是简单的 key:value 对。节点上的污点指示节点排斥所有不容许该污点的 pod。

key 是最长为 253 个字符的任意字符串，value 则是最长为 63 个字符的任意字符串。字符串必须以字母或数字开头，并且可以包含字母、数字、连字符、句点和下划线。

带有容限的日志记录子系统 CR 示例

apiVersion: "logging.openshift.io/v1"
kind: "ClusterLogging"
metadata:
  name: "instance"
  namespace: openshift-logging

...

spec:
  managementState: "Managed"
  logStore:
    type: "elasticsearch"
    elasticsearch:
      nodeCount: 3
      tolerations: 1
      - key: "logging"
        operator: "Exists"
        effect: "NoExecute"
        tolerationSeconds: 6000
      resources:
        limits:
          memory: 16Gi
        requests:
          cpu: 200m
          memory: 16Gi
      storage: {}
      redundancyPolicy: "ZeroRedundancy"
  visualization:
    type: "kibana"
    kibana:
      tolerations: 2
      - key: "logging"
        operator: "Exists"
        effect: "NoExecute"
        tolerationSeconds: 6000
      resources:
        limits:
          memory: 2Gi
        requests:
          cpu: 100m
          memory: 1Gi
      replicas: 1
  collection:
    logs:
      type: "fluentd"
      fluentd:
        tolerations: 3
        - key: "logging"
          operator: "Exists"
          effect: "NoExecute"
          tolerationSeconds: 6000
        resources:
          limits:
            memory: 2Gi
          requests:
            cpu: 100m
            memory: 1Gi

1: 此容忍度添加到 Elasticsearch Pod。
2: 此容忍度添加到 Kibana Pod。
3: 此容忍度添加到日志记录收集器 Pod。

7.7.1. 使用容忍度来控制日志存储 pod 放置

您可以通过在 pod 上使用容忍度来控制日志存储 pod 在哪些节点上运行，并防止其他工作负载使用这些节点。

您可以通过 ClusterLogging 自定义资源（CR）将容限应用到日志存储 pod,并通过节点规格将污点应用到节点。节点上的污点是一个 key:value 对，它指示节点排斥所有不容许该污点的 pod。通过使用不在其他 pod 上的特定 key:value 对，可以确保仅日志存储 pod 能够在该节点上运行。

默认情况下，日志存储 pod 具有以下容忍度：

tolerations:
- effect: "NoExecute"
  key: "node.kubernetes.io/disk-pressure"
  operator: "Exists"

先决条件

必须安装 Red Hat OpenShift Logging 和 Elasticsearch Operator。

流程

使用以下命令，将污点添加到要在其上调度 OpenShift Logging pod 的节点：
```
$ oc adm taint nodes <node-name> <key>=<value>:<effect>
```
例如：
```
$ oc adm taint nodes node1 elasticsearch=node:NoExecute
```
本例在 node1 上放置一个键为 elasticsearch 且值为 node 的污点，污点效果是 NoExecute。具有 NoExecute 效果的节点仅调度与污点匹配的 Pod，并删除不匹配的现有 pod。
编辑 ClusterLogging CR 的 logstore 部分，以配置 Elasticsearch Pod 的容忍度：
```
  logStore:
    type: "elasticsearch"
    elasticsearch:
      nodeCount: 1
      tolerations:
      - key: "elasticsearch"  1
        operator: "Exists"  2
        effect: "NoExecute"  3
        tolerationSeconds: 6000  4
```
1
指定添加到节点的键。
2
指定 Exists operator 需要节点上有一个带有键为 elasticsearch 的污点。
3
指定 NoExecute 效果。
4
（可选）指定 tolerationSeconds 参数，以设置 pod 在被逐出前可以保持绑定到节点的时长。

此容忍度与 oc adm taint 命令创建的污点匹配。具有此容忍度的 pod 可以调度到 node1 上。

7.7.2. 使用容忍度来控制日志可视化 pod 放置

您可以通过在 pod 上使用容忍度来控制 Curator pod 在哪些节点上运行，并防止其他工作负载使用这些节点。

您可以通过 ClusterLogging 自定义资源（CR）将容忍度应用到日志视觉化 pod，并通过节点规格将污点应用到节点。节点上的污点是一个 key:value 对，它指示节点排斥所有不容许该污点的 pod。通过使用没有在其他 Pod 上使用的特定 key:value 对，可以确保仅 Kibana Pod 能够在该节点上运行。

先决条件

必须安装 Red Hat OpenShift Logging 和 Elasticsearch Operator。

流程

使用以下命令，将污点添加到要在其上调度日志可视化 pod：
```
$ oc adm taint nodes <node-name> <key>=<value>:<effect>
```
例如：
```
$ oc adm taint nodes node1 kibana=node:NoExecute
```
本例在 node1 上放置一个键为 kibana 且值为 node 的污点，污点效果是 NoExecute。您必须使用 NoExecute 污点设置。NoExecute 仅调度与污点匹配的 pod，并删除不匹配的现有 pod。
编辑 ClusterLogging CR 的 visualization 部分，以配置 Kibana pod 的容忍度：
```
  visualization:
    type: "kibana"
    kibana:
      tolerations:
      - key: "kibana"  1
        operator: "Exists"  2
        effect: "NoExecute"  3
        tolerationSeconds: 6000 4
```
1
指定添加到节点的键。
2
指定 Exists 运算符，以要求匹配 key/value/effect 参数。
3
指定 NoExecute 效果。
4
（可选）指定 tolerationSeconds 参数，以设置 pod 在被逐出前可以保持绑定到节点的时长。

此容忍度与 oc adm taint 命令创建的污点匹配。具有此容限的 pod 可以调度到 node1 上。

7.7.3. 使用容忍度来控制日志收集器 pod 放置

您可以通过在 pod 上使用容忍度来确保日志记录收集器 pod 在哪些节点上运行，并防止其他工作负载使用这些节点。

您可以通过 ClusterLogging 自定义资源（CR）将容忍度应用到日志记录收集器 pod，并通过节点规格将污点应用到节点。您可以使用污点和容限来确保 pod 不会因为内存和 CPU 问题而被驱除。

默认情况下，日志记录收集器 pod 具有以下容忍度：

tolerations:
- key: "node-role.kubernetes.io/master"
  operator: "Exists"
  effect: "NoExecute"

先决条件

必须安装 Red Hat OpenShift Logging 和 Elasticsearch Operator。

流程

使用以下命令，将污点添加到要在其上调度日志记录收集器 pod 的节点：
```
$ oc adm taint nodes <node-name> <key>=<value>:<effect>
```
例如：
```
$ oc adm taint nodes node1 collector=node:NoExecute
```
本例在 node1 上放置一个键为 collector 且值为 node 的污点，污点效果是 NoExecute。您必须使用 NoExecute 污点设置。NoExecute 仅调度与污点匹配的 pod，并删除不匹配的现有 pod。
编辑 ClusterLogging 自定义资源（CR）的 collection 小节，以配置日志记录收集器 Pod 的容忍度：
```
  collection:
    logs:
      type: "fluentd"
      fluentd:
        tolerations:
        - key: "collector"  1
          operator: "Exists"  2
          effect: "NoExecute"  3
          tolerationSeconds: 6000  4
```
1
指定添加到节点的键。
2
指定 Exists 运算符，以要求匹配 key/value/effect 参数。
3
指定 NoExecute 效果。
4
（可选）指定 tolerationSeconds 参数，以设置 pod 在被逐出前可以保持绑定到节点的时长。

此容忍度与 oc adm taint 命令创建的污点匹配。具有此容限的 pod 可以调度到 node1 上。

7.7.4. 其他资源

使用节点污点控制 pod 放置。

7.8. 使用节点选择器移动日志记录子系统资源

您可以使用节点选择器将 Elasticsearch 和 Kibana Pod 部署到不同的节点上。

7.8.1. 移动 OpenShift Logging 资源

您可以配置 Cluster Logging Operator，以将用于日志记录子系统组件的 Pod（如 Elasticsearch 和 Kibana）部署到不同的节点上。您无法将 Cluster Logging Operator Pod 从其安装位置移走。

例如，您可以因为 CPU、内存和磁盘要求较高而将 Elasticsearch Pod 移到一个单独的节点上。

先决条件

必须安装 Red Hat OpenShift Logging 和 Elasticsearch Operator。默认情况下没有安装这些功能。

流程

编辑 openshift-logging 项目中的 ClusterLogging 自定义资源（CR）：

$ oc edit ClusterLogging instance

apiVersion: logging.openshift.io/v1
kind: ClusterLogging

...

spec:
  collection:
    logs:
      fluentd:
        resources: null
      type: fluentd
  logStore:
    elasticsearch:
      nodeCount: 3
      nodeSelector: 1
        node-role.kubernetes.io/infra: ''
      tolerations:
      - effect: NoSchedule
        key: node-role.kubernetes.io/infra
        value: reserved
      - effect: NoExecute
        key: node-role.kubernetes.io/infra
        value: reserved
      redundancyPolicy: SingleRedundancy
      resources:
        limits:
          cpu: 500m
          memory: 16Gi
        requests:
          cpu: 500m
          memory: 16Gi
      storage: {}
    type: elasticsearch
  managementState: Managed
  visualization:
    kibana:
      nodeSelector: 2
        node-role.kubernetes.io/infra: ''
      tolerations:
      - effect: NoSchedule
        key: node-role.kubernetes.io/infra
        value: reserved
      - effect: NoExecute
        key: node-role.kubernetes.io/infra
        value: reserved
      proxy:
        resources: null
      replicas: 1
      resources: null
    type: kibana

...

1 2: 添加 nodeSelector 参数，并设为适用于您想要移动的组件的值。您可以根据为节点指定的值，按所示格式使用 nodeSelector 或使用 <key>: <value> 对。如果您在 infrasructure 节点中添加了污点，还要添加匹配的容限。

验证

要验证组件是否已移动，您可以使用 oc get pod -o wide 命令。

例如：

您需要移动来自 ip-10-0-147-79.us-east-2.compute.internal 节点上的 Kibana pod：

$ oc get pod kibana-5b8bdf44f9-ccpq9 -o wide

输出示例

NAME                      READY   STATUS    RESTARTS   AGE   IP            NODE                                        NOMINATED NODE   READINESS GATES
kibana-5b8bdf44f9-ccpq9   2/2     Running   0          27s   10.129.2.18   ip-10-0-147-79.us-east-2.compute.internal   <none>           <none>

您需要将 Kibana pod 移到 ip-10-0-139-48.us-east-2.compute.internal 节点，该节点是一个专用的基础架构节点：

$ oc get nodes

输出示例

NAME                                         STATUS   ROLES          AGE   VERSION
ip-10-0-133-216.us-east-2.compute.internal   Ready    master         60m   v1.23.0
ip-10-0-139-146.us-east-2.compute.internal   Ready    master         60m   v1.23.0
ip-10-0-139-192.us-east-2.compute.internal   Ready    worker         51m   v1.23.0
ip-10-0-139-241.us-east-2.compute.internal   Ready    worker         51m   v1.23.0
ip-10-0-147-79.us-east-2.compute.internal    Ready    worker         51m   v1.23.0
ip-10-0-152-241.us-east-2.compute.internal   Ready    master         60m   v1.23.0
ip-10-0-139-48.us-east-2.compute.internal    Ready    infra          51m   v1.23.0

请注意，该节点具有 node-role.kubernetes.io/infra: " label:

$ oc get node ip-10-0-139-48.us-east-2.compute.internal -o yaml

输出示例

kind: Node
apiVersion: v1
metadata:
  name: ip-10-0-139-48.us-east-2.compute.internal
  selfLink: /api/v1/nodes/ip-10-0-139-48.us-east-2.compute.internal
  uid: 62038aa9-661f-41d7-ba93-b5f1b6ef8751
  resourceVersion: '39083'
  creationTimestamp: '2020-04-13T19:07:55Z'
  labels:
    node-role.kubernetes.io/infra: ''
...

要移动 Kibana pod，编辑 ClusterLogging CR 以添加节点选择器：

apiVersion: logging.openshift.io/v1
kind: ClusterLogging

...

spec:

...

  visualization:
    kibana:
      nodeSelector: 1
        node-role.kubernetes.io/infra: ''
      proxy:
        resources: null
      replicas: 1
      resources: null
    type: kibana

1: 添加节点选择器以匹配节点规格中的 label。

保存 CR 后，当前 Kibana Pod 将被终止，新的 Pod 会被部署：

$ oc get pods

输出示例

NAME                                            READY   STATUS        RESTARTS   AGE
cluster-logging-operator-84d98649c4-zb9g7       1/1     Running       0          29m
elasticsearch-cdm-hwv01pf7-1-56588f554f-kpmlg   2/2     Running       0          28m
elasticsearch-cdm-hwv01pf7-2-84c877d75d-75wqj   2/2     Running       0          28m
elasticsearch-cdm-hwv01pf7-3-f5d95b87b-4nx78    2/2     Running       0          28m
fluentd-42dzz                                   1/1     Running       0          28m
fluentd-d74rq                                   1/1     Running       0          28m
fluentd-m5vr9                                   1/1     Running       0          28m
fluentd-nkxl7                                   1/1     Running       0          28m
fluentd-pdvqb                                   1/1     Running       0          28m
fluentd-tflh6                                   1/1     Running       0          28m
kibana-5b8bdf44f9-ccpq9                         2/2     Terminating   0          4m11s
kibana-7d85dcffc8-bfpfp                         2/2     Running       0          33s

新 pod 位于 ip-10-0-139-48.us-east-2.compute.internal 节点上 :

$ oc get pod kibana-7d85dcffc8-bfpfp -o wide

输出示例

NAME                      READY   STATUS        RESTARTS   AGE   IP            NODE                                        NOMINATED NODE   READINESS GATES
kibana-7d85dcffc8-bfpfp   2/2     Running       0          43s   10.131.0.22   ip-10-0-139-48.us-east-2.compute.internal   <none>           <none>

片刻后，原始 Kibana Pod 将被删除。

$ oc get pods

输出示例

NAME                                            READY   STATUS    RESTARTS   AGE
cluster-logging-operator-84d98649c4-zb9g7       1/1     Running   0          30m
elasticsearch-cdm-hwv01pf7-1-56588f554f-kpmlg   2/2     Running   0          29m
elasticsearch-cdm-hwv01pf7-2-84c877d75d-75wqj   2/2     Running   0          29m
elasticsearch-cdm-hwv01pf7-3-f5d95b87b-4nx78    2/2     Running   0          29m
fluentd-42dzz                                   1/1     Running   0          29m
fluentd-d74rq                                   1/1     Running   0          29m
fluentd-m5vr9                                   1/1     Running   0          29m
fluentd-nkxl7                                   1/1     Running   0          29m
fluentd-pdvqb                                   1/1     Running   0          29m
fluentd-tflh6                                   1/1     Running   0          29m
kibana-7d85dcffc8-bfpfp                         2/2     Running   0          62s

7.9. 配置 systemd-journald 和 Fluentd

Fluentd 需要从日志 (journal) 中读取数据。因为日志默认设置非常低，它可能无法跟上系统服务的日志记录率，所以日志条目可能会丢失。

我们推荐设置 RateLimitIntervalSec=30s 和 RateLimitBurst=10000 （如有必要甚至更高）以防止日志丢失条目。

7.9.1. 为 OpenShift Logging 配置 systemd-journald

随着项目的扩展，默认的日志记录环境可能需要进行一些调整。

例如，如果有缺少日志数据的情况，则可能需要提高 journald 的速率限制。您可以调整在指定时间段内保留的消息数量，以确保 OpenShift Logging 在不丢弃日志的情况下不使用过量资源。

您还可以确定是否压缩日志、日志需要保留的时间、如何存储日志，以及其他设置。

流程

创建一个 Butane 配置文件 40-worker-custom-journald.bu，其中包含带有所需设置的 /etc/systemd/journald.conf 文件。
注意
有关 Butane 的信息，请参阅"使用 Butane 创建机器配置"。
```
variant: openshift
version: 4.10.0
metadata:
  name: 40-worker-custom-journald
  labels:
    machineconfiguration.openshift.io/role: "worker"
storage:
  files:
  - path: /etc/systemd/journald.conf
    mode: 0644 1
    overwrite: true
    contents:
      inline: |
        Compress=yes 2
        ForwardToConsole=no 3
        ForwardToSyslog=no
        MaxRetentionSec=1month 4
        RateLimitBurst=10000 5
        RateLimitIntervalSec=30s
        Storage=persistent 6
        SyncIntervalSec=1s 7
        SystemMaxUse=8G 8
        SystemKeepFree=20% 9
        SystemMaxFileSize=10M 10
```
1
设置 journald.conf 文件的权限。建议把选项设置为 0644 。
2
指定是否要在将日志写入文件系统前压缩日志。指定 yes 来压缩消息，或指定 no 不压缩信息。默认为 yes。
3
配置是否转发日志信息。每个默认值为 no 。指定：
ForwardToConsole 将日志转发到系统控制台。
ForwardToKMsg 将日志转发到内核日志缓冲区。
ForwardToSyslog 将日志转发到 syslog 守护进程。
ForwardToWall 将信息作为墙信息转发给所有登录的用户。
4
指定存储日志条目的最长时间。输入秒数。或包括一个单位：" year" 、"month" 、"week" 、"day" 、"h" 或 "m"。输入 0 来禁用。默认值为 1month。
5
配置速率限制。如果在 RateLimitIntervalSec 定义的时间间隔内收到 RateLimitBurst 中指定的日志数，则该时间段内的所有进一步信息都会被丢弃，直到间隔结束。建议您设置 RateLimitIntervalSec=30s 和 RateLimitBurst=10000，它们是默认值。
6
指定日志的存储方式。默认为 persistent：
volatile 在 /var/log/journal/ 中存储内存中的日志数据。
persistent 把日志保存到磁盘的 /var/log/journal/。如果这个目录步存在，systemd 将会创建这个目录。
auto 将日志存储在 /var/log/journal/ 中（如果存在这个目录）。如果不存在，systemd 会临时将日志保存在 /run/systemd/journal 中。
none 不存储日志。systemd 丢弃所有日志。
7
指定在将 ERR, WARNING, NOTICE, INFO 和 DEBUG 日志同步到磁盘上前等待的超时时间。systemd 在接收到 CRIT, ALERT 或 EMERG 日志后会立即进行同步。默认值为 1s。
8
指定日志可以使用的最大值。默认值为 8G。
9
指定 systemd 必须保留多少磁盘空间。默认值为 20%。
10
指定保存在 /var/log/journal 中的独立日志文件的最大大小。默认值为 10M。
注意
如果删除速率限制，您可能会看到系统日志记录守护进程的 CPU 使用率增加，因为它需要处理在以前可以被限制掉的信息。
如需了解更多关于 systemd 设置的信息，请参阅 https://www.freedesktop.org/software/systemd/man/journald.conf.html。该页面中列出的默认设置可能不适用于 OpenShift Container Platform。
使用 Butane 生成 MachineConfig 对象文件 40-worker-custom-journald.yaml，它包含要提供给节点的配置：
```
$ butane 40-worker-custom-journald.bu -o 40-worker-custom-journald.yaml
```
应用机器配置。例如：
```
$ oc apply -f 40-worker-custom-journald.yaml
```
控制器检测到新的 MachineConfig 对象，并生成新的 rendered-worker-<hash> 版本。

监控新配置在每个节点中的应用状态：

$ oc describe machineconfigpool/worker

输出示例

Name:         worker
Namespace:
Labels:       machineconfiguration.openshift.io/mco-built-in=
Annotations:  <none>
API Version:  machineconfiguration.openshift.io/v1
Kind:         MachineConfigPool

...

Conditions:
  Message:
  Reason:                All nodes are updating to rendered-worker-913514517bcea7c93bd446f4830bc64e

7.10. 维护和支持

7.10.1. 不支持的配置

注意

7.10.2. 不支持的配置

您必须将 Red Hat OpenShift Logging Operator 设置为非受管状态，才能修改以下组件：

Elasticsearch CR
Kibana 部署
fluent.conf 文件
Fluentd 守护进程集

您必须将 OpenShift Elasticsearch Operator 设置为非受管状态才能修改以下组件：

Elasticsearch 部署文件。

明确不支持的情形包括：

配置默认日志轮转。您无法修改默认的日志轮转配置。
配置所收集日志的位置。您无法更改日志收集器输出文件的位置，默认为 /var/log/fluentd/fluentd.log。
日志收集节流。您不能减慢日志收集器读取日志的速度。
使用环境变量配置日志记录收集器。您不能使用环境变量来修改日志收集器。
配置日志收集器规范日志的方式。您无法修改默认日志规范化。

7.10.3. 非受管 Operator 的支持策略

Operator 的 管理状态 决定了一个 Operator 是否按设计积极管理集群中其相关组件的资源。如果 Operator 设置为 非受管（unmanaged） 状态，它不会响应配置更改，也不会收到更新。

虽然它可以在非生产环境集群或调试过程中使用，但处于非受管状态的 Operator 不被正式支持，集群管理员需要完全掌控各个组件的配置和升级。

可使用以下方法将 Operator 设置为非受管状态：

独立 Operator 配置
独立 Operator 的配置中具有 managementState 参数。这可以通过不同的方法来访问，具体取决于 Operator。例如，Red Hat OpenShift Logging Operator 通过修改它管理的自定义资源（CR）来达到此目的，而 Cluster Samples Operator 使用了集群范围配置资源。
将 managementState 参数更改为 Unmanaged 意味着 Operator 不会主动管理它的资源，也不会执行与相关组件相关的操作。一些 Operator 可能不支持此管理状态，因为它可能会损坏集群，需要手动恢复。
警告
将独立 Operator 更改为非受管状态会导致不支持该特定组件和功能。报告的问题必须在 受管（Managed） 状态中可以重复出现才能继续获得支持。
Cluster Version Operator (CVO) 覆盖
可将 spec.overrides 参数添加到 CVO 配置中，以便管理员提供对组件的 CVO 行为覆盖的列表。将一个组件的 spec.overrides[].unmanaged 参数设置为 true 会阻止集群升级并在设置 CVO 覆盖后提醒管理员：
```
Disabling ownership via cluster version overrides prevents upgrades. Please remove overrides before continuing.
```
警告
设置 CVO 覆盖会使整个集群处于不受支持状态。在删除所有覆盖后，必须可以重现报告的问题方可获得支持。

第 8 章使用 LokiStack 进行日志记录

在 logging 子系统文档中，LokiStack 是指通过 OpenShift Container Platform 身份验证集成支持 Loki 和 Web 代理的组合。LokiStack 的代理使用 OpenShift Container Platform 身份验证来强制实施多租户。Loki 将日志存储称为单个组件或外部存储。

Loki 是一个可横向扩展的、高度可用且多租户的日志聚合系统，目前作为日志记录子系统的日志存储提供。Elasticsearch 在 ingestion 过程中完全索引传入的日志记录。Loki 仅在 ingestion 过程中索引几个固定标签，并延迟更复杂的解析，直到存储日志为止。这意味着 Loki 可以更快地收集日志。您可以使用 LogQL 日志查询语言查询 Loki。

8.1. 部署大小

Loki 的大小使用 N<x>.<size> 格式，其中值 <N> 是实例的号，<size> 指定性能能力。

注意

1x.extra-small 仅用于演示目的，并不被支持。

表 8.1. Loki 大小
	1x.extra-small	1x.small	1x.medium
数据传输	仅用于演示。	500GB/day	2TB/day
每秒查询数 (QPS)	仅用于演示。	25-50 QPS at 200ms	25-75 QPS at 200ms
复制因子	无	2	3
总 CPU 请求	5 个 vCPU	36 个 vCPU	54 个 vCPU
总内存请求	7.5Gi	63Gi	139Gi
总磁盘请求	150Gi	300Gi	450Gi

8.1.1. 支持的 API 自定义资源定义

LokiStack 开发正在进行中，目前尚不支持所有 API。

CustomResourceDefinition (CRD)	ApiVersion	支持状态
LokiStack	lokistack.loki.grafana.com/v1	在 5.5 中支持
RulerConfig	rulerconfig.loki.grafana/v1beta1	技术预览
AlertingRule	alertingrule.loki.grafana/v1beta1	技术预览
RecordingRule	recordingrule.loki.grafana/v1beta1	技术预览

重要

使用 RulerConfig、AlertingRule 和 RecordingRule 自定义资源定义 (CRD)。只是一个技术预览功能。技术预览功能不受红帽产品服务等级协议（SLA）支持，且功能可能并不完整。红帽不推荐在生产环境中使用它们。这些技术预览功能可以使用户提早试用新的功能，并有机会在开发阶段提供反馈意见。

有关红帽技术预览功能支持范围的更多信息，请参阅技术预览功能支持范围。

8.2. 部署 Lokistack

您可以使用 OpenShift Container Platform web 控制台来部署 LokiStack。

先决条件

Red Hat OpenShift 5.5 及以后的 Logging 子系统
支持的日志存储(AWS S3、Google Cloud Storage、Azure、Swift、Minio、OpenShift Data Foundation)

流程

安装 Loki Operator Operator:
1. 在 OpenShift Container Platform Web 控制台中，点击 Operators → OperatorHub。
2. 从可用的 Operator 列表中选择 Loki Operator，然后点 Install。
3. 在 Installation Mode 下，选择 All namespaces on the cluster。
4. 在 Installed Namespace 下，选择 openshift-operators-redhat。
  您必须指定 openshift-operators-redhat 命名空间。openshift-operators 命名空间可能会包含社区提供的 operator。这些 operator 不被信任，其发布的 metric 可能与 OpenShift Container Platform metric 的名称相同，从而导致冲突。
5. 选择 Enable operator recommended cluster monitoring on this namespace。
  这个选项在 Namespace 对象中设置 openshift.io/cluster-monitoring: "true" 标识。您必须设置这个选项，以确保集群监控提取 openshift-operators-redhat 命名空间。
6. 选择一个批准策略。
  - Automatic 策略允许 Operator Lifecycle Manager（OLM）在有新版本可用时自动更新 Operator。
  - Manual 策略需要拥有适当凭证的用户批准 Operator 更新。
7. 点 Install。
8. 验证您安装了 Loki Operator。访问 Operators → Installed Operators 页面，并查找 Loki Operator。
9. 确定在所有项目中都列出 Loki Operator 的 Status 为 Succeeded。

创建一个 Secret YAML 文件，它使用 access_key_id 和 access_key_secret 字段指定 AWS 凭证和 bucketnames、endpoint 和 region 来定义对象存储位置。例如：

apiVersion: v1
kind: Secret
metadata:
  name: logging-loki-s3
  namespace: openshift-logging
stringData:
  access_key_id: AKIAIOSFODNN7EXAMPLE
  access_key_secret: wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY
  bucketnames: s3-bucket-name
  endpoint: https://s3.eu-central-1.amazonaws.com
  region: eu-central-1

创建 LokiStack 自定义资源(CR)：

apiVersion: loki.grafana.com/v1
kind: LokiStack
metadata:
  name: logging-loki
  namespace: openshift-logging
spec:
  size: 1x.small
  storage:
    schemas:
    - version: v12
      effectiveDate: "2022-06-01"
    secret:
      name: logging-loki-s3
      type: s3
  storageClassName: gp2
  tenants:
    mode: openshift-logging

应用 LokiStack CR：
```
$ oc apply -f logging-loki.yaml
```

创建 ClusterLogging 自定义资源(CR)：

apiVersion: logging.openshift.io/v1
kind: ClusterLogging
metadata:
  name: instance
  namespace: openshift-logging
spec:
  managementState: Managed
  logStore:
    type: lokistack
    lokistack:
      name: logging-loki
  collection:
    type: vector

应用 ClusterLogging CR：
```
$ oc apply -f cr-lokistack.yaml
```
启用 RedHat OpenShift Logging 控制台插件：
1. 在 OpenShift Container Platform web 控制台中，点击 Operators → Installed Operators。
2. 选择 RedHat OpenShift Logging Operator。
3. 在控制台插件下，点 Disabled。
4. 选择 Enable 及 Save。此更改重启 openshift-console pod。
5. pod 重启后，您将收到一个 Web 控制台更新可用的通知，提示您刷新。
6. 刷新 web 控制台后，从左侧主菜单中选择 Observe。日志的新选项可用。

8.3. 将日志转发到 LokiStack

要配置日志转发到 LokiStack 网关，您必须创建一个 ClusterLogging 自定义资源(CR)。

先决条件

在集群中安装了 Red Hat OpenShift 版本 5.5 或更新版本的 Logging 子系统。
Loki Operator 已安装在集群中。

流程

创建 ClusterLogging 自定义资源(CR)：

apiVersion: logging.openshift.io/v1
kind: ClusterLogging
metadata:
  name: instance
  namespace: openshift-logging
spec:
  managementState: Managed
  logStore:
    type: lokistack
    lokistack:
      name: logging-loki
  collection:
    type: vector

8.3.1. Loki 速率限制错误故障排除

如果 Log Forwarder API 将超过速率限制的大量信息转发到 Loki，Loki 会生成速率限制(429)错误。

这些错误可能会在正常操作过程中发生。例如，当将 logging 子系统添加到已具有某些日志的集群中时，logging 子系统会尝试充分利用现有日志条目时可能会出现速率限制错误。在这种情况下，如果添加新日志的速度小于总速率限值，历史数据最终会被处理，并且不要求用户干预即可解决速率限制错误。

如果速率限制错误持续发生，您可以通过修改 LokiStack 自定义资源(CR)来解决此问题。

重要

LokiStack CR 在 Grafana 托管的 Loki 上不可用。本主题不适用于 Grafana 托管的 Loki 服务器。

Conditions

Log Forwarder API 配置为将日志转发到 Loki。

您的系统向 Loki 发送大于 2 MB 的消息块。例如：

"values":[["1630410392689800468","{\"kind\":\"Event\",\"apiVersion\":\
.......
......
......
......
\"received_at\":\"2021-08-31T11:46:32.800278+00:00\",\"version\":\"1.7.4 1.6.0\"}},\"@timestamp\":\"2021-08-31T11:46:32.799692+00:00\",\"viaq_index_name\":\"audit-write\",\"viaq_msg_id\":\"MzFjYjJkZjItNjY0MC00YWU4LWIwMTEtNGNmM2E5ZmViMGU4\",\"log_type\":\"audit\"}"]]}]}

输入 oc logs -n openshift-logging -l component=collector 后，集群中的收集器日志会显示包含以下错误消息之一的行：

429 Too Many Requests Ingestion rate limit exceeded

Vector 错误消息示例

2023-08-25T16:08:49.301780Z  WARN sink{component_kind="sink" component_id=default_loki_infra component_type=loki component_name=default_loki_infra}: vector::sinks::util::retries: Retrying after error. error=Server responded with an error: 429 Too Many Requests internal_log_rate_limit=true

Fluentd 错误消息示例

2023-08-30 14:52:15 +0000 [warn]: [default_loki_infra] failed to flush the buffer. retry_times=2 next_retry_time=2023-08-30 14:52:19 +0000 chunk="604251225bf5378ed1567231a1c03b8b" error_class=Fluent::Plugin::LokiOutput::LogPostError error="429 Too Many Requests Ingestion rate limit exceeded for user infrastructure (limit: 4194304 bytes/sec) while attempting to ingest '4082' lines totaling '7820025' bytes, reduce log volume or contact your Loki administrator to see if the limit can be increased\n"

在接收结束时也会看到这个错误。例如，在 LokiStack ingester pod 中：

Loki ingester 错误消息示例

level=warn ts=2023-08-30T14:57:34.155592243Z caller=grpc_logging.go:43 duration=1.434942ms method=/logproto.Pusher/Push err="rpc error: code = Code(429) desc = entry with timestamp 2023-08-30 14:57:32.012778399 +0000 UTC ignored, reason: 'Per stream rate limit exceeded (limit: 3MB/sec) while attempting to ingest for stream

流程

更新 LokiStack CR 中的 ingestionBurstSize 和 ingestionRate 字段：
```
apiVersion: loki.grafana.com/v1
kind: LokiStack
metadata:
  name: logging-loki
  namespace: openshift-logging
spec:
  limits:
    global:
      ingestion:
        ingestionBurstSize: 16 1
        ingestionRate: 8 2
# ...
```
1
ingestionBurstSize 字段定义每个经销商副本的最大本地速率限制示例大小（以 MB 为单位）。这个值是一个硬限制。将此值设置为至少在单个推送请求中预期的最大日志大小。不允许大于 ingestionBurstSize 值的单个请求。
2
ingestionRate 字段是每秒最大最大样本量的软限制（以 MB 为单位）。如果日志速率超过限制，则会出现速率限制错误，但收集器会重试发送日志。只要总平均值低于限制，系统就会在没有用户干预的情况下解决错误。

8.4. 其它资源

第 9 章查看资源的日志

您可以使用 OpenShift CLI（oc）和 Web 控制台查看各种资源的日志，如构建、部署和 pod。

注意

资源日志是一个默认功能，可提供有限的日志查看功能。为增强日志检索和查看体验，建议您安装 OpenShift Logging。logging 子系统将 OpenShift Container Platform 集群中的所有日志（如节点系统审计日志、应用程序容器日志和基础架构日志）聚合到专用日志存储中。然后，您可以通过 Kibana 接口查询、发现和视觉化您的日志数据。资源日志无法访问 logging 子系统日志存储。

9.1. 查看资源日志

您可以在 OpenShift CLI（oc）和 Web 控制台中查看各种资源的日志。日志从日志的尾部或末尾读取。

先决条件

访问 OpenShift CLI（oc）。

流程 (UI)

在 OpenShift Container Platform 控制台中，导航到 Workloads → Pods，或通过您要调查的资源导航到 pod。
注意
有些资源（如构建）没有直接查询的 pod。在这种情况下，您可以在资源的 Details 页面中找到 Logs 链接。
从下拉菜单中选择一个项目。
点您要调查的 pod 的名称。
点 Logs。

流程 (CLI)

查看特定 pod 的日志：
```
$ oc logs -f <pod_name> -c <container_name>
```
其中：
-f
可选：指定输出是否遵循要写到日志中的内容。
<pod_name>
指定 pod 的名称。
<container_name>
可选：指定容器的名称。当 pod 具有多个容器时，您必须指定容器名称。
例如：
```
$ oc logs ruby-58cd97df55-mww7r
```
```
$ oc logs -f ruby-57f7f4855b-znl92 -c ruby
```
输出的日志文件内容。
查看特定资源的日志：
```
$ oc logs <object_type>/<resource_name> 1
```
1
指定资源类型和名称。
例如：
```
$ oc logs deployment/ruby
```
输出的日志文件内容。

第 10 章使用 Kibana 查看集群日志

logging 子系统包含用于可视化收集的日志数据的 Web 控制台。目前，OpenShift Container Platform 部署 Kibana 控制台以进行可视化。

通过日志可视化工具，您可以使用以下数据进行以下操作：

使用 Discover 标签页搜索并浏览数据。
使用 Visualize 标签页对数据进行图表显示。
使用 Dashboard 标签页创建并查看自定义仪表板。

使用并配置 Kibana 界面的内容超出了本文档的范围。相关信息，请参阅 Kibana 文档。

注意

默认情况下，审计日志不会存储在 OpenShift Container Platform 内部 Elasticsearch 实例中。要在 Kibana 中查看审计日志，您必须使用 Log Forwarding API 配置使用审计日志的 default 输出的管道。

10.1. 定义 Kibana 索引模式

索引模式定义了您要视觉化的 Elasticsearch 索引。要在 Kibana 中探索和视觉化数据，您必须创建索引模式。

先决条件

用户必须具有 cluster-admin 角色、cluster-reader 角色或这两个角色，才能在 Kibana 中查看 infra 和 audit 索引。默认 kubeadmin 用户具有查看这些索引的权限。
如果可以查看 default、kube- 和 openshift- 项目中的 pod 和日志，则应该可以访问这些索引。您可以使用以下命令检查当前用户是否有适当的权限：
```
$ oc auth can-i get pods/log -n <project>
```
输出示例
```
yes
```
注意
默认情况下，审计日志不会存储在 OpenShift Container Platform 内部 Elasticsearch 实例中。要在 Kibana 中查看审计日志，您必须使用 Log Forward API 配置使用审计日志的 default 输出的管道。
在创建索引模式前，Elasticsearch 文档必须被索引。这会自动完成，但在一个新的或更新的集群中可能需要几分钟。

流程

在 Kibana 中定义索引模式并创建视觉化：

在 OpenShift Container Platform 控制台中点 Application Launcher 并选择 Logging。
点 Management → Index Patterns → Create index pattern 创建 Kibana 索引模式:
- 首次登录 Kibana 时，每个用户必须手动创建索引模式才能查看其项目的日志。用户必须创建一个名为 app 的索引模式，并使用 @timestamp 时间字段查看其容器日志。
- 每个 admin 用户在首次登录 Kibana 时，必须使用 @timestamp 时间字段为 app、infra 和 audit 索引创建索引模式。
从新的索引模式创建 Kibana 视觉化。

10.2. 在 Kibana 中查看集群日志

您可以在 Kibana web 控制台中查看集群日志。在 Kibana 中查看和视觉化您的数据的方法，它们超出了本文档的范围。如需更多信息，请参阅 Kibana 文档。

先决条件

必须安装 Red Hat OpenShift Logging 和 Elasticsearch Operator。
Kibana 索引模式必须存在。
用户必须具有 cluster-admin 角色、cluster-reader 角色或这两个角色，才能在 Kibana 中查看 infra 和 audit 索引。默认 kubeadmin 用户具有查看这些索引的权限。
如果可以查看 default、kube- 和 openshift- 项目中的 pod 和日志，则应该可以访问这些索引。您可以使用以下命令检查当前用户是否有适当的权限：
```
$ oc auth can-i get pods/log -n <project>
```
输出示例
```
yes
```
注意
默认情况下，审计日志不会存储在 OpenShift Container Platform 内部 Elasticsearch 实例中。要在 Kibana 中查看审计日志，您必须使用 Log Forward API 配置使用审计日志的 default 输出的管道。

流程

在 Kibana 中查看日志：

在 OpenShift Container Platform 控制台中点 Application Launcher 并选择 Logging。
使用用来登录到 OpenShift Container Platform 控制台的相同凭证进行登录。
Kibana 界面将出现。
在 Kibana 中，点 Discover。
从左上角的下拉菜单中选择您创建的索引模式： app、audit 或 infra。
日志数据显示为时间戳文档。
展开一个时间戳的文档。

点 JSON 选项卡显示该文件的日志条目。

例 10.1. Kibana 中的基础架构日志条目示例

{
  "_index": "infra-000001",
  "_type": "_doc",
  "_id": "YmJmYTBlNDkZTRmLTliMGQtMjE3NmFiOGUyOWM3",
  "_version": 1,
  "_score": null,
  "_source": {
    "docker": {
      "container_id": "f85fa55bbef7bb783f041066be1e7c267a6b88c4603dfce213e32c1"
    },
    "kubernetes": {
      "container_name": "registry-server",
      "namespace_name": "openshift-marketplace",
      "pod_name": "redhat-marketplace-n64gc",
      "container_image": "registry.redhat.io/redhat/redhat-marketplace-index:v4.7",
      "container_image_id": "registry.redhat.io/redhat/redhat-marketplace-index@sha256:65fc0c45aabb95809e376feb065771ecda9e5e59cc8b3024c4545c168f",
      "pod_id": "8f594ea2-c866-4b5c-a1c8-a50756704b2a",
      "host": "ip-10-0-182-28.us-east-2.compute.internal",
      "master_url": "https://kubernetes.default.svc",
      "namespace_id": "3abab127-7669-4eb3-b9ef-44c04ad68d38",
      "namespace_labels": {
        "openshift_io/cluster-monitoring": "true"
      },
      "flat_labels": [
        "catalogsource_operators_coreos_com/update=redhat-marketplace"
      ]
    },
    "message": "time=\"2020-09-23T20:47:03Z\" level=info msg=\"serving registry\" database=/database/index.db port=50051",
    "level": "unknown",
    "hostname": "ip-10-0-182-28.internal",
    "pipeline_metadata": {
      "collector": {
        "ipaddr4": "10.0.182.28",
        "inputname": "fluent-plugin-systemd",
        "name": "fluentd",
        "received_at": "2020-09-23T20:47:15.007583+00:00",
        "version": "1.7.4 1.6.0"
      }
    },
    "@timestamp": "2020-09-23T20:47:03.422465+00:00",
    "viaq_msg_id": "YmJmYTBlNDktMDMGQtMjE3NmFiOGUyOWM3",
    "openshift": {
      "labels": {
        "logging": "infra"
      }
    }
  },
  "fields": {
    "@timestamp": [
      "2020-09-23T20:47:03.422Z"
    ],
    "pipeline_metadata.collector.received_at": [
      "2020-09-23T20:47:15.007Z"
    ]
  },
  "sort": [
    1600894023422
  ]
}

第 11 章将日志转发到外部第三方日志记录系统

默认情况下，日志记录子系统会将容器和基础架构日志发送到 ClusterLogging 自定义资源中定义的默认内部日志存储。但是，它不会将审计日志发送到内部存储，因为它不提供安全存储。如果此默认配置满足您的需要，则不需要配置 Cluster Log Forwarder。

要将日志发送到其他日志聚合器，请使用 OpenShift Container Platform Cluster Log Forwarder。通过这个 API，您可以将容器、基础架构和审计日志发送到集群内部或外部的特定端点。另外，您可以向不同的系统发送不同类型的日志，这样不同个人就可以访问不同系统。您还可以根据机构的要求，启用传输层安全 (TLS) 支持来安全地发送日志。

注意

要将审计日志发送到默认的内部 Elasticsearch 日志存储，请使用 Cluster Log Forwarder，如将审计日志转发到日志存储中所述。

当外部转发日志时，logging 子系统会创建或修改 Fluentd 配置映射来使用所需的协议发送日志。您需要在外部日志聚合器上配置协议。

11.1. 关于将日志转发到第三方系统

要将日志发送到 OpenShift Container Platform 集群内部和外部的特定端点，您可以在 ClusterLogForwarder 自定义资源(CR)中指定输出和管道的组合。您还可以使用输入将与特定项目关联的应用程序日志转发到端点。身份验证由 Kubernetes Secret 对象提供。

output

您定义的日志数据的目的地，或者您希望发送日志的位置。输出可以是以下类型之一：

elasticsearch.一个外部 Elasticsearch 实例。elasticsearch 输出可以使用 TLS 连接。
fluentdForward。一个支持 Fluentd 的外部日志聚合解决方案。这个选项使用 Fluentd 转发协议。fluentForward 输出可以使用 TCP 或 TLS 连接，并通过在 secret 中提供一个 shared_key 字段来支持共享密钥身份验证。共享密钥身份验证可在使用或不使用 TLS 的情况下使用。
syslog。支持 syslog RFC3164 或 RFC5424 协议的外部日志聚合解决方案。syslog 输出可以使用 UDP、TCP 或 TLS 连接。
cloudwatch。Amazon CloudWatch，一种由 Amazon Web Services (AWS) 托管的监控和日志存储服务。
loki。Loki，一个可横向扩展的、高可用性、多租户日志聚合系统。
kafka.Kafka 代理。kafka 输出可以使用 TCP 或 TLS 连接。
default.内部 OpenShift Container Platform Elasticsearch 实例。您不需要配置默认输出。如果配置 default 输出，您会收到出错信息，因为 Red Hat OpenShift Logging Operator 保留了 default 输出。

pipeline

定义从一个日志类型到一个或多个输出的简单路由，或定义您要发送的日志。日志类型是以下之一：

application.由集群中运行的用户应用程序生成的容器日志（基础架构容器应用程序除外）。
infrastructure.在 openshift*、kube* 或 default 项目中运行的容器日志，以及来源于节点文件系统的 journal 日志。
audit.由节点审计系统、auditd、Kubernetes API 服务器、OpenShift API 服务器和 OVN 网络生成的审计日志。

您可以使用管道中的 key:value 对为出站日志消息添加标签。例如,您可以在转发给其他数据中心的消息中添加一个标签,或者根据类型为日志添加标签。添加到对象的标签也会通过日志消息转发。

输入

将与特定项目关联的应用程序日志转发到管道。

在管道中，您要定义使用 inputRef 参数转发哪些日志类型，以及将日志转发到使用 outputRef 参数的位置。

Secret

包含机密数据的 key:value 映射，如用户凭据。

注意以下几点：

如果 ClusterLogForwarder CR 对象存在，日志不会转发到默认的 Elasticsearch 实例，除非有带有 default 输出的管道。
默认情况下，logging 子系统将容器和基础架构日志发送到 ClusterLogging 自定义资源中定义的默认内部 Elasticsearch 日志存储。但是，它不会将审计日志发送到内部存储，因为它不提供安全存储。如果此默认配置满足您的需要，则不需要配置 Log Forwarding API。
如果您没有为日志类型定义管道，则将丢弃未定义类型的日志。例如，如果您为 application 和 audit 类型指定管道，但没有为 infrastructure 类型指定管道，则 infrastructure 日志会丢弃。
您可以使用 ClusterLogForwarder 自定义资源（CR）中的多种输出类型将日志发送到支持不同协议的服务器。
内部 OpenShift Container Platform Elasticsearch 实例不会为审计日志提供安全存储。您需要自己确保转发审计日志的系统符合您所在机构及政府的相关要求，并具有适当的安全性。logging 子系统不遵循这些规范。

以下示例将审计日志转发到安全的外部 Elasticsearch 实例，基础架构日志发送到不安全的外部 Elasticsearch 实例，应用程序日志发送到 Kafka 代理，以及 my-apps-logs 项目中的应用程序日志发送到内部 Elasticsearch 实例。

日志转发输出和管道示例

apiVersion: "logging.openshift.io/v1"
kind: ClusterLogForwarder
metadata:
  name: instance 1
  namespace: openshift-logging 2
spec:
  outputs:
   - name: elasticsearch-secure 3
     type: "elasticsearch"
     url: https://elasticsearch.secure.com:9200
     secret:
        name: elasticsearch
   - name: elasticsearch-insecure 4
     type: "elasticsearch"
     url: http://elasticsearch.insecure.com:9200
   - name: kafka-app 5
     type: "kafka"
     url: tls://kafka.secure.com:9093/app-topic
  inputs: 6
   - name: my-app-logs
     application:
        namespaces:
        - my-project
  pipelines:
   - name: audit-logs 7
     inputRefs:
      - audit
     outputRefs:
      - elasticsearch-secure
      - default
     parse: json 8
     labels:
       secure: "true" 9
       datacenter: "east"
   - name: infrastructure-logs 10
     inputRefs:
      - infrastructure
     outputRefs:
      - elasticsearch-insecure
     labels:
       datacenter: "west"
   - name: my-app 11
     inputRefs:
      - my-app-logs
     outputRefs:
      - default
   - inputRefs: 12
      - application
     outputRefs:
      - kafka-app
     labels:
       datacenter: "south"

1

ClusterLogForwarder CR 的名称必须是 instance。

2

ClusterLogForwarder CR 的命名空间必须是 openshift-logging。

3

使用带有安全 URL 的 secret 来配置安全 Elasticsearch 输出。

描述输出的名称。
输出类型： elasticsearch。
Elasticsearch 实例的安全 URL 和端口作为有效的绝对 URL，包括前缀。
用于 TLS 通信的端点所需的 secret。secret 必须存在于 openshift-logging 项目中。

4

配置不安全的 Elasticsearch 输出：

描述输出的名称。
输出类型： elasticsearch。
Elasticsearch 实例的不安全 URL 和端口作为有效的绝对 URL，包括前缀。

5

使用客户端验证的 TLS 通信通过安全 URL 配置 Kafka 输出

描述输出的名称。
输出的类型： kafka。
将 Kafka 代理的 URL 和端口指定为一个有效的绝对 URL，包括前缀。

6

用于过滤 my-project 命名空间中的应用程序日志的输入配置。

7

用于将审计日志发送到安全的外部 Elasticsearch 实例的管道配置：

描述管道的名称。
inputRefs 是日志类型，在这个示例中是 audit。
outputRefs 是输出使用的名称，在本例中，elasticsearch-secure 可以转发到安全的 Elasticsearch 实例，default 转发到内部 Elasticsearch 实例。
可选：添加到日志的标签。

8

可选：指定是否转发结构化 JSON 日志条目作为 structured 项中的 JSON 对象。日志条目必须包含有效的结构化 JSON；否则，OpenShift Logging 会删除 structured 字段，并将日志条目发送到默认索引 app-00000x。

9

可选：字符串。要添加到日志中的一个或多个标签。对值加引号（如 "true"），以便它们被识别为字符串值，而不是作为布尔值。

10

管道配置，将基础架构日志发送到不安全的外部 Elasticsearch 实例。

11

管道配置，用于将日志从 my-project 项目发送到内部 Elasticsearch 实例。

描述管道的名称。
inputRefs 是一个特定的输入： my-app-logs。
outputRefs 是 default。
可选：字符串。要添加到日志中的一个或多个标签。

12

将日志发送到 Kafka 代理的管道配置，不带有管道名称：

inputRefs 是日志类型，在这个示例中是 application。
outputRefs 是要使用的输出名称。
可选：字符串。要添加到日志中的一个或多个标签。

当外部日志聚合器不可用时，Fluentd 日志处理

如果外部日志记录聚合器不可用且无法接收日志，Fluentd 会继续收集日志并将其存储在缓冲中。当日志聚合器可用时，日志转发会恢复，包括缓冲的日志。如果缓冲区已满，Fluentd 会停止收集日志。OpenShift Container Platform 轮转日志并删除日志。您无法调整缓冲区大小，或者将持久性卷声明（PVC）添加到 Fluentd 守护进程集或 Pod 中。

支持的授权密钥

这里提供了常见的密钥类型。某些输出类型支持额外的专用密钥，记录在特定于输出的配置字段中。所有 secret 密钥都是可选的。通过设置相关密钥来启用您想要的安全功能。您需要创建并维护外部目的地可能需要的额外配置，如密钥和 secret 、服务帐户、端口打开或全局代理服务器配置。Open Shift Logging 不会尝试验证授权组合间的不匹配。

传输层安全性(TLS)

使用没有 Secret 的 TLS URL（'http://…' 或 'ssl://…'）启用基本的 TLS 服务器端身份验证。可通过包含 Secret 并设置以下可选字段来启用额外的 TLS 功能：

tls.crt: （字符串）包含客户端证书的文件名。启用 mutual 身份验证。需要 tls.key。
tls.key ：（字符串）包含私钥的文件名，用于解锁客户端证书。需要 tls.crt。
密码短语 ：（字符串）对编码的 TLS 私钥进行解码。需要 tls.key。
ca-bundle.crt: （字符串）用于服务器身份验证的客户 CA 的文件名。

用户名和密码

username ：（字符串）身份验证用户名。需要 password。
password ：（字符串）身份验证密码。需要 username。

简单身份验证安全层(SASL)

sasl.enable （布尔值）明确指定启用或禁用 SASL。如果缺失，则设置了任何其他 sasl. 密钥时自动启用 SASL。
sasl.mechanisms ：(array)允许的 SASL 机制名称列表。如果缺少或为空，则使用系统默认值。
sasl.allow-insecure ：（布尔值）允许发送明文密码的机制。默认为false。

11.1.1. 创建 Secret

您可以使用以下命令在包含您的证书和密钥文件的目录中创建 secret：

$ oc create secret generic -n openshift-logging <my-secret> \
 --from-file=tls.key=<your_key_file>
 --from-file=tls.crt=<your_crt_file>
 --from-file=ca-bundle.crt=<your_bundle_file>
 --from-literal=username=<your_username>
 --from-literal=password=<your_password>

注意

建议使用通用或不透明 secret 来获得最佳结果。

11.2. 将同一 pod 中的容器的 JSON 日志转发到单独的索引

您可以将来自同一 pod 的不同容器的结构化日志转发到不同的索引。要使用此功能，您必须使用多容器支持配置管道并注解 pod。日志被写入带有 app- 前缀的索引。建议将 Elasticsearch 配置为使用别名来容纳此目的。

重要

先决条件

Logging subsystem for Red Hat OpenShift: 5.5

流程

创建或编辑定义 ClusterLogForwarder CR 对象的 YAML 文件：

apiVersion: "logging.openshift.io/v1"
kind: ClusterLogForwarder
metadata:
  name: instance
  namespace: openshift-logging
spec:
  outputDefaults:
    elasticsearch:
      enableStructuredContainerLogs: true 1
  pipelines:
  - inputRefs:
    - application
    name: application-logs
    outputRefs:
    - default
    parse: json

1: 启用多容器输出。

创建或编辑定义 Pod CR 对象的 YAML 文件：

    apiVersion: v1
    kind: Pod
    metadata:
      annotations:
        containerType.logging.openshift.io/heavy: heavy 1
        containerType.logging.openshift.io/low: low
    spec:
      containers:
      - name: heavy 2
        image: heavyimage
      - name: low
        image: lowimage

1: 格式：containerType.logging.openshift.io/<container-name>: <index>
2: 注解名称必须与容器名称匹配

警告

此配置可能会显著增加集群中的分片数量。

其它资源

Kubernetes 注解