This documentation is for a release that is no longer maintained
See documentation for the latest supported version 3 or the latest supported version 4.Metering
在 OpenShift Container Platform 4.2 中配置和使用 Metering
摘要
第 1 章 关于 Metering 复制链接链接已复制到粘贴板!
1.1. Metering 概述 复制链接链接已复制到粘贴板!
Metering 是一个通用数据分析工具,您可使用该工具编写报告,以处理来自不同数据源的数据。作为集群管理员,您可使用 Metering 来分析集群中的情况。您可以自行编写报告,也可以使用预定义的 SQL 查询来定义如何处理来自现有不同数据源的数据。
Metering 侧重于处理集群内的指标数据,使用 Prometheus 作为默认数据源,支持 Metering 用户针对 Pod、命名空间和 Kubernetes 的其他大部分资源进行报告。
您可以在 OpenShift Container Platform 4.x 集群及更高版本上安装 metering。
1.1.1. Metering 资源 复制链接链接已复制到粘贴板!
Metering 具有很多资源,可用于管理 Metering 的部署与安装以及 Metering 提供的报告功能。
Metering 使用以下自定义资源定义 (CRD) 来管理;
| MeteringConfig | 为部署配置 metering 堆栈。包含用于控制 metering 堆栈各个组件的自定义和配置选项。 |
| Reports | 控制要使用的查询、查询运行时间、运行频率以及查询结果的存储位置。 |
| ReportQueries | 包含用于对 ReportDataSources 中所含数据进行分析的 SQL 查询。 |
| ReportDataSources | 控制 ReportQueries 和 Reports 可用数据。支持配置 metering 中使用的不同数据库的访问权限。 |
第 2 章 安装 Metering 复制链接链接已复制到粘贴板!
在将 metering 安装到集群中之前,请查看以下部分。
开始安装 Metering 前,请先通过 OperatorHub 安装 Metering Operator。然后再通过创建一个 CustomResource 来配置 Metering 实例,这里被称为 MeteringConfig。在安装 Metering Operator 时会创建一个默认的 MeteringConfig,您可使用文档中的示例对其进行修改。创建好 MeteringConfig 后,再安装 metering 堆栈。最后,验证您的安装。
2.1. 先决条件 复制链接链接已复制到粘贴板!
Metering 需包含以下组件:
- 用于动态卷置备的 StorageClass。Metering 支持多种不同存储解决方案。
- 4GB 内存和 4 个 CPU 内核可用集群容量,至少要有一个具有 2 个 CPU 内核和 2GB 内存容量的节点。
由 metering 安装的单个最大 Pod 至少需要 2GB 内存和 2 个 CPU 内核的资源。
- 内存和 CPU 消耗通常较低,但在运行报告或为较大集群收集数据时会激增。
2.2. 安装 Metering Operator 复制链接链接已复制到粘贴板!
要安装 Metering Operator,首先创建 openshift-metering 命名空间,然后再通过 OperatorHub 安装 Metering Operator。
流程
- 在 OpenShift Container Platform Web 控制台中,点 Administration → Namespaces → Create Namespace。
-
将名称设置为
openshift-metering。不支持其他命名空间。对该命名空间添加openshift.io/cluster-monitoring=true标签,并点 Create。 -
接下来,点 Operators → OperatorHub,并过滤
metering以查找 Metering Operator。 - 点 Metering 卡,查看软件包说明,然后点 Install。
-
在 Create Operator Subscription 屏幕上,选择上面创建的
openshift-metering命名空间。指定您的更新渠道和批准策略,然后点 Subscribe 安装 Metering。 - 当 Metering 安装完成后,Installed Operators 页中的 Status 显示为 InstallSucceeded。点第一列中的 Operator 名称,查看 Operator Details 页面。
可能需要几分钟时间才会显示 Metering Operator。
在 Operator Details 页中,还可创建其他与 metering 相关的资源。要完成安装,请创建一个 MeteringConfig 资源来配置 metering 并安装 metering 堆栈的组件。
2.3. 安装 metering 堆栈 复制链接链接已复制到粘贴板!
将 Metering Operator 添加至集群后,您可通过安装 metering 堆栈来安装 metering 组件。
先决条件
- 查看配置选项
创建 MeteringConfig 资源。您可通过以下流程生成默认 MeteringConfig,然后根据您安装的具体情况,使用文档中的示例来修改默认文件。查看以下主题以创建 MeteringConfig 资源:
- 有关配置选项,请查看关于配置 metering。
- 您至少需要配置持久性存储和配置 Hive MetaStore。
openshift-metering 命名空间中只能有一个 MeteringConfig 资源。不支持任何其它配置。
流程
-
在 Web 控制台中,确保进入
openshift-metering项目中的 Metering Operator 的 Operator Details 页面。您可通过点 Operators → Installed Operators,然后选择 Metering Operator 进入该页面。 在 Provided APIs 项下,点 Metering Configuration 卡上的 Create Instance。此操作将打开 YAML 编辑器,其中有一个默认 MeteringConfig 文件,您可通过该文件定义您的配置。
注意如需示例配置文件和所有支持的配置选项,请查看配置 metering 文档。
- 在 YAML 编辑器中输入 MeteringConfig 并点 Create。
该 MeteringConfig 资源即会开始为您的 metering 堆栈创建必要资源。您现在可继续验证您的安装。
2.4. 验证安装 复制链接链接已复制到粘贴板!
要验证 metering 安装,可以检查是否所有必需的 Pod 都已被创建,并检查您的报告数据源是否开始导入数据。
流程
在 metering 命名空间中导航至 Workloads → Pods,验证是否已创建 Pod。安装 metering 堆栈后可能需要几分钟时间。
您也可使用
ocCLI 执行相同的检查:Copy to Clipboard Copied! Toggle word wrap Toggle overflow 继续检查您的 Pod,直至全部显示
Ready。这可能需要几分钟时间。很多 Pod 在就绪前需要依靠其他组件才能发挥作用。如果其他 Pod 需要花费很长时间才能启动,则一些 Pod 可能会重启。这是在安装过程中预期会出现的正常情况。使用
ocCLI,相同检查会显示类似于以下内容的输出:Copy to Clipboard Copied! Toggle word wrap Toggle overflow 接下来,使用
ocCLI 来验证 ReportDataSources 是否开始导入数据,这通过EARLIEST METRIC列中的有效时间戳指示(这可能需要几分钟时间)。我们会过滤掉未导入数据的带有“-raw”后缀的 ReportDataSources:Copy to Clipboard Copied! Toggle word wrap Toggle overflow
当所有 Pod 就绪,且验证了数据已可以被导入后,您就可以开始使用 metering 来收集数据并对集群进行报告。
2.5. 其他资源 复制链接链接已复制到粘贴板!
- 有关配置步骤和可用存储平台的更多信息,请参阅配置持久性存储。
- 有关配置 Hive 的步骤,请参阅配置 Hive Metastore。
第 3 章 配置 metering 复制链接链接已复制到粘贴板!
3.1. 关于配置 metering 复制链接链接已复制到粘贴板!
名为 MeteringConfig 的 CustomResource 指定了 metering 安装的所有配置详情。首次安装 metering 堆栈时,会生成一个默认 MeteringConfig。使用文档中的示例来修订此默认文件。请记住以下关键点:
- 您至少需要配置持久性存储和配置 Hive MetaStore。
- 大部分默认配置设置都可以正常工作,但对于大型部署或高度自定义的部署来说还应仔细检查所有配置选项。
- 部分配置选项安装后便无法修改。
对于安装后可修改的配置选项,请在 MeteringConfig 中进行更改并重新应用该文件。
3.2. 通用配置选项 复制链接链接已复制到粘贴板!
3.2.1. 资源请求和限值 复制链接链接已复制到粘贴板!
您可针对 Pod 和卷调整 CPU、内存或存储资源请求和/或限值。以下 default-resource-limits.yaml 提供了一个针对各个组件设置资源请求和限值的示例。
3.2.2. 节点选择器 复制链接链接已复制到粘贴板!
如果要在特定节点集上运行 metering 组件,则可在每个组件上设置 nodeSelectors,以控制各个 metering 组件的调度位置。以下 node-selectors.yaml 文件提供了一个针对各个组件设置节点选择器的示例。
3.3. 配置持久性存储 复制链接链接已复制到粘贴板!
metering 需要持久性存储来长久保留通过 metering-operator 收集的数据并存储报告结果。它支持多种存储系统和存储格式。选择您的存储系统并修改示例配置文件,以便为您的 metering 安装配置持久性存储。
3.3.1. 将数据存储至 Amazon S3 中 复制链接链接已复制到粘贴板!
Metering 可以使用现有的 Amazon S3 存储桶,或为存储创建存储桶。
Metering 不会管理或删除任何 S3 存储桶数据。卸载 metering 时,必须手动清理用于存储 metering 数据的 S3 存储桶。
要将 Amazon S3 用于存储,请编辑以下示例 s3-storage.yaml 文件中的 spec.storage 部分。
使用以下示例 secret 作为模板。
Aws-access-key-id 值和 aws-secret-access-key 值必须采用 base64 编码。
您可使用以下命令创建 secret。
该命令会对您的 aws-access-key-id 值和 aws-secret-access-key 值自动进行 base64 编码。
oc create secret -n openshift-metering generic your-aws-secret --from-literal=aws-access-key-id=your-access-key --from-literal=aws-secret-access-key=your-secret-key
oc create secret -n openshift-metering generic your-aws-secret --from-literal=aws-access-key-id=your-access-key --from-literal=aws-secret-access-key=your-secret-key
aws-access-key-id 和 aws-secret-access-key 凭证必须具有存储桶的读取和写入权限。有关授予所需权限的 IAM 策略的示例,请参阅以下 aws/read-write.json 文件。
如果将 spec.storage.hive.s3.createBucket 设置为 true 或取消设置,则需使用以下 aws/read-write-create.json 文件,其中包含创建和删除存储桶的权限。
3.3.2. 将数据存储至 S3 兼容存储中 复制链接链接已复制到粘贴板!
要使用 S3 兼容存储,如 Noobaa,请编辑以下示例 s3-compatible-storage.yaml 文件中的 spec.storage 部分。
使用以下示例 secret 作为模板。
3.3.3. 将数据存储至 Microsoft Azure 中 复制链接链接已复制到粘贴板!
要将数据存储至 Azure blob 存储中,必须使用已有容器。编辑以下示例 azure-blob-storage.yaml 文件中的 spec.storage 部分。
使用以下示例 secret 作为模板。
您可使用以下命令创建 secret。
oc create secret -n openshift-metering generic your-azure-secret --from-literal=azure-storage-account-name=your-storage-account-name --from-literal=azure-secret-access-key-your-secret-key
oc create secret -n openshift-metering generic your-azure-secret --from-literal=azure-storage-account-name=your-storage-account-name --from-literal=azure-secret-access-key-your-secret-key
3.3.4. 将数据存储至 Google Cloud Storage 中 复制链接链接已复制到粘贴板!
要将数据存储至 Google Cloud Storage 中,必须使用已有存储桶。编辑以下示例 gcs-storage.yaml 文件中的 spec.storage 部分。
使用以下示例 secret 作为模板。
您可使用以下命令创建 secret。
oc create secret -n openshift-metering generic your-gcs-secret --from-file gcs-service-account.json=/path/to/your/service-account-key.json
oc create secret -n openshift-metering generic your-gcs-secret --from-file gcs-service-account.json=/path/to/your/service-account-key.json
3.4. 配置 Hive metastore 复制链接链接已复制到粘贴板!
Hive metastore 负责存储所有在 Presto 和 Hive 中创建的数据库表的元数据。metastore 默认会将这些信息存储在附加到 Pod 上的 PersistentVolume 中的本地嵌入式 Derby 数据库中。
通常,Hive metastore 的默认配置适用于小型集群,但用户可能希望通过使用专用 SQL 数据库存储 Hive metastore 数据来提高性能或从集群中移出存储要求。
3.4.1. 配置 PersistentVolume 复制链接链接已复制到粘贴板!
Hive 默认需要一个 PersistentVolume 才可运行。
hive-metastore-db-data 为默认需要的主 PersistentVolumeClaim (PVC)。Hive metastore 使用该 PVC 存储与表相关的元数据,如表名称、列和位置。处理查询时,Presto 和 Hive 服务器可使用 Hive metastore 来查找表元数据。如果使用 MySQL 或 PostgreSQL 作为 Hive metastore 的数据库,则不需要这个要求。
为了进行安装,Hive metastore 要求通过一个 StoreClass 启用动态卷置备功能,一个有正确容量的持久性卷需要预先被手动创建,或使用已存在的 MySQL 或 PostgreSQL 数据库。
3.4.1.1. 为 Hive metastore 配置存储类 复制链接链接已复制到粘贴板!
要为 hive-metastore-db-data PVC 配置和指定 StorageClass,请在 MeteringConfig 中指定 StorageClass。以下 metastore-storage.yaml 文件包含 StorageClass 部分的示例。
- 1
- 取消此行的注释,并将
null替换为要使用的 StorageClass 名称。使用null值会使 metering 使用集群的默认 StorageClass。
3.4.1.2. 配置 Hive Metastore 的卷大小 复制链接链接已复制到粘贴板!
使用以下 MetaStore-storage.yaml 文件作为模板。
- 1
- 将
size值替换为您所需容量。示例文件显示“5Gi”。
3.4.2. 对 Hive metastore 使用 MySQL 或 PostgreSQL 复制链接链接已复制到粘贴板!
默认安装的 metering 会把 Hive 配置为使用名为 Derby 的嵌入式 Java 数据库。该配置不适用于较大环境,它可以被替换为使用 MySQL 或 PostgreSQL 数据库。如果您的部署需要 Hive 使用 MySQL 或 PostgreSQL 数据库,则请使用以下配置示例文件。
有 4 个配置选项可用于控制 Hive metastore 所用数据库: url、driver、username 和 password。
使用以下示例配置文件配置 Hive 使用 MySQL 数据库:
您可使用 spec.hive.config.url 来传递其他 JDBC 参数。更多详情请参阅 MySQL Connector/J 文档。
使用以下示例配置文件配置 Hive 使用 PostgreSQL 数据库:
您可使用 URL 来传递其他 JDBC 参数。更多详情请参阅 PostgreSQL JDBC 驱动程序文档。
3.5. 配置 reporting-operator 复制链接链接已复制到粘贴板!
reporting-operator 负责从 Prometheus 中收集数据,存储指标数据至 Presto 中,对 Presto 运行报告查询,并通过 HTTP API 显示查询结果。配置 Operator 主要通过 MeteringConfig 文件进行。
3.5.1. Prometheus 连接 复制链接链接已复制到粘贴板!
在 OpenShift Container Platform 上安装 metering 时,使用 https://prometheus-k8s.openshift-monitoring.svc:9091/ 访问 Prometheus。
为保护与 Prometheus 的连接,默认 metering 安装使用 OpenShift Container Platform 的 CA。如果您的 Prometheus 实例使用了不同的 CA,则可通过 ConfigMap 来添加该 CA。请参见以下示例。
另外,要使系统的 CA 可以支持公共的证书,请将 ServiceAccountCA 和 configMap.enabled 设置为 false。
此外,还可将 reporting-operator 配置为使用一个指定的 token 令牌搭配 Prometheus 进行身份验证。请参见以下示例。
3.5.2. 公开 reporting API 复制链接链接已复制到粘贴板!
在 OpenShift Container Platform 中,默认 metering 安装会自动公开一个路由,以提供报告 API(reporting API)。它提供以下功能:
- 自动 DNS
- 基于集群 CA 的自动 TLS
此外,默认安装还支持利用 OpenShift 服务来提供证书,以通过 TLS 保护报告 API。OpenShift Oauth 代理被部署为 reporting-operator 的 side-car 容器,通过身份验证来保护报告 API。
3.5.2.1. 使用 OpenShift 身份验证 复制链接链接已复制到粘贴板!
报告 API 默认通过 TLS 和身份验证进行保护。可通过配置 reporting-operator 以部署包含 reporting-operator 容器和运行 OpenShift auth-proxy 的 sidecar 容器的 Pod 来实现这一目的。
要访问报告 API,Metering Operator 会公开一个路由。路由安装好后,即可运行以下命令获取该路由的主机名。
METERING_ROUTE_HOSTNAME=$(oc -n openshift-metering get routes metering -o json | jq -r '.status.ingress[].host')
METERING_ROUTE_HOSTNAME=$(oc -n openshift-metering get routes metering -o json | jq -r '.status.ingress[].host')
下一步,设置身份验证,可使用服务帐户令牌验证,也可通过用户名/密码进行基础验证。
3.5.2.1.1. 使用服务帐户令牌进行身份验证 复制链接链接已复制到粘贴板!
要使用此法,您需要在报告 Operator 的服务账户中使用令牌,并将 bearer 令牌传输至以下命令中的身份验证标头中:
TOKEN=$(oc -n openshift-metering serviceaccounts get-token reporting-operator) curl -H "Authorization: Bearer $TOKEN" -k "https://$METERING_ROUTE_HOSTNAME/api/v1/reports/get?name=[Report Name]&namespace=openshift-metering&format=[Format]"
TOKEN=$(oc -n openshift-metering serviceaccounts get-token reporting-operator)
curl -H "Authorization: Bearer $TOKEN" -k "https://$METERING_ROUTE_HOSTNAME/api/v1/reports/get?name=[Report Name]&namespace=openshift-metering&format=[Format]"
务必要替换上面 URL 中的 name=[Report Name] 和 format=[Format] 参数。format 参数可为 json 、csv 或 tabular。
3.5.2.1.2. 使用用户名和密码进行身份验证 复制链接链接已复制到粘贴板!
我们可使用用户名和密码组合进行基础身份验证,用户名和密码已在 htpasswd 文件的内容中指定。在默认情况下,会创建一个包括空 htpasswd 数据的 secret。您可通过配置 reporting-operator.spec.authProxy.htpasswd.data 和 reporting-operator.spec.authProxy.htpasswd.createSecret 键来使用此法。
在 MeteringConfig 中指定了以上内容后,即可运行以下命令:
curl -u testuser:password123 -k "https://$METERING_ROUTE_HOSTNAME/api/v1/reports/get?name=[Report Name]&namespace=openshift-metering&format=[Format]"
curl -u testuser:password123 -k "https://$METERING_ROUTE_HOSTNAME/api/v1/reports/get?name=[Report Name]&namespace=openshift-metering&format=[Format]"
务必将 testuser:password123 替换为有效的用户名和密码组合。
3.5.2.2. 手动配置身份验证 复制链接链接已复制到粘贴板!
要手动配置身份验证,或在 report-operator 中禁用 OAuth,必须在 MeteringConfig 中设置 spec.tls.enabled: false。
该设置同时还禁用 report-operator、presto 和 hive 之间的所有 TLS/身份验证。您需要自行手动配置这些资源。
身份验证可通过配置以下选项来启用。启用身份验证会将 reporting-operator Pod 配置为将 OpenShift auth-proxy 作为 Pod 中的 sidecar 来运行。这样做会调整端口,以便 report-operator API 不会被直接公开,而是通过 auth-proxy sidecar 容器进行代理。
- reporting-operator.spec.authProxy.enabled
- reporting-operator.spec.authProxy.cookie.createSecret
- reporting-operator.spec.authProxy.cookie.seed
您需要将 reporting-operator.spec.authProxy.enabled 和 reporting-operator.spec.authProxy.cookie.createSecret 设置为 true,将 reporting-operator.spec.authProxy.cookie.seed 设置为 32 个字符的随机字符串。
您可使用以下命令来生成 32 个字符的随机字符串。
openssl rand -base64 32 | head -c32; echo.
$ openssl rand -base64 32 | head -c32; echo.
3.5.2.2.1. 令牌身份验证 复制链接链接已复制到粘贴板!
当以下选项被设置为 true 时,将针对报告 REST API 启用使用 bearer 令牌的身份验证。bearer 令牌可由服务账户或用户提供。
- reporting-operator.spec.authProxy.subjectAccessReview.enabled
- reporting-operator.spec.authProxy.delegateURLs.enabled
启用身份验证后,必须通过以下任一角色向用于查询该用户或 serviceAccount 报告 API 的 bearer 令牌授予访问权限:
- report-exporter
- reporting-admin
- reporting-viewer
- metering-admin
- metering-viewer
metering-operator 可为您创建 RoleBindings,从而通过在 spec.permissions 部分指定主题列表来授予这些权限。例如,请参阅以下 advanced-auth.yaml 示例配置。
另外,您还可使用任何具有授予 reports/export get 权限规则的角色。具体指 get reporting-operator 命名空间中报告资源的 export 子资源的访问权限。例如:admin 和 cluster-admin。
reporting-operator 和 metering-operator serviceAccounts 默认均具有这些权限,其令牌可用于身份验证。
3.5.2.2.2. 基础身份验证(用户名/密码) 复制链接链接已复制到粘贴板!
在进行基础身份验证时,您可在 reporting-operator.spec.authProxy.htpasswd.data 中提供用户名和密码。用户名和密码的格式必须与 htpasswd 文件中相同。设置完成后,即可使用 HTTP 基础身份验证来提供您的用户名和密码,htpasswdData 内容中具有该用户名和密码的对应条目。
3.6. 配置 AWS 账单相关性 复制链接链接已复制到粘贴板!
metering 可将集群使用量信息与 AWS 详细账单信息相关联,并在资源使用量中附上相应金额。对于 EC2 中运行的集群,您可通过修改以下示例 aws-billing.yaml 文件来启用这一功能。
要启用 AWS 账单关联功能,先要确保启用了 AWS 成本和使用量报告。有关更多信息,请参阅 AWS 文档中的 AWS 成本和使用量报告。
要将数据存储至 S3,aws-access-key-id 和 aws-secret-access-key 凭证必须具有存储桶的读取和写入权限。有关授予所需权限的 IAM 策略的示例,请参阅以下 aws/read-write.json 文件。
这一步可在安装前或安装后完成。安装后禁用可能会导致 reporting-operator 出错。
第 4 章 Reports 复制链接链接已复制到粘贴板!
4.1. 关于报告 复制链接链接已复制到粘贴板!
报告(Report)是一个 API 对象,提供了一种使用 SQL 查询来管理定期 ETL(Extract Transform and Load)任务的方法。这类报告通过使用其他 Metering 资源编制而成,资源包括提供要运行的实际 SQL 查询的 ReportQueries,以及定义 ReportQueries 和 Reports 可用数据的 ReportDataSources。
很多用例均可通过与 metering 一同安装的预定义 ReportQueries 和 ReporDataSources 解决,因此,除非您有未被预定义的用例,否则将不需要自行定义用例。
4.1.1. Reports 复制链接链接已复制到粘贴板!
报告自定义资源用于管理报告的执行和状态。metering 会生成通过使用量数据源导出的报告,用于进一步分析和过滤。
一个报告资源即代表一个任务,该任务管理数据库表并根据时间表使用新信息来更新报告。报告通过 reporting-operator HTTP API 来公开表中数据。带有 spec.schedule 字段集的报告会始终运行,并跟踪所收集数据的时间段。这样可确保如果 metering 关闭或不可用,报告将从停止处开始回填数据。如果未设置时间表,则报告将在 reportingStart 和 reportingEnd 处指定的时间运行一次。报告默认会等待 ReportDataSources 完全导入报告周期内的所有数据。如果报告有时间表,则会等到当前处理周期内的数据导入完成后才会开始运行。
4.1.1.1. 有时间表的报告示例 复制链接链接已复制到粘贴板!
以下报告示例将包含每个 Pod 的 CPU 请求信息,将每小时运行一次,每次运行时均会添加最后几小时的数据。
4.1.1.2. 无时间表的报告示例(运行一次) 复制链接链接已复制到粘贴板!
以下报告示例将包含 7 月份所有 Pod 的 CPU 请求信息。完成后,便不会再运行。
4.1.1.3. 查询 复制链接链接已复制到粘贴板!
ReportQuery 用于生成报告的名称。报告查询会控制报告的架构以及结果的处理方式。
query 为必填字段。
使用 oc CLI 获取可用 ReportQuery 对象列表:
带有 -raw 后缀的 ReportQueries 会被其他 ReportQueries 用于构建更为复杂的查询,而不该直接用于报告。
带有 namespace- 前缀的查询会按命名空间聚合 Pod CPU/内存请求,根据资源请求提供命名空间及其总体使用量列表。
带有 pod- 前缀的查询与带有 namespace- 前缀的查询类似,区别在于前者通过 Pod 而非命名空间来聚合信息。这些查询包含 Pod 的命名空间和节点。
带有 node- 前缀的查询会返回有关各个节点总可用资源的信息。
带有 aws- 前缀的查询为 AWS 特定查询。带有 -aws 后缀的查询返回的数据与无此后缀的同名查询返回的数据相同,并会将使用量与 EC2 计费数据相关联。
aws-ec2-billing-data 报告可供其他查询使用,但不应用作独立报告。aws-ec2-cluster-cost 报告根据集群中所含节点提供总成本,以及所报告时间段的成本总额。
要获取完整字段列表,请使用 oc CLI 以 YAMl 格式获取 ReportQuery,并检查 spec.columns 字段:
例如,运行:
oc -n openshift-metering get reportqueries namespace-memory-request -o yaml
$ oc -n openshift-metering get reportqueries namespace-memory-request -o yaml
您应看到如下输出:
4.1.1.4. 时间表 复制链接链接已复制到粘贴板!
spec.schedule 配置块用于定义报告的运行时间。schedule 部分的主要字段为 period。根据 period 的值,还可通过 hourly、daily、weekly 和 monthly 字段来微调报告运行时间。
例如:如果 period 设置为 weekly,您则可将 weekly 字段添加至 spec.schedule 块中。以下示例中报告将于每周三下午 1 点 (13:00) 运行一次。
4.1.1.4.1. 周期 复制链接链接已复制到粘贴板!
下面列出一些 schedule.period 有效值,同时还列出了给定周期内的可设置选项。
hourly-
minute -
second
-
daily-
hour -
minute -
second
-
weekly-
dayOfWeek -
hour -
minute -
second
-
monthly-
dayOfMonth -
hour -
minute -
second
-
cron-
expression
-
一般来说,hour、minute、second 字段控制报告在一天中的哪个时间运行,如果为按周或按月运行,则可使用 dayOfWeek/dayOfMonth 来控制报告在一周或一个月中的哪一天运行。
以上各个字段均设有有效值区间:
-
hour为整数值,介于 0-23 之间。 -
minute为整数值,介于 0-59 之间。 -
second为整数值,介于 0-59 之间。 -
Dayofweek为字符串值,应为一周中的某一天(需要拼写)。 -
dayOfMonth为整数值,介于 1-31 之间。
对于 cron 周期,只要为正常 cron 表达式即有效:
-
表达式:"*/5 * * * *"
4.1.1.5. reportingStart 复制链接链接已复制到粘贴板!
要根据现有数据运行报告,可将 spec.reportingStart 字段设置为 RFC3339 时间戳,以告知报告根据其 schedule 从 reportingStart 而非当前时间开始运行。务必要了解,这会导致 reporting-operator 按照时间表在 reportingStart 时间和当前时间之间的各个间隔内连续运行多个查询。如果周期短于每日,且 reportingStart 在数月之前,则可能会进行数千次查询。如果不设置 reportingStart,则报告将在报告创建后的下一个完整 reportingPeriod 内运行。
例如,如果您已收集 2019 年 1 月 1 日的数据,且希望在报告中添加该数据,则可使用以下值创建报告:
4.1.1.6. reportingEnd 复制链接链接已复制到粘贴板!
要将报告配置为仅运行至指定时间,您可将 spec.reportingEnd 字段设置为 RFC3339 时间戳。此字段值将导致报告生成从开始时间至 reportingEnd 周期的数据报告后随即按时间表停止运行。因时间表很可能与 reportingEnd 不一致,所以时间表中的最后周期将被缩短至所指定的 reportingEnd 时间。如果不设置此字段,报告将永久运行,直至为报告设置了 reportingEnd。
例如,为 7 月创建每周运行一次的报告,使用以下命令:
4.1.1.7. runImmediately 复制链接链接已复制到粘贴板!
当 runImmediately 设置为 true时,报告将立即运行。这个行为可确保立即处理报告并将报告放入队列,而无需额外的调度参数。
当将 runImmediately 设为 true 时,您必须设置 reportingEnd 和 reportingStart 值。
4.1.1.8. 输入 复制链接链接已复制到粘贴板!
报告的 spec.inputs 字段可用于覆盖或设置 ReportQuery 的 spec.inputs 字段中定义的值。
这是一个“名称-值”对列表:
spec:
inputs:
- name: "NamespaceCPUUsageReportName"
value: "namespace-cpu-usage-hourly"
spec:
inputs:
- name: "NamespaceCPUUsageReportName"
value: "namespace-cpu-usage-hourly"
name 输入值必须存在于 ReportQuery 的 inputs 列表中。Value 输入值必须为正确的输入 type。
4.1.1.9. 汇总报告 复制链接链接已复制到粘贴板!
报告数据存储在数据库中,与指标数据非常相似,因此可用于聚合或汇总报告。汇总报告的一个简单用例是将生成报告所需时间分散到更长时间内;无需通过每月报告来查询和添加整个月的所有数据,而是可以将任务分成每日报告,每份报告运行三十分之一的数据。
自定义汇总报告需要自定义报告查询。ReportQuery 模板处理器提供 reportTableName 功能,可通过报告的 metadata.name 获取必要表名称。
下面是取自内置查询的一个片段:
4.1.1.9.1. 报告状态 复制链接链接已复制到粘贴板!
已调度报告的执行可通过其状态字段进行跟踪。报告准备过程中出现的任何错误均会记录在此处。
报告 status 字段目前包含两个字段:
-
conditions:是一个状况列表,每个状况均包含type、status、reason和message字段。状况中type字段的可能值包括Running和Failure,表明已调度报告的当前状态。reason字段揭示其condition处于当前状态的原因,status值可为true、false或unknown。message字段提供一条人类可读信息,揭示该状况处于当前状态的原因。有关reason字段值的详细信息请见pkg/apis/metering/v1/util/report_util.go。 -
lastReportTime:指定 Metering 最后一次收集数据的时间。
4.2. 存储位置 复制链接链接已复制到粘贴板!
StorageLocation 是一个自定义资源,用于配置 report-operator 存储数据的位置。其中包括从 Prometheus 收集的数据,以及通过生成报告自定义资源所产生的结果。
如果您要在多个位置(如多个 S3 存储桶或 S3 和 HDFS)存储数据,或者需要访问并非由 metering 在 Hive/Presto 中创建的数据库,您只需配置 StorageLocation 即可。这对于大部分用户来说并非强制要求,配置 metering 文档中的内容足以配置所有必要存储组件。
4.2.1. StorageLocation 示例 复制链接链接已复制到粘贴板!
第一个示例为内置本地存储选项。它被配置为使用 Hive,数据默认保存在 Hive 所配置的使用存储的位置(HDFS、S3 或 ReadWriteMany PVC)。
本地存储示例
下一示例将 AWS S3 存储桶用于存储。在构造要使用的路径时,前缀会附加至存储桶名称中。
远程存储示例
- 1
- (可选)用于数据库的 Presto 和 Hive 的文件系统 URL。可为
hdfs://或s3a://文件系统 URL。
hive 部分还可指定其他一些可选字段:
- (可选)defaultTableProperties:包含使用 Hive 创建表的配置选项。
- (可选)fileFormat:存储至文件系统中的文件的格式。如需选项列表和更多详情,请参阅文件存储格式 Hive 文档。
- (可选)rowFormat:控制 Hive 行格式。该字段控制行的序列化和反序列化方式。更多详情请参阅行格式和 SerDe Hive 文档。
4.2.2. 默认 StorageLocation 复制链接链接已复制到粘贴板!
如果存在 storagelocation.metering.openshift.io/is-default 注解,且该注解在 StorageLocation 资源上被设置为 true,则该资源将成为默认存储资源。任何组件的存储配置选项如果未指定 StorageLocation,则会使用默认存储资源。仅可在默认存储资源中。如果多个资源都存在注解,则会记录一个错误,Operator 将视为无默认值。
第 5 章 使用 Metering 复制链接链接已复制到粘贴板!
先决条件
- 安装 Metering
- 查看可为报告配置的可用选项及其功能的详细信息。
5.1. 编写报告 复制链接链接已复制到粘贴板!
编写报告是一种通过 Metering 来处理和分析数据的方法。
要编写报告,必须在 YAML 文件中定义一个报告资源,指定所需参数,并使用 oc 在 openshift-metering 命名空间中创建报告。
先决条件
- 安装 Metering。
流程
进入
openshift-metering项目:oc project openshift-metering
$ oc project openshift-meteringCopy to Clipboard Copied! Toggle word wrap Toggle overflow 以 YAML 文件创建报告资源:
使用以下内容创建 YAML 文件:
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 运行以下命令以创建报告:
oc create -f <file-name>.yaml
$ oc create -f <file-name>.yaml report.metering.openshift.io/namespace-cpu-request-2019 createdCopy to Clipboard Copied! Toggle word wrap Toggle overflow
您可使用以下命令列出报告及其
运行状态:oc get reports
$ oc get reports NAME QUERY SCHEDULE RUNNING FAILED LAST REPORT TIME AGE namespace-cpu-request-2019 namespace-cpu-request Finished 2019-12-30T23:59:59Z 26sCopy to Clipboard Copied! Toggle word wrap Toggle overflow
5.2. 查看报告结果 复制链接链接已复制到粘贴板!
查看报告结果需要查询 reporting-api Route,并使用您的 OpenShift Container Platform 凭证对 API 进行身份验证。报告可以以 JSON、CSV 或 Tabular 的格式获得。
先决条件
- 安装 Metering。
-
要访问报告结果,您需为集群管理员,或需要在
openshift-metering命名空间中被授予report-exporter角色的访问权限。
流程
进入
openshift-metering项目:oc project openshift-metering
$ oc project openshift-meteringCopy to Clipboard Copied! Toggle word wrap Toggle overflow 查询报告 API,获取结果:
获取通向
reporting-api的路由:meteringRoute="$(oc get routes metering -o jsonpath='{.spec.host}')" echo "$meteringRoute"$ meteringRoute="$(oc get routes metering -o jsonpath='{.spec.host}')" $ echo "$meteringRoute"Copy to Clipboard Copied! Toggle word wrap Toggle overflow 获取请求中会用到的当前用户的令牌:
token="$(oc whoami -t)"
$ token="$(oc whoami -t)"Copy to Clipboard Copied! Toggle word wrap Toggle overflow 要获取结果,请使用
curl向报告 API 发出请求,请求获取您的报告:reportName=namespace-cpu-request-2019 reportFormat=csv curl --insecure -H "Authorization: Bearer ${token}" "https://${meteringRoute}/api/v1/reports/get?name=${reportName}&namespace=openshift-metering&format=$reportFormat"$ reportName=namespace-cpu-request-20191 $ reportFormat=csv2 $ curl --insecure -H "Authorization: Bearer ${token}" "https://${meteringRoute}/api/v1/reports/get?name=${reportName}&namespace=openshift-metering&format=$reportFormat"Copy to Clipboard Copied! Toggle word wrap Toggle overflow 响应应类似于以下内容(示例输出为
reportName=namespace-cpu-request-2019和reportFormat=csv):Copy to Clipboard Copied! Toggle word wrap Toggle overflow
第 6 章 Metering 使用示例 复制链接链接已复制到粘贴板!
使用以下示例报告开始衡量集群的容量、使用量和利用率。这些示例提供了 metering 提供的各种报告类型,以及预定义查询选择。
先决条件
- 安装 Metering
- 查看有关报告编写与查看的详细信息。
6.1. 每小时和每日测量集群容量 复制链接链接已复制到粘贴板!
以下报告展示如何每小时和每日测量集群容量。每日报告通过汇总每小时报告的结果来实现。
以下报告会每小时测量集群的 CPU 容量。
集群的每小时 CPU 容量示例
- 1
- 您可将周期设置为
每日,获取每日报告,但对于较大数据集,建议使用每小时报告,然后通过汇总每小时报告来获取每日报告。
以下报告通过汇总每小时数据来获取每日报告。
集群的每日 CPU 容量示例
6.2. 通过一次性报告来衡量集群使用量 复制链接链接已复制到粘贴板!
以下报告自特定开始日期起测量集群使用量。该报告在您保存并应用后仅会运行一次。
集群的 CPU 使用量示例
6.3. 使用 cron 表达式来测量集群利用率 复制链接链接已复制到粘贴板!
在配置报告周期时还可使用 cron 表达式。以下报告通过查看每个工作日 9am -5pm 的 CPU 利用率来衡量集群使用量。
集群的工作日 CPU 利用率示例
第 7 章 metering 故障排除与调试 复制链接链接已复制到粘贴板!
参考以下部分来协助排除和调试与 metering 相关的问题。
除本部分所述信息外,还需查看以下主题:
7.1. metering 故障排除 复制链接链接已复制到粘贴板!
metering 常会遇到 Pod 无法启动的问题。Pod 可能会因为缺少资源或其所依赖的资源(如 StorageClass 或 Secret)不存在而无法启动。
7.1.1. 计算资源不足 复制链接链接已复制到粘贴板!
安装或运行 metering 时常会遇到计算资源不足的问题。确保向 metering 分配的资源满足安装先决条件中描述的最低资源要求。
要确定资源或调度方面是否存在问题,请按照 Kubernetes 文档Managing Compute Resources for Containers 中的故障排除说明操作。
7.1.2. 未配置 StorageClass 复制链接链接已复制到粘贴板!
metering 要求为动态置备配置默认 StorageClass。
要了解如何检查是否为集群配置了任何 StorageClasses,如何设置默认值,以及如何配置 metering 使用 StorageClass 而非默认值,请查看配置 metering 文档获取相关信息。
7.1.3. 未正确配置 secret 复制链接链接已复制到粘贴板!
metering 常会遇到在配置持久性存储时所提供的 secret 不正确的问题。请务必查看示例配置文件并根据您的存储提供程序指南创建 secret。
7.2. metering 调试 复制链接链接已复制到粘贴板!
当直接与各种组件交互时,可以更容易地调试 metering.以下部分详细介绍如何连接和查询 Presto 和 Hive 以及如何查看 HDFS 组件的仪表板。
本部分所有命令均假设您已通过 OperatorHub 在 openshift-metering 命名空间中安装了 metering。
7.2.1. 获取报告 Operator 日志 复制链接链接已复制到粘贴板!
获取 reporting-operator 日志后使用以下命令。
oc -n openshift-metering logs -f "$(oc -n openshift-metering get pods -l app=reporting-operator -o name | cut -c 5-)" -c reporting-operator
$ oc -n openshift-metering logs -f "$(oc -n openshift-metering get pods -l app=reporting-operator -o name | cut -c 5-)" -c reporting-operator
7.2.2. 使用 presto-cli 查询 Presto 复制链接链接已复制到粘贴板!
以下命令将打开交互式 presto-cli 会话,您可通过该会话查询 Presto。该会话与 Presto 在相同容器中运行,并会启动一个额外 Java 实例,可为 Pod 创建内存限值。如果出现这种情况,您需要提高 Presto Pod 的内存请求和限值。
Presto 默认配置为使用 TLS 进行通信。您必须先运行以下命令才可运行 Presto 查询:
oc -n openshift-metering exec -it "$(oc -n openshift-metering get pods -l app=presto,presto=coordinator -o name | cut -d/ -f2)" -- /usr/local/bin/presto-cli --server https://presto:8080 --catalog hive --schema default --user root --keystore-path /opt/presto/tls/keystore.pem
$ oc -n openshift-metering exec -it "$(oc -n openshift-metering get pods -l app=presto,presto=coordinator -o name | cut -d/ -f2)" -- /usr/local/bin/presto-cli --server https://presto:8080 --catalog hive --schema default --user root --keystore-path /opt/presto/tls/keystore.pem
运行完该命令后,系统会提示您运行查询。使用 show tables from metering; 查询来查看表列表:
7.2.3. 使用 beeling 来查询 Hive 复制链接链接已复制到粘贴板!
以下命令将打开交互式 beeline 会话,您可通过该会话查询 Hive。该会话与 Hive 在相同容器中运行,并会启动一个额外 Java 实例,可为 Pod 创建内存限值。如果出现这种情况,您需要提高 Hive Pod 的内存请求和限值。
oc -n openshift-metering exec -it $(oc -n openshift-metering get pods -l app=hive,hive=server -o name | cut -d/ -f2) -c hiveserver2 -- beeline -u 'jdbc:hive2://127.0.0.1:10000/default;auth=noSasl'
$ oc -n openshift-metering exec -it $(oc -n openshift-metering get pods -l app=hive,hive=server -o name | cut -d/ -f2) -c hiveserver2 -- beeline -u 'jdbc:hive2://127.0.0.1:10000/default;auth=noSasl'
运行完该命令后,系统会提示您运行查询。使用 show tables 查询来查看表列表:
7.2.4. 将端口转发到 Hive Web UI 复制链接链接已复制到粘贴板!
运行以下命令:
oc -n openshift-metering port-forward hive-server-0 10002
$ oc -n openshift-metering port-forward hive-server-0 10002
您现在可从浏览器窗口中打开 http://127.0.0.1:10002 以进入 Hive Web 界面。
7.2.5. 端口转发至 hdfs 复制链接链接已复制到粘贴板!
至命名节点:
oc -n openshift-metering port-forward hdfs-namenode-0 9870
$ oc -n openshift-metering port-forward hdfs-namenode-0 9870
您现在可从浏览器窗口中打开 http://127.0.0.1:9870 以进入 HDFS Web 界面。
至首个数据节点:
oc -n openshift-metering port-forward hdfs-datanode-0 9864
$ oc -n openshift-metering port-forward hdfs-datanode-0 9864
要检查其他数据节点,请运行上述命令,将 hdfs-datanode-0 替换为您要查看信息的 Pod。
7.2.6. Metering Ansible Operator 复制链接链接已复制到粘贴板!
metering 会使用 Ansible Operator 来监控和协调集群环境中的资源。如果 metering 安装调试失败,通过查看 Ansible 日志或 MeteringConfig 自定义状态有助于解决问题。
7.2.6.1. 访问 Ansible 日志 复制链接链接已复制到粘贴板!
在默认安装中,metering Operator 会被部署为 Pod。这种情况下,可进入 Pod 检查 Ansible 容器日志:
oc -n openshift-metering logs $(oc -n openshift-metering get pods -l app=metering-operator -o name | cut -d/ -f2) -c ansible
$ oc -n openshift-metering logs $(oc -n openshift-metering get pods -l app=metering-operator -o name | cut -d/ -f2) -c ansible
或者,还可查看 Operator 容器的日志(将 -c ansible 替换为 -c operator)以获取压缩输出。
7.2.6.2. 检查 MeteringConfig 状态 复制链接链接已复制到粘贴板!
查看 MeteringConfig 自定义资源的 status 有助于调试任何最新故障。可使用以下命令完成此操作:
oc -n openshift-metering get meteringconfig operator-metering -o json | jq '.status'
$ oc -n openshift-metering get meteringconfig operator-metering -o json | jq '.status'
第 8 章 卸载 Metering 复制链接链接已复制到粘贴板!
您可以从 OpenShift Container Platform 集群中删除 metering。
8.1. 从 OpenShift Container Platform 卸载 metering 复制链接链接已复制到粘贴板!
您可以从集群中移除 metering。
先决条件
- metering 已安装。
流程
删除 metering:
- 在 OpenShift Container Platform web 控制台中,点击 Operators → Installed Operators。
-
找到 Metering Operator 并点击
菜单。点击 Uninstall Operator。
- 在对话框中,点击 Remove 来卸载 metering。
Metering 不会管理或删除任何 S3 存储桶数据。如果使用 Amazon S3 作为存储,则必须手动清理所有用于存储 metering 数据的 S3 存储桶。
Legal Notice
复制链接链接已复制到粘贴板!
Copyright © 2025 Red Hat
OpenShift documentation is licensed under the Apache License 2.0 (https://www.apache.org/licenses/LICENSE-2.0).
Modified versions must remove all Red Hat trademarks.
Portions adapted from https://github.com/kubernetes-incubator/service-catalog/ with modifications by Red Hat.
Red Hat, Red Hat Enterprise Linux, the Red Hat logo, the Shadowman logo, JBoss, OpenShift, Fedora, the Infinity logo, and RHCE are trademarks of Red Hat, Inc., registered in the United States and other countries.
Linux® is the registered trademark of Linus Torvalds in the United States and other countries.
Java® is a registered trademark of Oracle and/or its affiliates.
XFS® is a trademark of Silicon Graphics International Corp. or its subsidiaries in the United States and/or other countries.
MySQL® is a registered trademark of MySQL AB in the United States, the European Union and other countries.
Node.js® is an official trademark of Joyent. Red Hat Software Collections is not formally related to or endorsed by the official Joyent Node.js open source or commercial project.
The OpenStack® Word Mark and OpenStack logo are either registered trademarks/service marks or trademarks/service marks of the OpenStack Foundation, in the United States and other countries and are used with the OpenStack Foundation’s permission. We are not affiliated with, endorsed or sponsored by the OpenStack Foundation, or the OpenStack community.
All other trademarks are the property of their respective owners.