第 10 章 预测模型标记语言(PMML)
预测模型标记语言(PMML)是一个基于 XML 的标准,由 Data Mining Group(DMG)设定,用于定义统计数据和数据分割模型。PMML 模式可以在 PMML 兼容平台和跨组织之间共享,以便业务分析和开发人员在设计、分析和实施 PMML 资产和服务方面具有统一。
有关 PMML 的背景和应用程序的更多信息,请参阅 DMG PMML 规格。
10.1. PMML 一致性级别 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
PMML 规格在软件实施中定义制作者和消费者一致性级别,以确保 PMML 模型创建并可靠地集成。有关每个符合等级的正式定义,请查看 DMG PMML 一致性 页面。
以下列表总结了 PMML 合规级别:
- 生产者一致性
- 如果工具或应用程序生成有效 PMML 文档,则至少为一种模型生成有效的 PMML 文档。满足 PMML producer 一致性要求可确保模型定义文档正确,并定义与模型规格中定义的语义条件一致的模型实例。
- 消费者规范
- 如果应用程序接受至少一种模型的有效 PMML 文档,则应用程序符合使用者。满足消费者一致性要求,确保根据制作者一致性创建的 PMML 模型可以集成并用作定义。例如,如果应用程序消费者符合 Regression 模型类型,则有效的 PMML 文档定义了由不同符合生产者生成的模型。
Red Hat Decision Manager 包括对以下 PMML 模型类型的消费者一致性支持:
- 回归模型
- Scorecard 模型
- 树结构模型
-
mining model(with sub-types
modelChain
,selectAll
,然后选择First
) - 集群模型
有关所有 PMML 模型类型的列表,包括 Red Hat Decision Manager 中不支持的,请参阅 DMG PMML 规格。