第 7 章 配置 Guardrails Orchestrator 服务
TrustyAI Guardrails Orchestrator 服务是一个在文本生成输入和输出中调用检测的工具,以及独立检测。
它被 IBM 的 open-source 项目 FMS-Guardrails Orchestrator 进行固定。您可以通过由 TrustyAI Operator 管理的自定义资源定义(CRD)部署 Guardrails Orchestrator 服务。
您可以将以下检测器与 trustyai_fms 搭配使用:
- 正则表达式检测 程序:结构化规则强制的基于 Pattern 的内容检测。这些是 Guardrails Orchestrator 服务中的内置检测器。了解有关 guardrails-regex-detector 的更多信息。
-
Hugging Face Detectors :与大多数 Hugging Face
AutoModelForSequenceClassification模型兼容,如granite-guardian-hap-38m或deberta-v3-base-prompt-injection-v2。了解有关 FMS Guardrails Orchestrator 的检测器算法的更多信息。 -
vLLM Detector Adapter: 与 Hugging Face
AutoModelForCausalLM模型兼容的内容检测,如ibm-granite/granite-guardian-3.1-2b。了解有关 vllm-detector-adapter 的更多信息。
以下小节介绍了如何部署 Guardrails Orchestrator 并提供示例用例:
- 部署 Guardrails Orchestrator 实例
- 将 user-inputs 监视到您的 LLM
- 配置和使用内置检测器
- 配置和使用 guardrails 网关
- 启用 OpenTelemetry 导出器来观察指标和追踪
7.1. 部署 Guardrails Orchestrator 服务 复制链接链接已复制到粘贴板!
您可以在命名空间中部署一个 Guardrails Orchestrator 实例,以监控元素,如用户输入到您的 Large Language Model (LLM)。
先决条件
- 具有集群管理员特权。
- 您已下载并安装 OpenShift 命令行界面 (CLI)。请参阅安装 OpenShift CLI。
-
您熟悉如何创建
configMap来监控用户定义的工作流。您在此过程中执行类似的步骤。请参阅了解配置映射。 -
您已将 KServe 配置为使用
RawDeployment模式。如需更多信息,请参阅在 单模式服务平台上部署模型。 -
在 OpenShift AI
DataScienceCluster中将 TrustyAI 组件设置为Managed。 - 您有一个大型语言模型(LLM),用于 chat 生成或文本分类,或两者都部署在命名空间中。
流程
在 YAML 文件中定义
ConfigMap对象,以指定chat_generation和detectors服务。例如,使用以下内容创建一个名为orchestrator_cm.yaml的文件:orchestrator_cm.yaml示例Copy to Clipboard Copied! Toggle word wrap Toggle overflow 部署
orchestrator_cm.yaml配置映射:oc apply -f orchestrator_cm.yaml -n <TEST_NAMESPACE>
$ oc apply -f orchestrator_cm.yaml -n <TEST_NAMESPACE>Copy to Clipboard Copied! Toggle word wrap Toggle overflow 指定在
GuardrailsOrchestrator自定义资源(CR)中创建的之前创建的ConfigMap对象。例如,使用以下内容创建名为orchestrator_cr.yaml的文件:orchestrator_cr.yamlCR 示例Copy to Clipboard Copied! Toggle word wrap Toggle overflow 部署编配器 CR,在命名空间中创建服务帐户、部署、服务和路由对象:
oc apply -f orchestrator_cr.yaml -n <TEST_NAMESPACE>
oc apply -f orchestrator_cr.yaml -n <TEST_NAMESPACE>Copy to Clipboard Copied! Toggle word wrap Toggle overflow
验证
确认编配器和 LLM pod 正在运行:
oc get pods -n <TEST_NAMESPACE>
$ oc get pods -n <TEST_NAMESPACE>Copy to Clipboard Copied! Toggle word wrap Toggle overflow 响应示例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 查询编配器路由的
/health端点,以检查检测器和生成器服务的当前状态。如果返回200 OK响应,则服务可以正常工作:GORCH_ROUTE_HEALTH=$(oc get routes gorch-test-health -o jsonpath='{.spec.host}')$ GORCH_ROUTE_HEALTH=$(oc get routes gorch-test-health -o jsonpath='{.spec.host}')Copy to Clipboard Copied! Toggle word wrap Toggle overflow curl -v https://$GORCH_ROUTE_HEALTH/health
$ curl -v https://$GORCH_ROUTE_HEALTH/healthCopy to Clipboard Copied! Toggle word wrap Toggle overflow 响应示例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow