主页
产品
Red Hat OpenShift AI Cloud Service
1
服务模型
2.8. 测试和验证的模型保留运行时

2.8. 测试和验证的模型保留运行时

测试和验证的运行时是社区版本，针对特定的 OpenShift AI 版本进行测试和验证。

每次有新版本的 OpenShift AI 时，红帽都会测试经过测试和验证的运行时的当前版本。如果在 OpenShift AI 发行周期中发布经过测试和验证的运行时的新版本，它将在以后的发行版本中进行测试和验证。

注意

红帽不支持经过测试和验证的运行时。您需要确保已授权使用您添加的任何经过测试和验证的运行时，以及正确配置和维护它们。

Expand

表 2.3. model-serving 运行时
Name	描述	导出模型格式
NVIDIA Triton Inference Server	为应用程序快速、可扩展的 AI 为开源服务软件提供服务。	TensorRT, TensorFlow, PyTorch, ONNX, OpenVINO, Python, RAPIDS FIL 等
Seldon MLServer	旨在简化机器学习模型部署的开源 inference 服务器。	scikit-Learn (sklearn), XGBoost, LightGBM, CatBoost, HuggingFace 和 MLflow

Expand

表 2.4. 部署要求
Name	默认协议	其他协议	模型网格支持	单节点 OpenShift 支持	部署模式
NVIDIA Triton Inference Server	gRPC	REST	是	是	raw 和 serverless
Seldon MLServer	gRPC	REST	否	是	raw 和 serverless

注意

Seldon 中的 alibi-detect 和 alibi-explain 库遵循 Business Source License 1.1 (BSL 1.1)。作为经认证的 Seldon MLServer 运行时的一部分，这些库没有被红帽测试、验证或支持。不建议在带有运行时的生产环境中使用这些库。

返回顶部

2.8. 测试和验证的模型保留运行时

学习

尝试、购买和销售

社区

关于红帽文档

让开源更具包容性

關於紅帽

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links