第 2 章 产品特性
Red Hat OpenShift AI 为数据科学家和 IT 操作管理员提供了一些功能。
2.1. 数据科学家的功能
- 容器
- 虽然 JupyterLab 等工具已经为数据科学家在其机器上开发模型提供了直观的方法,但存在与协作和共享工作相关的固有复杂性。此外,当您需要自行购买和维护时,使用专用的硬件(如强大的 GPU)可能会非常昂贵。OpenShift AI 中包含的 Jupyter 环境可让您在需要它的任何地方使用开发环境。由于所有工作负载都作为容器运行,协作也会像与团队成员共享镜像一样容易,甚至将其添加到他们可以使用的默认容器列表中。因此,GPU 和大量内存更易于访问,因为您不再受笔记本电脑支持的限制。
- 与第三方机器学习工具集成
- 我们在我们最喜欢的工具或服务之间无法很好地运行。OpenShift AI 在设计时具有灵活性。您可以在 OpenShift AI 中使用广泛的开源和第三方工具。这些工具支持完整的机器学习生命周期,从数据工程和功能提取到模型部署和管理。
- 在笔记本中使用 Git
- 使用 Jupyter 的 Git 界面与他人协作,并跟踪代码的更改。
- 安全构建笔记本镜像
- 从预定的默认笔记本镜像中选择与模型开发所需的工具和库进行预配置。软件堆栈,特别是机器学习中涉及的软件堆栈,往往是复杂的系统。Python 生态系统中有许多模块和库可以使用,因此确定要使用哪个库的版本可能非常困难。OpenShift AI 包括了很多打包的笔记本镜像,它们已通过数据科学家和建议引擎的洞察而构建。您可以在右面上快速启动新项目,而无需担心从随机上游存储库下载未验证且可能不安全的镜像。
- 自定义工作台镜像
- 除了由红帽和独立软件供应商(ISV)提供和支持的工作台镜像外,您还可以配置针对项目特定要求的自定义工作台镜像。
- 数据科学项目(data Science)管道
- OpenShift AI 和数据科学管道 2.0 提供了运行数据科学工作负载的有效方法。您可以标准化和自动化机器学习工作流,以便您开发和部署数据科学模型。
- 模型服务
- 作为数据科学家,您现在可以部署经过培训的计算机学习模型,为生产环境中的智能应用程序提供服务。模型的功能作为服务端点提供,可用于测试或集成到应用程序中。您对此服务的执行方式有更多控制。
- 使用加速器优化数据科学模型
- 如果使用大型数据集,您可以使用 NVIDIA 图形处理单元(GPU)或 Intel Gaudi AI 加速器优化 OpenShift AI 中数据科学模型的性能。加速器使您能够扩展工作、缩短延迟并提高生产力。