第 3 章 产品特性
Red Hat OpenShift Data Science 为数据科学家和 IT 操作管理员提供了一些功能。
3.1. 数据科学家的功能
- 容器
- 虽然 JupyterLab 等工具已经为数据科学家在其机器上开发模型提供了直观的方法,但存在与协作和共享工作相关的固有复杂性。此外,当您需要自行购买和维护时,使用专用的硬件(如强大的 GPU)可能会非常昂贵。OpenShift Data Science 中包含的 Jupyter 环境可让您在任意地方获取开发环境。由于所有工作负载都作为容器运行,协作也会像与团队成员共享镜像一样容易,甚至将其添加到他们可以使用的默认容器列表中。GPU 和大量内存可突然成为更多可访问,因为您的笔记本不再受到支持的限制。
- 与第三方机器学习工具集成
- 我们在我们最喜欢的工具或服务之间无法很好地运行。在 设计 OpenShift Data Science 时,实现灵活性的非常重要的因素。您可以在 OpenShift Data Science 中使用广泛的开源和第三方工具。这些工具支持完整的机器学习生命周期,从数据工程和功能提取到模型部署和管理。
- 在笔记本中使用 Git
- 使用 Jupyter 的 Git 界面与他人协作,并跟踪代码的更改。
- 安全构建笔记本镜像
- 从预定的默认笔记本镜像中选择与模型开发所需的工具和库进行预配置。软件堆栈,特别是机器学习中涉及的软件堆栈,往往是复杂的系统。Python 生态系统中有多种模块和库可以使用,因此确定要使用库的哪个版本可能非常困难。OpenShift Data Science 附带许多打包的笔记本镜像,它们构建了来自数据科学家和建议引擎的见解。您可以在右面上快速启动新项目,而无需担心从随机上游存储库下载未验证且可能不安全的镜像。
- 自定义笔记本
- 除了由红帽和独立软件供应商 (ISV) 提供和支持的笔记本镜像外,您还可以配置针对项目特定要求的自定义笔记本镜像。
- 数据科学项目(data Science)管道
- OpenShift Data Science 支持数据科学管道,以实现运行数据科学项目工作负载的成熟和高效方法。您可以标准化和自动化机器学习工作流,以便您开发和部署数据科学模型。
- 模型服务
- 作为数据科学家,您现在可以部署经过培训的计算机学习模型,为生产环境中的智能应用程序提供服务。模型的功能作为服务端点提供,可用于测试或集成到应用程序中。您对此服务的执行方式有更多控制。