在数据科学 IDE 中使用


Red Hat OpenShift AI Self-Managed 2.16

通过 Red Hat OpenShift AI Self-Managed 在数据科学 IDE 中工作

摘要

为开发机器学习模型准备数据科学集成开发环境(IDE)。

前言

在 Red Hat OpenShift AI 中,在创建工作台时,您可以选择一个工作台镜像,其中包含用于开发机器学习(ML)模型的集成开发环境(IDE)。

OpenShift AI 支持以下数据科学 IDE 以开发 ML 模型:

  • JupyterLab
  • code-server
  • RStudio 服务器(技术预览功能)

    注意

    RStudio workbench 镜像目前在断开连接的环境中不可用。

有关 RStudio 服务器的详情,请参考 发行注记

第 1 章 访问工作台 IDE

要访问工作台 IDE,请使用 OpenShift AI 接口中提供的链接。

前提条件

  • 您已创建了数据科学项目和一个工作台。

流程

  1. 在 OpenShift AI 仪表板中,点 Data Science Projects
  2. 点包含工作台的项目的名称。
  3. 单击 Workbenches 选项卡。
  4. 如果工作台的状态为 Running,请跳至下一步。

    如果工作台的状态为 Stopped,在工作台的 Status 列中点 Start

    当工作台服务器启动时,Status 列从 Stopped 改为 Starting,然后在工作台成功启动时变为 Running

  5. 点工作台旁边的 Open 链接。

验证

  • 为工作台 IDE 打开一个新浏览器窗口。

第 2 章 在 JupyterLab 中工作

JupyterLab 是一个基于 web 的互动开发环境,用于 Jupyter 笔记本、代码和数据。您可以在数据科学和机器学习中配置和安排工作流。JupyterLab 是一个开源 Web 应用程序,支持超过 40 种编程语言,包括 Python 和 R。

2.1. 创建并导入笔记本

您可以创建一个空白笔记本,或者从几个不同的源导入 JupyterLab 中的笔记本。

2.1.1. 创建新笔记本

您可以从现有笔记本容器镜像创建一个新的 Jupyter 笔记本,以访问其资源和属性。笔记本服务器控制面板包含可用容器镜像的列表,您可以作为单用户笔记本服务器运行。

先决条件

  • 确保您已登录到 Red Hat OpenShift AI。
  • 确保您已启动了笔记本服务器并登录到 JupyterLab。
  • 笔记本镜像存在于 registry、镜像流中,并可访问。

流程

  1. FileNewNotebook
  2. 如果出现提示,请从列表中为您的笔记本选择一个内核。

    如果要使用内核,点 Select。如果您不想使用内核,点 No Kernel

验证

  • 检查笔记本文件是否在 JupyterLab 接口中看到。

您可以从本地存储将现有笔记本加载到 JupyterLab 中,以继续工作,或针对新的用例调整项目。

先决条件

  • 用于登录到 JupyterLab 的凭证。
  • 启动并运行 Jupyter 笔记本服务器。
  • 本地存储中存在笔记本文件。

流程

  1. 在 JupyterLab 界面左侧边栏的 文件浏览器中,点 Upload Files ( Upload Files )。
  2. 找到并选择笔记本文件,然后单击 Open

    文件显示在文件浏览器中。

验证

  • 笔记本文件会出现在 JupyterLab 界面左侧边栏的 File Browser 中。
  • 您可以在 JupyterLab 中打开笔记本文件。

2.2. 使用 Git 协作笔记本

如果您的笔记本或其他文件存储在 Git 版本控制中,您可以克隆 Git 存储库以便在 JupyterLab 中使用它们。准备就绪后,您可以将您的更改推送回 Git 存储库,以便其他人可以查看或使用您的模型。

您可以使用 JupyterLab 用户界面将 Git 存储库克隆到工作区,以继续您的工作或从外部项目集成文件。

先决条件

  • 启动并运行 Jupyter 笔记本服务器。
  • 要克隆的 Git 存储库的读取访问权限。

流程

  1. 复制 Git 存储库的 HTTPS URL。

    • 在 GitHub 中,点 HEKETI CodeHTTPS,然后点 Copy URL to clipboard 图标。
    • 在 GitLab 中,单击 Code,然后单击 Clone with HTTPS 下的 Copy URL 图标。
  2. 在 JupyterLab 界面中,点 Git Clone 按钮( Git Clone button )。

    您还可以在菜单中点击 GitClone a repository,或者点击 Git 图标( Git button )并点 Clone a repository 按钮。

    此时会显示克隆存储库对话框。

  3. 输入包含笔记本的存储库的 HTTPS URL。
  4. CLONE
  5. 若有提示,请输入您的 Git 存储库的用户名和密码。

验证

  • 检查存储库的内容是否在 JupyterLab 中的文件浏览器中看到,或者在终端中运行 ls 命令,以验证存储库是否显示为一个目录。

您可以使用命令行界面将 Git 存储库克隆到工作区,以继续工作或从外部项目集成文件。

先决条件

  • 启动并运行 Jupyter 笔记本服务器。

流程

  1. 复制 Git 存储库的 HTTPS URL。

    • 在 GitHub 中,点 HEKETI CodeHTTPS,然后点 Copy URL to clipboard 图标。
    • 在 GitLab 中,单击 Code,然后单击 Clone with HTTPS 下的 Copy URL 图标。
  2. 在 JupyterLab 中,点 FileNewTerminal 打开终端窗口。
  3. 输入 git clone 命令:

    git clone <git-clone-URL>

    git-clone-URL& gt; 替换为 HTTPS URL,例如:

    [1234567890@jupyter-nb-jdoe ~]$ git clone https://github.com/example/myrepo.git
    Cloning into myrepo...
    remote: Enumerating objects: 11, done.
    remote: Counting objects: 100% (11/11), done.
    remote: Compressing objects: 100% (10/10), done.
    remote: Total 2821 (delta 1), reused 5 (delta 1), pack-reused 2810
    Receiving objects: 100% (2821/2821), 39.17 MiB | 23.89 MiB/s, done.
    Resolving deltas: 100% (1416/1416), done.

验证

  • 检查存储库的内容是否在 JupyterLab 中的文件浏览器中看到,或者在终端中运行 ls 命令,以验证存储库是否显示为一个目录。

2.2.3. 使用远程 Git 存储库中的更改更新项目

您可以从远程 Git 存储库将其他用户所做的更改拉取到您的 data science 项目中。

先决条件

  • 您已配置了远程 Git 存储库。
  • 您已将 Git 存储库导入到 JupyterLab,存储库的内容在 JupyterLab 中的文件浏览器中可见。
  • 有将文件从远程 Git 存储库拉取到本地存储库的权限。
  • 您有登录 Jupyter 的凭证。
  • 您有一个启动并运行 Jupyter 服务器。

流程

  1. 在 JupyterLab 界面中,点 Git 按钮( Git button )。
  2. Pull latest changes 按钮( Pull latest changes button )。

验证

  • 您可以在 Git 窗格中的 History 选项卡中查看从远程存储库拉取的更改。

2.2.4. 将项目更改推送到 Git 存储库

要在生产环境中构建和部署您的应用,请将您的工作上传到远程 Git 存储库。

先决条件

  • 您已在 JupyterLab 界面中打开了笔记本。
  • 您已在笔记本服务器中添加了相关的 Git 存储库。
  • 有权限将更改推送到相关的 Git 存储库。
  • 已安装 Git 版本控制扩展。

流程

  1. FileSave All 保存任何未保存的更改。
  2. 点击 Git 图标( Git button )在 JupyterLab 界面中打开 Git 窗格。
  3. 确认更改的文件显示在 Changed 下。

    如果您的更改的文件出现在 Untracked 中,请点击 GitSimple Staging 以启用简化的 Git 进程。

  4. 提交您的更改。

    1. 确保 Changed 下的所有文件都有一个蓝色复选标记。
    2. Summary 字段中输入您所做的更改的简短描述。
    3. Commit
  5. GitPush to Remote 将您的更改推送到远程存储库。
  6. 出现提示时,输入您的 Git 凭据,再单击 OK

验证

  • 您最近推送的更改在远程 Git 存储库中可见。

2.3. 管理 Python 软件包

在 JupyterLab 中,您可以查看在 notebook 镜像上安装的 Python 软件包并安装额外的软件包。

您可以通过在笔记本电脑单元中运行 pip 工具来检查在笔记本电脑服务器上安装了哪些 Python 软件包以及您已有的软件包版本。

先决条件

  • 登录 JupyterLab 并打开一个笔记本。

流程

  1. 在笔记本中输入以下内容:

    !pip list
  2. 运行单元。

验证

  • 输出显示了所有已安装的 Python 软件包及其版本的字母顺序列表。例如,如果您在使用 Minimal 镜像创建笔记本服务器后立即使用 pip list 命令,则显示的第一个软件包类似如下:

    Package                           Version
    --------------------------------- ----------
    aiohttp                           3.7.3
    alembic                           1.5.2
    appdirs                           1.4.4
    argo-workflows                    3.6.1
    argon2-cffi                       20.1.0
    async-generator                   1.10
    async-timeout                     3.0.1
    attrdict                          2.0.1
    attrs                             20.3.0
    backcall                          0.2.0

2.3.2. 在笔记本服务器中安装 Python 软件包

您可以通过将软件包和版本添加到 requirements.txt 文件中,安装不是默认笔记本服务器一部分的 Python 软件包,然后在笔记本单元中运行 pip install 命令。

注意

虽然您可以直接安装软件包,但建议您使用一个 requirements.txt 文件,以便在不同的笔记本中轻松重复使用该文件中声明的软件包。

先决条件

  • 登录 JupyterLab 并打开一个笔记本。

流程

  1. 使用以下方法之一创建新文本文件:

    • 单击 + 以打开新启动程序,然后单击 文本文件
    • FileNewText File
  2. 将文本文件重命名为 requirements.txt

    1. 右键单击文件的名称,然后单击 重命名文本。此时会打开 Rename File 对话框。
    2. New Name 字段中输入 requirements.txt,然后单击 Rename
  3. 将要安装的软件包添加到 requirements.txt 文件中。

    altair

    您可以使用 == (等于) 操作符指定要安装的确切版本,例如:

    altair==4.1.0
    注意

    红帽建议指定准确的软件包版本,以便随着时间的推移增强笔记本服务器的稳定性。在环境行为中,新的软件包版本可能会带来不必要的更改或意外更改。

    要同时安装多个软件包,请将每个软件包放在单独的行中。

  4. 使用笔记本单元将 requirements.txt 中的软件包安装到您的服务器中。

    1. 在笔记本中创建新单元并输入以下命令:

      !pip install -r requirements.txt
    2. 按 Shift 和 Enter 运行单元。
    重要

    pip install 命令在笔记本服务器上安装软件包。但是,您必须在代码单元中运行 import 语句,才能在您的代码中使用软件包。

    import altair

验证

2.4. 对 Jupyter 中的常见问题进行故障排除

如果您在与 Jupyter、笔记本电脑或笔记本服务器相关的 Red Hat OpenShift AI 中看到错误,请阅读本节以了解可能导致此问题的内容。

如果您无法在此处或发行注记中看到您的问题,请联系红帽支持。

当登录到 Jupyter 时,看到 403: Forbidden 错误

问题

如果您的集群管理员配置了 OpenShift AI 用户组,您的用户名可能不会添加到默认用户组或 OpenShift AI 的默认管理员组中。

解决方案

Contact your cluster administrator so that they can add you to the correct group/s.

我的笔记本服务器没有启动

问题

托管您的笔记本服务器的 OpenShift 集群可能无法访问充足的资源,或者 Jupyter pod 可能出现问题。

解决方案

检查 OpenShift 中的 Events 部分中的日志,以了解与问题相关的错误消息。例如:

Server requested
2021-10-28T13:31:29.830991Z [Warning] 0/7 nodes are available: 2 Insufficient memory,
2 node(s) had taint {node-role.kubernetes.io/infra: }, that the pod didn't tolerate, 3 node(s) had taint {node-role.kubernetes.io/master: },
that the pod didn't tolerate.

请联络您的集群管理员,了解任何相关错误消息的详细信息,以便他们可以执行进一步的检查。

在运行我的笔记本时遇到一个 database or disk is full 错误或一个 no space left on device 错误

问题

您可能会在笔记本服务器上耗尽存储空间。

解决方案

请联络您的集群管理员,以便他们可以执行进一步的检查。

第 3 章 在 code-server 中工作

code-server 是一个基于 Web 的交互式开发环境,支持多种编程语言,包括 Python,用于使用 Jupyter 笔记本。使用 code-server workbench 镜像,您可以使用各种扩展来自定义工作台环境来满足您的需求,以添加新的语言、主题、调试器并连接到其他服务。如需更多信息,请参阅 GitHub 中的 code-server

注意

基于 Elyra 的管道不适用于 code-server workbench 镜像。

3.1. 创建 code-server workbenches

您可以创建一个空白 Jupyter 笔记本,或者从几个不同的源在 code-server 中导入 Jupyter 笔记本。

3.1.1. 创建工作台

当您创建工作台时,您可以指定一个镜像(IDE、软件包和其他依赖项)。您还可以配置连接、集群存储并添加容器存储。

先决条件

  • 您已登陆到 Red Hat OpenShift AI。
  • 如果使用 OpenShift AI 组,则作为 OpenShift 中的用户组或 admin 组(如 rhoai-usersrhoai-admins )的一部分。
  • 您创建了一个项目。
  • 如果您在 Red Hat OpenShift AI 之外创建了 Simple Storage Service (S3)帐户,并希望创建到现有 S3 存储桶的连接,则具有存储存储桶的以下凭证信息:

    • 端点 URL
    • access key
    • Secret 密钥
    • 区域
    • bucket 名称

    如需更多信息,请参阅在 S3 兼容对象存储中使用数据

流程

  1. 在 OpenShift AI 仪表板中,点 Data Science Projects

    Data Science Projects 页面将打开。

  2. 点您要将工作台添加到的项目的名称。

    此时会打开项目详情页面。

  3. 单击 Workbenches 选项卡。
  4. Create workbench

    Create workbench 页面将打开。

  5. Name 字段中输入工作台的唯一名称。
  6. 可选:如果要更改工作台的默认资源名称,点 Edit resource name

    资源名称是您在 OpenShift 中标记的资源。有效字符包括小写字母、数字和连字符(-)。资源名称不能超过 30 个字符,它必须以字母或数字开头,并以字母或数字结尾。

    注: 您无法在创建工作台后更改资源名称。您只能编辑显示名称和描述。

  7. 可选:在 Description 字段中输入工作台的描述。
  8. Notebook image 部分,完成字段以指定要与工作台搭配使用的工作台镜像。

    Image selection 列表中,选择一个适合您用例的工作台镜像。工作台镜像包含 IDE 和 Python 软件包(可重复利用的代码)。(可选)点击 View package information 查看包含在您选择的镜像中的软件包列表。

    如果工作台镜像有多个可用的版本,请从 Version 选择 列表中选择要使用的工作台镜像版本。要使用最新的软件包版本,红帽建议您使用最近添加的镜像。

    注意

    在创建工作台后,您可以更改工作台镜像。

  9. Deployment size 部分中,从 Container size 列表中选择服务器的容器大小。容器大小指定分配给容器的 CPU 数量和分配给容器的内存量,为两者设置保证最小值(request)和最大值(limit)。
  10. 可选: 在 Environment variables 部分中,选择 并指定任何环境变量的值。

    在工作台配置期间设置环境变量可帮助您稍后节省时间,因为您不需要在笔记本的正文或使用 IDE 命令行界面定义它们。

    如果使用 S3 兼容存储,请添加这些推荐的环境变量:

    • AWS_ACCESS_KEY_ID 指定 Amazon Web Services 的 Access Key ID。
    • AWS_SECRET_ACCESS_KEY 指定在 AWS_ACCESS_KEY_ID 中指定的帐户的 Secret 访问密钥。

    如果在添加变量时选择 Secret,OpenShift AI 将凭证作为 Kubernetes secret 存储在受保护的命名空间中。

  11. Cluster storage 部分中,为您的工作台配置存储。选择以下选项之一:

    • 创建新的持久性存储 来创建在关闭工作台后保留的存储。完成相关字段以定义存储:

      1. 为集群存储输入一个名称
      2. 输入集群存储的描述
      3. 集群存储选择存储类

        注意

        在将集群存储添加到工作台后,您无法更改存储类。

      4. 持久性存储大小 下,以千兆字节或兆字节输入新大小。
    • 使用现有的持久性存储 来重复使用现有存储并从 Persistent storage 列表中选择存储。
  12. 可选:您可以在工作台中添加连接。连接是一个资源,其中包含连接到数据源或接收器(如对象存储桶)所需的配置参数。您可以使用存储存储桶来存储数据、型号和管道工件。您还可以使用连接来指定您要部署的模型的位置。

    Connections 部分中,使用现有连接或创建新连接:

    • 使用现有连接,如下所示:

      1. 单击 Attach existing connection
      2. Connection 列表中,选择一个您之前定义的连接。
    • 创建新连接,如下所示:

      1. Create connection。此时会出现 Add connection 对话框。
      2. Connection type 下拉列表中,选择连接的类型。此时会出现 Connection details 部分。
      3. 如果您在上一步中选择了 S3 兼容对象存储,请配置连接详情:

        1. Connection name 字段中输入连接的唯一名称。
        2. 可选:在 Description 字段中输入连接的描述。
        3. Access key 字段中,输入 S3 兼容对象存储供应商的访问密钥 ID。
        4. Secret key 字段中,为您指定的 S3 兼容对象存储帐户输入 secret 访问密钥。
        5. Endpoint 字段中,输入 S3 兼容对象存储桶的端点。
        6. Region 字段中,输入 S3 兼容对象存储帐户的默认区域。
        7. Bucket 字段中,输入 S3 兼容对象存储桶的名称。
        8. Create
      4. 如果上一步中选择了 URI,请配置连接详情:

        1. Connection name 字段中输入连接的唯一名称。
        2. 可选:在 Description 字段中输入连接的描述。
        3. URI 字段中,输入 Uniform Resource Identifier (URI)。
        4. Create
  13. Create workbench

验证

  • 您创建的工作台会出现在项目的 Workbenches 选项卡中。
  • 您在创建过程中与工作台关联的任何集群存储都会出现在项目的 Cluster storage 选项卡中。
  • 当工作台服务器启动时,Workbenches 选项卡上的 Status 列会显示 Starting 状态,并在工作台成功启动时显示 Running
  • 可选:点击 Open 链接在新窗口中打开 IDE。

您可以从本地存储将现有笔记本加载到 code-server 中,以继续工作,或为新用例调整项目。

先决条件

  • 您有一个正在运行的 code-server workbench。
  • 本地存储中有一个笔记本文件。

流程

  1. 在 code-server 窗口中,从活动栏中选择菜单图标( Menu icon ),→ FileOpen File
  2. Open File 对话框中,单击 Show Local 按钮。
  3. 找到并选择笔记本文件,然后单击 Open

    该文件显示在 code-server 窗口中。

  4. 保存文件,然后将更改推送到您的存储库。

验证

  • 笔记本文件会出现在 code-server Explorer 视图中。
  • 您可以在 code-server 窗口中打开笔记本文件。

3.2. 使用 Git 在 code-server 中协作工作台

如果您的笔记本或其他文件存储在 Git 版本控制中,您可以克隆 Git 存储库以便在 code-server 中使用它们。准备就绪后,您可以将您的更改推送回 Git 存储库,以便其他人可以查看或使用您的模型。

您可以使用 code-server 用户界面将 Git 存储库克隆到工作区,以继续工作或从外部项目集成文件。

先决条件

  • 您有一个正在运行的 code-server workbench。
  • 具有您要克隆的 Git 存储库的读取访问权限。

流程

  1. 复制 Git 存储库的 HTTPS URL。

    • 在 GitHub 中,点 HEKETI CodeHTTPS,然后点 Copy URL to clipboard 图标。
    • 在 GitLab 中,单击 Code,然后单击 Clone with HTTPS 下的 Copy URL 图标。
  2. 在 code-server 窗口中,从活动栏中选择菜单图标( Menu icon ),→ ViewCommandure
  3. 在 Command swig 中,输入 Git: Clone,然后从列表中选择 Git: Clone
  4. 粘贴包含笔记本的存储库的 HTTPS URL,然后按 Enter 键。
  5. 若有提示,请输入您的 Git 存储库的用户名和密码。
  6. 选择要将存储库克隆到的文件夹,然后单击 OK
  7. 克隆存储库时,会出现一个对话框,询问您是否要打开克隆的存储库。在对话框中点 Open

验证

  • 检查存储库的内容是否在 code-server Explorer 视图中可见,或者在终端中运行 ls 命令,以验证存储库是否显示为一个目录。

您可以使用命令行界面将 Git 存储库克隆到工作区,以继续工作或从外部项目集成文件。

先决条件

  • 您有一个正在运行的 code-server workbench。

流程

  1. 复制 Git 存储库的 HTTPS URL。

    • 在 GitHub 中,点 HEKETI CodeHTTPS,然后点 Copy URL to clipboard 图标。
    • 在 GitLab 中,单击 Code,然后单击 Clone with HTTPS 下的 Copy URL 图标。
  2. 在 code-server 窗口中,从 Activity Bar 中选择菜单图标( Menu icon ),→ TerminalNew Terminal 来打开终端窗口。
  3. 输入 git clone 命令:

    git clone <git-clone-URL>

    使用 HTTPS URL 替换 ,例如:

    $ git clone https://github.com/example/myrepo.git
    Cloning into myrepo...
    remote: Enumerating objects: 11, done.
    remote: Counting objects: 100% (11/11), done.
    remote: Compressing objects: 100% (10/10), done.
    remote: Total 2821 (delta 1), reused 5 (delta 1), pack-reused 2810
    Receiving objects: 100% (2821/2821), 39.17 MiB | 23.89 MiB/s, done.
    Resolving deltas: 100% (1416/1416), done.

验证

  • 检查存储库的内容是否在 code-server Explorer 视图中可见,或者在终端中运行 ls 命令,以验证存储库是否显示为一个目录。

您可以从远程 Git 存储库将其他用户所做的更改拉取到工作台中。

先决条件

  • 您已配置了远程 Git 存储库。
  • 您已将 Git 存储库导入到 code-server 中,存储库的内容在 code-server 中的 Explorer 视图中可见。
  • 有将文件从远程 Git 存储库拉取到本地存储库的权限。
  • 您有一个正在运行的 code-server workbench。

流程

  1. 在 code-server 窗口中,从活动栏中点 Source Control 图标( Source Control icon )。
  2. 单击 Views 和 More Actions 按钮(),然后选择 Pull

验证

  • 您可以在 Source Control 窗格中查看从远程存储库拉取的更改。

要在生产环境中构建和部署您的应用,请将您的工作上传到远程 Git 存储库。

先决条件

  • 您有一个正在运行的 code-server workbench。
  • 您已在 code-server 中添加了相关的 Git 存储库。
  • 有权限将更改推送到相关的 Git 存储库。
  • 已安装 Git 版本控制扩展。

流程

  1. 在 code-server 窗口中,从活动栏中选择菜单图标( Menu icon ),→ FileSave All 以保存任何未保存的更改。
  2. Source Control 图标( Source Control icon )打开 Source Control 窗格。
  3. 确认更改的文件显示在 更改 下。
  4. Changes 标题旁边,单击 Stage All Changes 按钮(+)。

    暂存的文件移到 Staged Changes 部分。

  5. Message 字段中输入您所做的更改的简短描述。
  6. Commit 按钮旁边,点 More Actions…​ 按钮,然后点 Commit & Sync
  7. 如有提示,输入您的 Git 凭据,然后单击确定

验证

  • 您最近推送的更改在远程 Git 存储库中可见。

3.3. 在 code-server 中管理 Python 软件包

在 code-server 中,您可以查看在工作台镜像上安装的 Python 软件包并安装额外的软件包。

您可以通过在终端窗口中运行 pip 工具来检查在工作台上安装了哪些 Python 软件包,以及您已有的软件包版本。

先决条件

  • 您有一个正在运行的 code-server workbench。

流程

  1. 在 code-server 窗口中,从 Activity Bar 中选择菜单图标( Menu icon ),→ TerminalNew Terminal 来打开终端窗口。
  2. 输入 pip list 命令。

    pip list

验证

  • 输出显示了所有已安装的 Python 软件包及其版本的字母顺序列表。例如,如果您在使用 Minimal 镜像创建笔记本服务器后立即使用 pip list 命令,则显示的第一个软件包类似如下:

    Package                  Version
    ------------------------ ----------
    asttokens                2.4.1
    boto3                    1.34.162
    botocore                 1.34.162
    cachetools               5.5.0
    certifi                  2024.8.30
    charset-normalizer       3.4.0
    comm                     0.2.2
    contourpy                1.3.0
    cycler                   0.12.1
    debugpy                  1.8.7

3.3.2. 在 code-server workbench 上安装 Python 软件包

您可以通过将软件包和版本添加到 requirements.txt 文件中,安装不是默认工作台镜像一部分的 Python 软件包,然后在终端窗口中运行 pip install 命令。

注意

虽然您可以直接安装软件包,但建议您使用一个 requirements.txt 文件,以便在不同的笔记本中轻松重复使用该文件中声明的软件包。

先决条件

  • 您有一个正在运行的 code-server workbench。

流程

  1. 在 code-server 窗口中,从活动栏中选择菜单图标( Menu icon ),→ FileNew Text File 来创建新的文本文件。
  2. 将要安装的软件包添加到 文本文件中。

    altair

    您可以使用 == (等于) 操作符指定要安装的确切版本,例如:

    altair==4.1.0
    注意

    红帽建议指定准确的软件包版本,以便随着时间的推移增强工作台的稳定性。在环境行为中,新的软件包版本可能会带来不必要的更改或意外更改。

    要同时安装多个软件包,请将每个软件包放在单独的行中。

  3. 将文本文件保存为 requirements.txt
  4. 在 Activity Bar 中,选择菜单图标( Menu icon ) ( Menu icon )终端 → Terminal 来打开终端窗口。
  5. 使用以下命令将 requirements.txt 中的软件包安装到您的服务器中:

    pip install -r requirements.txt
    重要

    pip install 命令会在您的工作台上安装软件包。但是,您必须运行 import 语句来在您的代码中使用软件包。

    import altair

验证

3.4. 使用 code-server 安装扩展

使用 code-server workbench 镜像,您可以使用扩展来自定义 code-server 环境,来添加新的语言、主题和调试器,并连接到其他服务。您还可以通过扩展来增强数据科学工作的效率,以实现语法高亮显示、自动缩进和括号匹配。

有关您可以使用 code-server 安装的第三方扩展的详情,请查看 Open VSX 注册表

先决条件

  • 已登陆到 Red Hat OpenShift AI。
  • 您已创建了具有 code-server 工作台的数据科学项目。

流程

  1. 在 OpenShift AI 仪表板中,点 Data Science Projects

    Data Science Projects 页面将打开。

  2. 点包含您要启动的 code-server workbench 的项目名称。

    此时会打开项目详情页面。

  3. 单击 Workbenches 选项卡。
  4. 如果您要使用的工作台的状态是 Running,请跳至下一步。

    如果工作台的状态为 Stopped,在工作台的 Status 列中点 Start

    当工作台服务器启动时,Status 列从 Stopped 改为 Starting,然后在工作台成功启动时变为 Running

  5. 点工作台旁边的 Open 链接。

    此时会打开 code-server 窗口。

  6. 在活动栏中,点 Extensions 图标( Extensions icon )。
  7. 搜索要安装的扩展名称。
  8. Install 将扩展添加到您的 code-server 环境中。

验证

  • Browser - Installed list on the Extensions 面板中,确认您安装的扩展已列出。

法律通告

Copyright © 2025 Red Hat, Inc.
The text of and illustrations in this document are licensed by Red Hat under a Creative Commons Attribution–Share Alike 3.0 Unported license ("CC-BY-SA"). An explanation of CC-BY-SA is available at http://creativecommons.org/licenses/by-sa/3.0/. In accordance with CC-BY-SA, if you distribute this document or an adaptation of it, you must provide the URL for the original version.
Red Hat, as the licensor of this document, waives the right to enforce, and agrees not to assert, Section 4d of CC-BY-SA to the fullest extent permitted by applicable law.
Red Hat, Red Hat Enterprise Linux, the Shadowman logo, the Red Hat logo, JBoss, OpenShift, Fedora, the Infinity logo, and RHCE are trademarks of Red Hat, Inc., registered in the United States and other countries.
Linux® is the registered trademark of Linus Torvalds in the United States and other countries.
Java® is a registered trademark of Oracle and/or its affiliates.
XFS® is a trademark of Silicon Graphics International Corp. or its subsidiaries in the United States and/or other countries.
MySQL® is a registered trademark of MySQL AB in the United States, the European Union and other countries.
Node.js® is an official trademark of Joyent. Red Hat is not formally related to or endorsed by the official Joyent Node.js open source or commercial project.
The OpenStack® Word Mark and OpenStack logo are either registered trademarks/service marks or trademarks/service marks of the OpenStack Foundation, in the United States and other countries and are used with the OpenStack Foundation's permission. We are not affiliated with, endorsed or sponsored by the OpenStack Foundation, or the OpenStack community.
All other trademarks are the property of their respective owners.
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2026 Red Hat
返回顶部