在数据科学 IDE 中使用
通过 Red Hat OpenShift AI Self-Managed 在数据科学 IDE 中工作
摘要
前言 复制链接链接已复制到粘贴板!
在 Red Hat OpenShift AI 中,在创建工作台时,您可以选择一个工作台镜像,其中包含用于开发机器学习(ML)模型的集成开发环境(IDE)。
OpenShift AI 支持以下数据科学 IDE 以开发 ML 模型:
- JupyterLab
- code-server
RStudio 服务器(技术预览功能)
注意RStudio workbench 镜像目前在断开连接的环境中不可用。
有关 RStudio 服务器的详情,请参考 发行注记。
第 1 章 访问工作台 IDE 复制链接链接已复制到粘贴板!
要访问工作台 IDE,请使用 OpenShift AI 接口中提供的链接。
前提条件
- 您已创建了数据科学项目和一个工作台。
流程
- 在 OpenShift AI 仪表板中,点 Data Science Projects。
- 点包含工作台的项目的名称。
- 单击 Workbenches 选项卡。
如果工作台的状态为 Running,请跳至下一步。
如果工作台的状态为 Stopped,在工作台的 Status 列中点 Start。
当工作台服务器启动时,Status 列从 Stopped 改为 Starting,然后在工作台成功启动时变为 Running。
- 点工作台旁边的 Open 链接。
验证
- 为工作台 IDE 打开一个新浏览器窗口。
第 2 章 在 JupyterLab 中工作 复制链接链接已复制到粘贴板!
JupyterLab 是一个基于 web 的互动开发环境,用于 Jupyter 笔记本、代码和数据。您可以在数据科学和机器学习中配置和安排工作流。JupyterLab 是一个开源 Web 应用程序,支持超过 40 种编程语言,包括 Python 和 R。
2.1. 创建并导入笔记本 复制链接链接已复制到粘贴板!
您可以创建一个空白笔记本,或者从几个不同的源导入 JupyterLab 中的笔记本。
2.1.1. 创建新笔记本 复制链接链接已复制到粘贴板!
您可以从现有笔记本容器镜像创建一个新的 Jupyter 笔记本,以访问其资源和属性。笔记本服务器控制面板包含可用容器镜像的列表,您可以作为单用户笔记本服务器运行。
先决条件
- 确保您已登录到 Red Hat OpenShift AI。
- 确保您已启动了笔记本服务器并登录到 JupyterLab。
- 笔记本镜像存在于 registry、镜像流中,并可访问。
流程
- 点 File → New → Notebook。
如果出现提示,请从列表中为您的笔记本选择一个内核。
如果要使用内核,点 Select。如果您不想使用内核,点 No Kernel。
验证
- 检查笔记本文件是否在 JupyterLab 接口中看到。
2.1.2. 从本地存储上传现有的笔记本文件到 JupyterLab 复制链接链接已复制到粘贴板!
您可以从本地存储将现有笔记本加载到 JupyterLab 中,以继续工作,或针对新的用例调整项目。
先决条件
- 用于登录到 JupyterLab 的凭证。
- 启动并运行 Jupyter 笔记本服务器。
- 本地存储中存在笔记本文件。
流程
-
在 JupyterLab 界面左侧边栏的 文件浏览器中,点 Upload Files (
)。
找到并选择笔记本文件,然后单击 Open。
文件显示在文件浏览器中。
验证
- 笔记本文件会出现在 JupyterLab 界面左侧边栏的 File Browser 中。
- 您可以在 JupyterLab 中打开笔记本文件。
2.2. 使用 Git 协作笔记本 复制链接链接已复制到粘贴板!
如果您的笔记本或其他文件存储在 Git 版本控制中,您可以克隆 Git 存储库以便在 JupyterLab 中使用它们。准备就绪后,您可以将您的更改推送回 Git 存储库,以便其他人可以查看或使用您的模型。
2.2.1. 使用 JupyterLab 从 Git 存储库上传现有的笔记本文件 复制链接链接已复制到粘贴板!
您可以使用 JupyterLab 用户界面将 Git 存储库克隆到工作区,以继续您的工作或从外部项目集成文件。
先决条件
- 启动并运行 Jupyter 笔记本服务器。
- 要克隆的 Git 存储库的读取访问权限。
流程
复制 Git 存储库的 HTTPS URL。
- 在 GitHub 中,点 HEKETI Code → HTTPS,然后点 Copy URL to clipboard 图标。
- 在 GitLab 中,单击 Code,然后单击 Clone with HTTPS 下的 Copy URL 图标。
在 JupyterLab 界面中,点 Git Clone 按钮(
)。
您还可以在菜单中点击 Git → Clone a repository,或者点击 Git 图标(
)并点 Clone a repository 按钮。
此时会显示克隆存储库对话框。
- 输入包含笔记本的存储库的 HTTPS URL。
- 点 CLONE。
- 若有提示,请输入您的 Git 存储库的用户名和密码。
验证
-
检查存储库的内容是否在 JupyterLab 中的文件浏览器中看到,或者在终端中运行
ls命令,以验证存储库是否显示为一个目录。
2.2.2. 使用 CLI 将现有笔记本文件从 Git 存储库上传到 JupyterLab 复制链接链接已复制到粘贴板!
您可以使用命令行界面将 Git 存储库克隆到工作区,以继续工作或从外部项目集成文件。
先决条件
- 启动并运行 Jupyter 笔记本服务器。
流程
复制 Git 存储库的 HTTPS URL。
- 在 GitHub 中,点 HEKETI Code → HTTPS,然后点 Copy URL to clipboard 图标。
- 在 GitLab 中,单击 Code,然后单击 Clone with HTTPS 下的 Copy URL 图标。
- 在 JupyterLab 中,点 File → New → Terminal 打开终端窗口。
输入
git clone命令:git clone <git-clone-URL>将
git-clone-URL> 替换为 HTTPS URL,例如:[1234567890@jupyter-nb-jdoe ~]$ git clone https://github.com/example/myrepo.git Cloning into myrepo... remote: Enumerating objects: 11, done. remote: Counting objects: 100% (11/11), done. remote: Compressing objects: 100% (10/10), done. remote: Total 2821 (delta 1), reused 5 (delta 1), pack-reused 2810 Receiving objects: 100% (2821/2821), 39.17 MiB | 23.89 MiB/s, done. Resolving deltas: 100% (1416/1416), done.
验证
-
检查存储库的内容是否在 JupyterLab 中的文件浏览器中看到,或者在终端中运行
ls命令,以验证存储库是否显示为一个目录。
2.2.3. 使用远程 Git 存储库中的更改更新项目 复制链接链接已复制到粘贴板!
您可以从远程 Git 存储库将其他用户所做的更改拉取到您的 data science 项目中。
先决条件
- 您已配置了远程 Git 存储库。
- 您已将 Git 存储库导入到 JupyterLab,存储库的内容在 JupyterLab 中的文件浏览器中可见。
- 有将文件从远程 Git 存储库拉取到本地存储库的权限。
- 您有登录 Jupyter 的凭证。
- 您有一个启动并运行 Jupyter 服务器。
流程
-
在 JupyterLab 界面中,点 Git 按钮(
)。
-
点 Pull latest changes 按钮(
)。
验证
- 您可以在 Git 窗格中的 History 选项卡中查看从远程存储库拉取的更改。
2.2.4. 将项目更改推送到 Git 存储库 复制链接链接已复制到粘贴板!
要在生产环境中构建和部署您的应用,请将您的工作上传到远程 Git 存储库。
先决条件
- 您已在 JupyterLab 界面中打开了笔记本。
- 您已在笔记本服务器中添加了相关的 Git 存储库。
- 有权限将更改推送到相关的 Git 存储库。
- 已安装 Git 版本控制扩展。
流程
- 点 File → Save All 保存任何未保存的更改。
-
点击 Git 图标(
)在 JupyterLab 界面中打开 Git 窗格。
确认更改的文件显示在 Changed 下。
如果您的更改的文件出现在 Untracked 中,请点击 Git → Simple Staging 以启用简化的 Git 进程。
提交您的更改。
- 确保 Changed 下的所有文件都有一个蓝色复选标记。
- 在 Summary 字段中输入您所做的更改的简短描述。
- 点 Commit。
- 点 Git → Push to Remote 将您的更改推送到远程存储库。
- 出现提示时,输入您的 Git 凭据,再单击 OK。
验证
- 您最近推送的更改在远程 Git 存储库中可见。
2.3. 管理 Python 软件包 复制链接链接已复制到粘贴板!
在 JupyterLab 中,您可以查看在 notebook 镜像上安装的 Python 软件包并安装额外的软件包。
2.3.1. 查看在笔记本服务器中安装的 Python 软件包 复制链接链接已复制到粘贴板!
您可以通过在笔记本电脑单元中运行 pip 工具来检查在笔记本电脑服务器上安装了哪些 Python 软件包以及您已有的软件包版本。
先决条件
- 登录 JupyterLab 并打开一个笔记本。
流程
在笔记本中输入以下内容:
!pip list- 运行单元。
验证
输出显示了所有已安装的 Python 软件包及其版本的字母顺序列表。例如,如果您在使用 Minimal 镜像创建笔记本服务器后立即使用
pip list命令,则显示的第一个软件包类似如下:Package Version --------------------------------- ---------- aiohttp 3.7.3 alembic 1.5.2 appdirs 1.4.4 argo-workflows 3.6.1 argon2-cffi 20.1.0 async-generator 1.10 async-timeout 3.0.1 attrdict 2.0.1 attrs 20.3.0 backcall 0.2.0
2.3.2. 在笔记本服务器中安装 Python 软件包 复制链接链接已复制到粘贴板!
您可以通过将软件包和版本添加到 requirements.txt 文件中,安装不是默认笔记本服务器一部分的 Python 软件包,然后在笔记本单元中运行 pip install 命令。
虽然您可以直接安装软件包,但建议您使用一个 requirements.txt 文件,以便在不同的笔记本中轻松重复使用该文件中声明的软件包。
先决条件
- 登录 JupyterLab 并打开一个笔记本。
流程
使用以下方法之一创建新文本文件:
- 单击 + 以打开新启动程序,然后单击 文本文件。
- 点 File → New → Text File。
将文本文件重命名为
requirements.txt。- 右键单击文件的名称,然后单击 重命名文本。此时会打开 Rename File 对话框。
-
在 New Name 字段中输入
requirements.txt,然后单击 Rename。
将要安装的软件包添加到
requirements.txt文件中。altair您可以使用
==(等于) 操作符指定要安装的确切版本,例如:altair==4.1.0注意红帽建议指定准确的软件包版本,以便随着时间的推移增强笔记本服务器的稳定性。在环境行为中,新的软件包版本可能会带来不必要的更改或意外更改。
要同时安装多个软件包,请将每个软件包放在单独的行中。
使用笔记本单元将
requirements.txt中的软件包安装到您的服务器中。在笔记本中创建新单元并输入以下命令:
!pip install -r requirements.txt- 按 Shift 和 Enter 运行单元。
重要pip install命令在笔记本服务器上安装软件包。但是,您必须在代码单元中运行import语句,才能在您的代码中使用软件包。import altair
验证
-
确认
requirements.txt文件中的软件包显示在笔记本服务器上安装的软件包列表中。详情请参阅笔记本服务器上安装的 Python 软件包。
2.4. 对 Jupyter 中的常见问题进行故障排除 复制链接链接已复制到粘贴板!
如果您在与 Jupyter、笔记本电脑或笔记本服务器相关的 Red Hat OpenShift AI 中看到错误,请阅读本节以了解可能导致此问题的内容。
如果您无法在此处或发行注记中看到您的问题,请联系红帽支持。
- 当登录到 Jupyter 时,看到 403: Forbidden 错误
问题
如果您的集群管理员配置了 OpenShift AI 用户组,您的用户名可能不会添加到默认用户组或 OpenShift AI 的默认管理员组中。
解决方案
Contact your cluster administrator so that they can add you to the correct group/s.- 我的笔记本服务器没有启动
问题
托管您的笔记本服务器的 OpenShift 集群可能无法访问充足的资源,或者 Jupyter pod 可能出现问题。
解决方案
检查 OpenShift 中的 Events 部分中的日志,以了解与问题相关的错误消息。例如:
Server requested 2021-10-28T13:31:29.830991Z [Warning] 0/7 nodes are available: 2 Insufficient memory, 2 node(s) had taint {node-role.kubernetes.io/infra: }, that the pod didn't tolerate, 3 node(s) had taint {node-role.kubernetes.io/master: }, that the pod didn't tolerate.请联络您的集群管理员,了解任何相关错误消息的详细信息,以便他们可以执行进一步的检查。
- 在运行我的笔记本时遇到一个 database or disk is full 错误或一个 no space left on device 错误
问题
您可能会在笔记本服务器上耗尽存储空间。
解决方案
请联络您的集群管理员,以便他们可以执行进一步的检查。
第 3 章 在 code-server 中工作 复制链接链接已复制到粘贴板!
code-server 是一个基于 Web 的交互式开发环境,支持多种编程语言,包括 Python,用于使用 Jupyter 笔记本。使用 code-server workbench 镜像,您可以使用各种扩展来自定义工作台环境来满足您的需求,以添加新的语言、主题、调试器并连接到其他服务。如需更多信息,请参阅 GitHub 中的 code-server。
基于 Elyra 的管道不适用于 code-server workbench 镜像。
3.1. 创建 code-server workbenches 复制链接链接已复制到粘贴板!
您可以创建一个空白 Jupyter 笔记本,或者从几个不同的源在 code-server 中导入 Jupyter 笔记本。
3.1.1. 创建工作台 复制链接链接已复制到粘贴板!
当您创建工作台时,您可以指定一个镜像(IDE、软件包和其他依赖项)。您还可以配置连接、集群存储并添加容器存储。
先决条件
- 您已登陆到 Red Hat OpenShift AI。
-
如果使用 OpenShift AI 组,则作为 OpenShift 中的用户组或 admin 组(如
rhoai-users或rhoai-admins)的一部分。 - 您创建了一个项目。
如果您在 Red Hat OpenShift AI 之外创建了 Simple Storage Service (S3)帐户,并希望创建到现有 S3 存储桶的连接,则具有存储存储桶的以下凭证信息:
- 端点 URL
- access key
- Secret 密钥
- 区域
- bucket 名称
如需更多信息,请参阅在 S3 兼容对象存储中使用数据。
流程
在 OpenShift AI 仪表板中,点 Data Science Projects。
Data Science Projects 页面将打开。
点您要将工作台添加到的项目的名称。
此时会打开项目详情页面。
- 单击 Workbenches 选项卡。
点 Create workbench。
Create workbench 页面将打开。
- 在 Name 字段中输入工作台的唯一名称。
可选:如果要更改工作台的默认资源名称,点 Edit resource name。
资源名称是您在 OpenShift 中标记的资源。有效字符包括小写字母、数字和连字符(-)。资源名称不能超过 30 个字符,它必须以字母或数字开头,并以字母或数字结尾。
注: 您无法在创建工作台后更改资源名称。您只能编辑显示名称和描述。
- 可选:在 Description 字段中输入工作台的描述。
在 Notebook image 部分,完成字段以指定要与工作台搭配使用的工作台镜像。
从 Image selection 列表中,选择一个适合您用例的工作台镜像。工作台镜像包含 IDE 和 Python 软件包(可重复利用的代码)。(可选)点击 View package information 查看包含在您选择的镜像中的软件包列表。
如果工作台镜像有多个可用的版本,请从 Version 选择 列表中选择要使用的工作台镜像版本。要使用最新的软件包版本,红帽建议您使用最近添加的镜像。
注意在创建工作台后,您可以更改工作台镜像。
- 在 Deployment size 部分中,从 Container size 列表中选择服务器的容器大小。容器大小指定分配给容器的 CPU 数量和分配给容器的内存量,为两者设置保证最小值(request)和最大值(limit)。
可选: 在 Environment variables 部分中,选择 并指定任何环境变量的值。
在工作台配置期间设置环境变量可帮助您稍后节省时间,因为您不需要在笔记本的正文或使用 IDE 命令行界面定义它们。
如果使用 S3 兼容存储,请添加这些推荐的环境变量:
-
AWS_ACCESS_KEY_ID指定 Amazon Web Services 的 Access Key ID。 -
AWS_SECRET_ACCESS_KEY指定在AWS_ACCESS_KEY_ID中指定的帐户的 Secret 访问密钥。
如果在添加变量时选择 Secret,OpenShift AI 将凭证作为 Kubernetes secret 存储在受保护的命名空间中。
-
在 Cluster storage 部分中,为您的工作台配置存储。选择以下选项之一:
创建新的持久性存储 来创建在关闭工作台后保留的存储。完成相关字段以定义存储:
- 为集群存储输入一个名称。
- 输入集群存储的描述。
为 集群存储选择存储类。
注意在将集群存储添加到工作台后,您无法更改存储类。
- 在 持久性存储大小 下,以千兆字节或兆字节输入新大小。
- 使用现有的持久性存储 来重复使用现有存储并从 Persistent storage 列表中选择存储。
可选:您可以在工作台中添加连接。连接是一个资源,其中包含连接到数据源或接收器(如对象存储桶)所需的配置参数。您可以使用存储存储桶来存储数据、型号和管道工件。您还可以使用连接来指定您要部署的模型的位置。
在 Connections 部分中,使用现有连接或创建新连接:
使用现有连接,如下所示:
- 单击 Attach existing connection。
- 从 Connection 列表中,选择一个您之前定义的连接。
创建新连接,如下所示:
- 点 Create connection。此时会出现 Add connection 对话框。
- 从 Connection type 下拉列表中,选择连接的类型。此时会出现 Connection details 部分。
如果您在上一步中选择了 S3 兼容对象存储,请配置连接详情:
- 在 Connection name 字段中输入连接的唯一名称。
- 可选:在 Description 字段中输入连接的描述。
- 在 Access key 字段中,输入 S3 兼容对象存储供应商的访问密钥 ID。
- 在 Secret key 字段中,为您指定的 S3 兼容对象存储帐户输入 secret 访问密钥。
- 在 Endpoint 字段中,输入 S3 兼容对象存储桶的端点。
- 在 Region 字段中,输入 S3 兼容对象存储帐户的默认区域。
- 在 Bucket 字段中,输入 S3 兼容对象存储桶的名称。
- 点 Create。
如果上一步中选择了 URI,请配置连接详情:
- 在 Connection name 字段中输入连接的唯一名称。
- 可选:在 Description 字段中输入连接的描述。
- 在 URI 字段中,输入 Uniform Resource Identifier (URI)。
- 点 Create。
- 点 Create workbench。
验证
- 您创建的工作台会出现在项目的 Workbenches 选项卡中。
- 您在创建过程中与工作台关联的任何集群存储都会出现在项目的 Cluster storage 选项卡中。
- 当工作台服务器启动时,Workbenches 选项卡上的 Status 列会显示 Starting 状态,并在工作台成功启动时显示 Running。
- 可选:点击 Open 链接在新窗口中打开 IDE。
3.1.2. 从本地存储上传现有的笔记本文件到 code-server 复制链接链接已复制到粘贴板!
您可以从本地存储将现有笔记本加载到 code-server 中,以继续工作,或为新用例调整项目。
先决条件
- 您有一个正在运行的 code-server workbench。
- 本地存储中有一个笔记本文件。
流程
-
在 code-server 窗口中,从活动栏中选择菜单图标(
),→ File → Open File。
- 在 Open File 对话框中,单击 Show Local 按钮。
找到并选择笔记本文件,然后单击 Open。
该文件显示在 code-server 窗口中。
- 保存文件,然后将更改推送到您的存储库。
验证
- 笔记本文件会出现在 code-server Explorer 视图中。
- 您可以在 code-server 窗口中打开笔记本文件。
3.2. 使用 Git 在 code-server 中协作工作台 复制链接链接已复制到粘贴板!
如果您的笔记本或其他文件存储在 Git 版本控制中,您可以克隆 Git 存储库以便在 code-server 中使用它们。准备就绪后,您可以将您的更改推送回 Git 存储库,以便其他人可以查看或使用您的模型。
3.2.1. 使用 code-server 从 Git 存储库上传现有的笔记本文件 复制链接链接已复制到粘贴板!
您可以使用 code-server 用户界面将 Git 存储库克隆到工作区,以继续工作或从外部项目集成文件。
先决条件
- 您有一个正在运行的 code-server workbench。
- 具有您要克隆的 Git 存储库的读取访问权限。
流程
复制 Git 存储库的 HTTPS URL。
- 在 GitHub 中,点 HEKETI Code → HTTPS,然后点 Copy URL to clipboard 图标。
- 在 GitLab 中,单击 Code,然后单击 Clone with HTTPS 下的 Copy URL 图标。
-
在 code-server 窗口中,从活动栏中选择菜单图标(
),→ View → Commandure。
-
在 Command swig 中,输入
Git: Clone,然后从列表中选择Git: Clone。 - 粘贴包含笔记本的存储库的 HTTPS URL,然后按 Enter 键。
- 若有提示,请输入您的 Git 存储库的用户名和密码。
- 选择要将存储库克隆到的文件夹,然后单击 OK。
- 克隆存储库时,会出现一个对话框,询问您是否要打开克隆的存储库。在对话框中点 Open。
验证
-
检查存储库的内容是否在 code-server Explorer 视图中可见,或者在终端中运行
ls命令,以验证存储库是否显示为一个目录。
3.2.2. 使用 CLI 将现有笔记本文件从 Git 存储库上传到 code-server 复制链接链接已复制到粘贴板!
您可以使用命令行界面将 Git 存储库克隆到工作区,以继续工作或从外部项目集成文件。
先决条件
- 您有一个正在运行的 code-server workbench。
流程
复制 Git 存储库的 HTTPS URL。
- 在 GitHub 中,点 HEKETI Code → HTTPS,然后点 Copy URL to clipboard 图标。
- 在 GitLab 中,单击 Code,然后单击 Clone with HTTPS 下的 Copy URL 图标。
-
在 code-server 窗口中,从 Activity Bar 中选择菜单图标(
),→ Terminal → New Terminal 来打开终端窗口。
输入
git clone命令:git clone <git-clone-URL>使用 HTTPS URL 替换
,例如:$ git clone https://github.com/example/myrepo.git Cloning into myrepo... remote: Enumerating objects: 11, done. remote: Counting objects: 100% (11/11), done. remote: Compressing objects: 100% (10/10), done. remote: Total 2821 (delta 1), reused 5 (delta 1), pack-reused 2810 Receiving objects: 100% (2821/2821), 39.17 MiB | 23.89 MiB/s, done. Resolving deltas: 100% (1416/1416), done.
验证
-
检查存储库的内容是否在 code-server Explorer 视图中可见,或者在终端中运行
ls命令,以验证存储库是否显示为一个目录。
3.2.3. 使用远程 Git 存储库中的更改更新 code-server 中的项目 复制链接链接已复制到粘贴板!
您可以从远程 Git 存储库将其他用户所做的更改拉取到工作台中。
先决条件
- 您已配置了远程 Git 存储库。
- 您已将 Git 存储库导入到 code-server 中,存储库的内容在 code-server 中的 Explorer 视图中可见。
- 有将文件从远程 Git 存储库拉取到本地存储库的权限。
- 您有一个正在运行的 code-server workbench。
流程
-
在 code-server 窗口中,从活动栏中点 Source Control 图标(
)。
- 单击 Views 和 More Actions 按钮(…),然后选择 Pull。
验证
- 您可以在 Source Control 窗格中查看从远程存储库拉取的更改。
3.2.4. 将 code-server 中的项目更改推送到 Git 存储库 复制链接链接已复制到粘贴板!
要在生产环境中构建和部署您的应用,请将您的工作上传到远程 Git 存储库。
先决条件
- 您有一个正在运行的 code-server workbench。
- 您已在 code-server 中添加了相关的 Git 存储库。
- 有权限将更改推送到相关的 Git 存储库。
- 已安装 Git 版本控制扩展。
流程
-
在 code-server 窗口中,从活动栏中选择菜单图标(
),→ File → Save All 以保存任何未保存的更改。
-
点 Source Control 图标(
)打开 Source Control 窗格。
- 确认更改的文件显示在 更改 下。
在 Changes 标题旁边,单击 Stage All Changes 按钮(+)。
暂存的文件移到 Staged Changes 部分。
- 在 Message 字段中输入您所做的更改的简短描述。
- 在 Commit 按钮旁边,点 More Actions… 按钮,然后点 Commit & Sync。
- 如有提示,输入您的 Git 凭据,然后单击确定。
验证
- 您最近推送的更改在远程 Git 存储库中可见。
3.3. 在 code-server 中管理 Python 软件包 复制链接链接已复制到粘贴板!
在 code-server 中,您可以查看在工作台镜像上安装的 Python 软件包并安装额外的软件包。
3.3.1. 查看在 code-server workbench 上安装的 Python 软件包 复制链接链接已复制到粘贴板!
您可以通过在终端窗口中运行 pip 工具来检查在工作台上安装了哪些 Python 软件包,以及您已有的软件包版本。
先决条件
- 您有一个正在运行的 code-server workbench。
流程
-
在 code-server 窗口中,从 Activity Bar 中选择菜单图标(
),→ Terminal → New Terminal 来打开终端窗口。
输入
pip list命令。pip list
验证
输出显示了所有已安装的 Python 软件包及其版本的字母顺序列表。例如,如果您在使用 Minimal 镜像创建笔记本服务器后立即使用
pip list命令,则显示的第一个软件包类似如下:Package Version ------------------------ ---------- asttokens 2.4.1 boto3 1.34.162 botocore 1.34.162 cachetools 5.5.0 certifi 2024.8.30 charset-normalizer 3.4.0 comm 0.2.2 contourpy 1.3.0 cycler 0.12.1 debugpy 1.8.7
3.3.2. 在 code-server workbench 上安装 Python 软件包 复制链接链接已复制到粘贴板!
您可以通过将软件包和版本添加到 requirements.txt 文件中,安装不是默认工作台镜像一部分的 Python 软件包,然后在终端窗口中运行 pip install 命令。
虽然您可以直接安装软件包,但建议您使用一个 requirements.txt 文件,以便在不同的笔记本中轻松重复使用该文件中声明的软件包。
先决条件
- 您有一个正在运行的 code-server workbench。
流程
-
在 code-server 窗口中,从活动栏中选择菜单图标(
),→ File → New Text File 来创建新的文本文件。
将要安装的软件包添加到 文本文件中。
altair您可以使用
==(等于) 操作符指定要安装的确切版本,例如:altair==4.1.0注意红帽建议指定准确的软件包版本,以便随着时间的推移增强工作台的稳定性。在环境行为中,新的软件包版本可能会带来不必要的更改或意外更改。
要同时安装多个软件包,请将每个软件包放在单独的行中。
-
将文本文件保存为
requirements.txt。 -
在 Activity Bar 中,选择菜单图标(
) (
)终端 → Terminal 来打开终端窗口。
使用以下命令将
requirements.txt中的软件包安装到您的服务器中:pip install -r requirements.txt重要pip install命令会在您的工作台上安装软件包。但是,您必须运行import语句来在您的代码中使用软件包。import altair
验证
-
确认
requirements.txt文件中的软件包出现在工作台上安装的软件包列表中。详情请参阅您的 code-server workbench 上安装的 Python 软件包。
3.4. 使用 code-server 安装扩展 复制链接链接已复制到粘贴板!
使用 code-server workbench 镜像,您可以使用扩展来自定义 code-server 环境,来添加新的语言、主题和调试器,并连接到其他服务。您还可以通过扩展来增强数据科学工作的效率,以实现语法高亮显示、自动缩进和括号匹配。
有关您可以使用 code-server 安装的第三方扩展的详情,请查看 Open VSX 注册表。
先决条件
- 已登陆到 Red Hat OpenShift AI。
- 您已创建了具有 code-server 工作台的数据科学项目。
流程
在 OpenShift AI 仪表板中,点 Data Science Projects。
Data Science Projects 页面将打开。
点包含您要启动的 code-server workbench 的项目名称。
此时会打开项目详情页面。
- 单击 Workbenches 选项卡。
如果您要使用的工作台的状态是 Running,请跳至下一步。
如果工作台的状态为 Stopped,在工作台的 Status 列中点 Start。
当工作台服务器启动时,Status 列从 Stopped 改为 Starting,然后在工作台成功启动时变为 Running。
点工作台旁边的 Open 链接。
此时会打开 code-server 窗口。
-
在活动栏中,点 Extensions 图标(
)。
- 搜索要安装的扩展名称。
- 点 Install 将扩展添加到您的 code-server 环境中。
验证
- 在 Browser - Installed list on the Extensions 面板中,确认您安装的扩展已列出。