7.2. IBM Power 上的 IBM Spyre AI Accelerators 的 inference 服务配置示例
以下示例描述了 IBM Spyre AI Accelerators 和 IBM Power 上的常见红帽 AI Inference 服务器工作负载。
- 实体提取
使用
lspci命令的输出选择一个 Spyre 卡 ID,例如:SPYRE_IDS="0381:50:00.0"
$ SPYRE_IDS="0381:50:00.0"Copy to Clipboard Copied! Toggle word wrap Toggle overflow Podman 实体提取示例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - RAG inference service
使用
lspci命令的输出选择 4 个 Spyre 卡 ID,例如:SPYRE_IDS="0381:50:00.0 0382:60:00.0 0383:70:00.0 0384:80:00.0"
$ SPYRE_IDS="0381:50:00.0 0382:60:00.0 0383:70:00.0 0384:80:00.0"Copy to Clipboard Copied! Toggle word wrap Toggle overflow podman RAG inference 服务示例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - RAG 嵌入
使用
lspci命令的输出选择一个 Spyre 卡 ID,例如:SPYRE_IDS="0384:80:00.0"
$ SPYRE_IDS="0384:80:00.0"Copy to Clipboard Copied! Toggle word wrap Toggle overflow Podman RAG 嵌入 inference 服务示例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - re-ranker inference service
使用
lspci命令的输出选择一个 Spyre AI Accelerator 卡 ID,例如:SPYRE_IDS="0384:80:00.0"
$ SPYRE_IDS="0384:80:00.0"Copy to Clipboard Copied! Toggle word wrap Toggle overflow podman re-ranker inference 服务示例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow