7.2. IBM Power 上の IBM Spyre AI アクセラレーターの推論提供設定の例
次の例は、IBM Spyre AI アクセラレーターと IBM Power 上の一般的な Red Hat AI 推論サーバーのワークロードを示しています。
- エンティティー抽出
lspciコマンドの出力が含まれる Spyre カード ID を 1 つ選択します。以下に例を示します。SPYRE_IDS="0381:50:00.0"
$ SPYRE_IDS="0381:50:00.0"Copy to Clipboard Copied! Toggle word wrap Toggle overflow Podman エンティティー抽出の例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - RAG の推論提供
lspciコマンドの出力で、4 Spyre カード ID を選択します。以下に例を示します。SPYRE_IDS="0381:50:00.0 0382:60:00.0 0383:70:00.0 0384:80:00.0"
$ SPYRE_IDS="0381:50:00.0 0382:60:00.0 0383:70:00.0 0384:80:00.0"Copy to Clipboard Copied! Toggle word wrap Toggle overflow Podman RAG inference serving example
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - RAG 埋め込み
lspciコマンドの出力が含まれる Spyre カード ID を 1 つ選択します。以下に例を示します。SPYRE_IDS="0384:80:00.0"
$ SPYRE_IDS="0384:80:00.0"Copy to Clipboard Copied! Toggle word wrap Toggle overflow Podman RAG 埋め込み会議の例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - Re-ranker inference serving
lspciコマンドの出力が含まれる Spyre AI アクセラレーターカード ID を 1 つ選択します。以下に例を示します。SPYRE_IDS="0384:80:00.0"
$ SPYRE_IDS="0384:80:00.0"Copy to Clipboard Copied! Toggle word wrap Toggle overflow Podman re-ranker inference serving の例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow