3.2. NIM モデルの NVIDIA NIM メトリクスの表示
OpenShift AI では、NVIDIA NIM モデルサービスプラットフォームにデプロイされた NIM モデルの次の NVIDIA NIM メトリクスを確認できます。
- GPU キャッシュ使用量の推移 (ミリ秒)
- 現在実行中、待機中、および最大のリクエスト数
- トークンの数
- 最初のトークンまでの時間
- 出力トークンあたりの時間
- リクエスト結果
これらのメトリクスの時間範囲と更新間隔を指定すると、指定した時間におけるピーク使用時間やモデルのパフォーマンスなどを判断するのに役立ちます。
前提条件
- NVIDIA NIM モデルサービングプラットフォームを有効にした。
- NVIDIA NIM モデルサービスプラットフォームに NIM モデルがデプロイされている。
- クラスター管理者がデプロイメントのメトリクス収集とグラフ生成を有効にした。
disableKServeMetricsOpenShift AI ダッシュボード設定オプションは、デフォルト値のfalseに設定されている。disableKServeMetrics: false
disableKServeMetrics: falseCopy to Clipboard Copied! Toggle word wrap Toggle overflow ダッシュボード設定オプションの設定に関する詳細は、ダッシュボードのカスタマイズ を参照してください。
手順
OpenShift AI ダッシュボードのナビゲーションメニューから、Data science projects をクリックします。
Data science projects のページが開きます。
- 監視する NIM モデルを含むプロジェクトの名前をクリックします。
- プロジェクトの詳細ページで、Models タブをクリックします。
- 確認する NIM モデルをクリックします。
NIM Metrics タブで、以下のオプションを設定します。
- 時間範囲 - メトリクスを追跡する期間を指定します。1 時間、24 時間、7 日、30 日のいずれかの値を選択できます。
- 更新間隔 - (最新のデータを表示するために) メトリクスページのグラフを更新する頻度を指定します。15 秒、30 秒、1 分、5 分、15 分、30 分、1 時間、2 時間、1 日の値のいずれかを選択できます。
- NIM メトリクスのデータグラフを表示するには、下にスクロールします。
検証
NIM メトリクス タブには、デプロイされた NIM モデルの NIM メトリクスのグラフが表示されます。