7.4. オペレーティングシステムの問題のトラブルシューティング
OpenShift Container Platform は RHCOS で実行されます。以下の手順に従って、オペレーティングシステムに関連する問題のトラブルシューティングを行うことができます。
7.4.1. カーネルクラッシュの調査 リンクのコピーリンクがクリップボードにコピーされました!
kexec-tools に含まれる kdump サービスは、クラッシュダンプのメカニズムを提供します。このサービスを使用して、後の分析用にシステムのメモリーの内容を保存できます。
kdump サービスはテクノロジープレビュー機能としてのみご利用いただけます。テクノロジープレビュー機能は、Red Hat 製品のサービスレベルアグリーメント (SLA) の対象外であり、機能的に完全ではないことがあります。Red Hat は実稼働環境でこれらを使用することを推奨していません。テクノロジープレビュー機能は、最新の製品機能をいち早く提供することで、お客様による開発段階での機能テストの実施とフィードバックのご提供を可能にすることを目的としています。
Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲 を参照してください。
7.4.1.1. kdump の有効化 リンクのコピーリンクがクリップボードにコピーされました!
RHCOS には kexec-tools が同梱されていますが、kdump を有効にするには手動の設定が必要になります。
手順
RHCOS で kdump を有効にするには、以下の手順を実行します。
初回のカーネルの起動時にクラッシュカーネルのメモリーを確保するには、以下のコマンドを入力してカーネル引数を指定します。
# rpm-ostree kargs --append='crashkernel=256M'オプション: デフォルトのローカルの
/var/crashの場所ではなく、ネットワーク経由または他の場所にクラッシュダンプを書き込むには、/etc/kdump.conf設定ファイルを編集します。注記LUKS を使用する場合は、ネットワークダンプが必要です。
kdumpは、LUKS で暗号化されたデバイスのローカルクラッシュダンプをサポートしません。kdumpサービスの設定についての詳細は、/etc/sysconfig/kdump、/etc/kdump.conf、およびkdump.confmanual ページのコメントを参照してください。ダンプターゲットの設定についての詳細は、RHELkdumpのドキュメント を参照してください。kdumpsystemd サービスを有効にします。# systemctl enable kdump.serviceシステムをリブートします。
# systemctl reboot-
kdump.serviceが正常に起動および終了し、cat /sys/kernel/kexec_crash_loadedが1を出力することを確認して、kdumpがクラッシュカーネルを読み込んでいることを確認します。
7.4.1.2. Day-1 の kdump の有効化 リンクのコピーリンクがクリップボードにコピーされました!
kdump サービスは、カーネルの問題をデバッグするために、ノードごとに有効にすることが意図されています。kdump を有効にすることに関するコストがあり、これらのコストは kdump が有効にされたノードを追加するたびに増えるため、kdump を必要な場合にのみ各ノードで有効にすことが推奨されます。各ノードで kdump を有効にすることに関するコストには、以下が含まれます。
- クラッシュカーネル用にメモリーが予約されているため、利用可能な RAM が少ない。
- カーネルがコアをダンプしている間にノードが利用できなくなる。
- 追加のストレージ容量がクラッシュダンプを保存するために使用される。
-
kdumpサービスは テクノロジープレビュー であるため、実稼働環境には対応していません。
kdump サービスを有効にすることに伴う不利な点やトレードオフを把握している場合には、クラスター全体で kdump を有効にすることができます。マシン固有のマシン設定はまだサポートされていませんが、Day 1 の MachineConfig オブジェクトの systemd ユニットを使用して直前の手順を実行し、クラスターのすべてのノードで kdump を有効にできます。MachineConfig オブジェクトを作成し、そのオブジェクトをクラスターのセットアップ時に Ignition が使用するマニフェストファイルのセットに挿入することができます。Ignition 設定の使用方法についての詳細は、インストール
手順
クラスター全体の設定の MachineConfig オブジェクトを作成します。
kdump を設定および有効にする Butane 設定ファイル 99-
99-worker-kdump.buを作成します。variant: openshift version: 4.9.0 metadata: name: 99-worker-kdump1 labels: machineconfiguration.openshift.io/role: worker2 openshift: kernel_arguments:3 - crashkernel=256M storage: files: - path: /etc/kdump.conf4 mode: 0644 overwrite: true contents: inline: | path /var/crash core_collector makedumpfile -l --message-level 7 -d 31 - path: /etc/sysconfig/kdump5 mode: 0644 overwrite: true contents: inline: | KDUMP_COMMANDLINE_REMOVE="hugepages hugepagesz slub_debug quiet log_buf_len swiotlb" KDUMP_COMMANDLINE_APPEND="irqpoll nr_cpus=1 reset_devices cgroup_disable=memory mce=off numa=off udev.children-max=2 panic=10 rootflags=nofail acpi_no_memhotplug transparent_hugepage=never nokaslr novmcoredd hest_disable" KEXEC_ARGS="-s" KDUMP_IMG="vmlinuz" systemd: units: - name: kdump.service enabled: trueButane を使用して、ノードに配信する設定が含まれる、マシン設定 YAML ファイル (
99-worker-kdump.yaml) を生成します。$ butane 99-worker-kdump.bu -o 99-worker-kdump.yamlクラスターの設定時に YAML ファイルをマニフェストに配置します。YAML ファイルを使用してクラスターの設定後にこの
MachineConfigオブジェクトを作成することもできます。$ oc create -f ./99-worker-kdump.yaml
7.4.1.3. kdump 設定のテスト リンクのコピーリンクがクリップボードにコピーされました!
kdump については、RHEL ドキュメントの Testing the kdump configuration セクションを参照してください。
7.4.1.4. コアダンプの分析 リンクのコピーリンクがクリップボードにコピーされました!
kdump については、RHEL ドキュメントの Analyzing a core dump セクションを参照してください。
別の RHEL システムで vmcore 分析を実行することが推奨されます。
関連情報
- RHEL での kdump の設定
- kdump についての Linux カーネルドキュメント
-
kdump.conf(5): 利用可能なオプションの詳細なドキュメントを含む
/etc/kdump.conf設定ファイルの man ページ -
kexec (8) —
kexecパッケージの man ページ - kexec および kdump に関する Red Hat ナレッジの記事
7.4.2. Ignition の失敗のデバッグ リンクのコピーリンクがクリップボードにコピーされました!
マシンをプロビジョニングできない場合、Ignition は失敗し、RHCOS は緊急シェルで起動します。デバッグ情報を取得するには、次の手順を使用します。
手順
次のコマンドを実行して、失敗したサービスユニットを表示します。
$ systemctl --failedオプション: 個々のサービスユニットで次のコマンドを実行して、詳細を確認します。
$ journalctl -u <unit>.service