11.11.2. リバランス中の表示
ボリュームリバランス操作の状態を表示するには、次のコマンドを使用します。
# gluster volume rebalance VOLNAME status
以下に例を示します。
# gluster volume rebalance test-volume status Node Rebalanced size scanned failures skipped status run time -files in h:m:s ------------- ---------- ------ ------- -------- ------- ----------- -------- localhost 71962 70.3GB 380852 0 0 in progress 2:02:20 server1 70489 68.8GB 502185 0 0 in progress 2:02:20 server2 70704 69.0GB 507728 0 0 in progress 2:02:20 server3 71819 70.1GB 435611 0 0 in progress 2:02:20 Estimated time left for rebalance to complete : 2:50:24
リバランス操作は、ボリュームの各ノードでリバランスプロセスを開始します。各プロセスは、独自の個別ノード上のファイルをリバランスします。リバランスステータスの出力の各行は、単一ノードでの操作の進捗を示します。
重要
リバランス中に再起動すると、リバランスの出力に誤ったステータスが表示され、一部のファイルがリバランスされない可能性があります。
回避策: 再起動後、前回のリバランスが完了したら、別のリバランスをトリガーして、再起動中にバランスされなかったファイルが正しくリバランスされ、リバランスの出力で正しいステータスが得られるようにします。
以下の表は、リバランスステータスコマンドの出力を示しています。
プロパティー名 | 説明 |
---|---|
ノード | ノードの名前。 |
Rebalanced-files | 正常に移行されたファイルの数。 |
size | 移行されたファイルの合計サイズ。 |
スキャン済み | ノード上でスキャンしたファイルの数。これには、移行したファイルが含まれます。 |
failures | エラーが原因で移行できなかったファイルの数。 |
skipped | さまざまなエラーや理由でスキップされたファイルの数。 |
status | ノードのリバランス操作のステータスは in progress 、completed 、および or failed です。 |
run time in h:m:s | プロセスがノードで実行されている時間。 |
全ノードでリバランスが完了するまでの推定時間も表示されます。完了までの推定時間は、リバランス操作が 10 分間実行された後にのみ表示されます。残り時間が大きすぎる場合、完了までの推定時間は
>2 months
として表示されます。ユーザーは、後で再度確認することが推奨されます。
リバランス操作の完了にかかる時間は、ブリックにあると予想されるファイルの数と、リバランスプロセスでファイルを処理する速度により異なります。この値は、リバランスステータスコマンドが実行されるたびに再計算され、リバランスの実行時間が長く、大きなデータセットに対してより正確になります。この計算では、ファイルシステムのパーティションにブリックが 1 つ含まれることを前提としています。
リバランス操作は、すべてのノードのステータスが完了すると
completed
とみなされます。以下に例を示します。
# gluster volume rebalance test-volume status Node Rebalanced size scanned failures skipped status run time -files in h:m:s ---------- ---------- ----- ------- -------- ------- ----------- -------- node2 0 0Bytes 0 0 0 completed 0:02:23 node3 234 737.8KB 3350 0 257 completed 0:02:25 node4 3 14.6K 71 0 6 completed 0:00:02 localhost 317 1.1MB 3484 0 155 completed 0:02:38 volume rebalance: test-volume: success
今回のリリースにより、リバランス操作時にスキップされたファイルの詳細を取得できるようになりました。このようなすべてのファイルのエントリーは、メッセージ ID 109126 の
rebalance log
で利用できます。ログファイルからメッセージ ID を検索し、省略されたファイルの一覧を取得できます。
以下に例を示します。
# grep -i 109126 /var/log/glusterfs/test-volume-rebalance.log [2018-03-15 09:14:30.203393] I [MSGID: 109126] [dht-rebalance.c:2715:gf_defrag_migrate_single_file] 0-test-volume-dht: File migration skipped for /linux-4.9.27/Documentation/ABI/stable/sysfs-fs-orangefs. [2018-03-15 09:14:31.262969] I [MSGID: 109126] [dht-rebalance.c:2715:gf_defrag_migrate_single_file] 0-test-volume-dht: File migration skipped for /linux-4.9.27/Documentation/ABI/stable/sysfs-devices. [2018-03-15 09:14:31.842631] I [MSGID: 109126] [dht-rebalance.c:2715:gf_defrag_migrate_single_file] 0-test-volume-dht: File migration skipped for /linux-4.9.27/Documentation/ABI/stable/sysfs-devices-system-cpu. [2018-03-15 09:14:33.733728] I [MSGID: 109126] [dht-rebalance.c:2715:gf_defrag_migrate_single_file] 0-test-volume-dht: File migration skipped for /linux-4.9.27/Documentation/ABI/testing/sysfs-bus-fcoe. [2018-03-15 09:14:35.576404] I [MSGID: 109126] [dht-rebalance.c:2715:gf_defrag_migrate_single_file] 0-test-volume-dht: File migration skipped for /linux-4.9.27/Documentation/ABI/testing/sysfs-bus-iio-frequency-ad9523. [2018-03-15 09:14:43.378480] I [MSGID: 109126] [dht-rebalance.c:2715:gf_defrag_migrate_single_file] 0-test-volume-dht: File migration skipped for /linux-4.9.27/Documentation/DocBook/kgdb.tmpl.
失敗したファイルの詳細は、rebalance.log ファイルで「migrate-data failed」を検索します。ただし、リバランスに失敗したファイルの数は、rebalance.log で「migrate-data failed」と照合されません。これは、失敗した数に、考えられる失敗がすべて含まれ、ファイルの移行だけではないためです。