2.4. 推荐的 etcd 实践
对于大型高密度的集群,如果键空间增长过大,超过空间配额,则 etcd 的性能可能会受到极大影响。因此,需要定期维护 etcd ,包括整理碎片以便在数据存储中释放空间。强烈建议您密切监控 Prometheus 中的 etcd 指标数据,并提早进行碎片整理。否则,etcd 可能会引发一个集群范围的警告,使集群进入维护模式(只能对键进行读和删除)。需要密切关注的指标数据是 etcd_server_quota_backend_bytes
, 即当前的配额限制;etcd_mvcc_db_total_size_in_use_in_in_bytes
,它显示了对历史数据进行压缩后的实际数据库用量;etcd_debugging_mvcc_db_total_size_in_bytes
,它显示了数据库大小,包括等待进行碎片处理的空闲空间。