7.1 为什么监控很关键

如果 BDR 组中的一个或多个节点关闭然后 DDL 锁定为 DDL 复制将等待无限期或取消。DDL 锁在所有节点上,不只是有足够的法定人数,都需要达成共识,因此它必须能够到达的所有节点。因此,监视节点停机至关重要。

如果一半或更多节点关闭或无法访问,全局序列块分配也可以打断。请参阅全局序列投票。

由于 DDL 锁和全局序列分配将消息插入到复制流,极其背后是重播的节点将导致类似中断到另一种完全向下。

旷日持久的节点中断也会导致磁盘空间用尽,导致拒绝写入或执行紧急停工的其他节点。每个节点连接到每个其他节点是为每个节点上的每个下游对等节点的复制插槽。复制插槽确保上游 (发送) 服务器将保留足够预写日志 (WAL) 在 pg_xlog 继续重播从下游同行 (接收器) 最后重播该插槽的点。如果同行停止消费数据上的插槽或越来越落后于重播然后有该插槽的服务器将积累WAL,直到它在 pg_xlog 上运行磁盘空间不足。这可以发生即使下游同行是在线和重播如果它不能接收和重播变化一样快的上游节点生成它们。

因此,至关重要的是要有自动监测到位,以确保如果复制插槽开始严重落后于管理员得到报警,并且可以采取积极的行动。

results matching ""

    No results matching ""