Kafka 高可用机制解析（B 版）

6.1 Replica、Leader 和 Follower 三者的概念

回答

在 Kafka 中，一个分区会有多个副本（Replica），其中一个被选为 Leader，其余为 Follower。Leader 是唯一处理读写请求的副本，所有的消息写入都先到达 Leader，再由 Follower 同步复制。Follower 不直接参与读写，而是持续从 Leader 拉取数据，保持自身与 Leader 的一致性。当 Leader 出现故障时，合格的 Follower 有机会被选举为新的 Leader，从而保障分区的可用性和持续服务能力。

分析

理解 Kafka 的高可用机制，Replica、Leader 和 Follower 是最基本的组成单元。Replica 是分区在不同 Broker 上的多个副本副本集合，它们共同承担数据冗余和灾难恢复任务。每个 Partition 至少包含一个 Leader 副本和若干个 Follower 副本，而 Leader 是整个副本集中负责所有客户端交互的核心节点，所有写入请求都会首先被写入到 Leader 中。

Follower 副本则始终从 Leader 拉取消息，尽可能保持数据同步状态。Kafka 默认会设置副本数（replication.factor）来决定每个分区的副本数量，副本越多，容灾能力越强，但对资源的消耗也会相应增加。

当 Leader 宕机后，Kafka 会从与 Leader 同步的 Follower 中选出新的 Leader，整个过程是由控制器自动完成的，这也正是 Kafka 保证分区高可用性的基础机制之一。这个选举策略依赖于 ISR 集合的准确维护，保证数据一致性与可用性的平衡。

6.2 Kafka 中 AR、ISR、OSR 三者的概念

回答

AR（Assigned Replicas）是指该分区配置的所有副本，包括 Leader 和所有 Follower。ISR（In-Sync Replicas）表示当前与 Leader 保持同步的副本集合，是 Kafka 判断数据可靠性的核心依据。而 OSR（Out-of-Sync Replicas）则是那些因网络或性能等原因落后于 Leader 的副本，不具备选举资格，需等待重新同步后才能恢复为 ISR 成员。

分析

Kafka 的多副本机制不仅提升了系统的可用性，也增强了数据一致性。在此机制下，AR（Assigned Replicas）是最静态的一层，它指明了每个分区在哪些 Broker 上有副本存在。这些副本中，有的处于活跃同步状态，有的可能已经落后于 Leader，甚至暂时不可用。

真正决定副本能否参与读写和选举的是 ISR（In-Sync Replicas）。只有在 ISR 集合中的副本，才意味着它的数据与当前 Leader 同步程度可接受——具体地说，它复制的数据延迟没有超过配置的容忍阈值。Kafka 控制器会动态维护 ISR 集合，一旦某个副本追不上 Leader，就会被移出 ISR，划入 OSR（Out-of-Sync Replicas）集合。

OSR 中的副本因为不能保证数据一致性，因此无法参与 Leader 选举。除非启用了“unclean leader election”，允许 Kafka 在万不得已时从 OSR 中挑选 Leader，否则这些副本会一直等待恢复同步。

Kafka 通过区分 AR、ISR 和 OSR，让整个副本机制既具备可扩展性，又能兼顾一致性与可用性，是其高可用架构中的关键一环。

6.3 分区副本在什么情况下会从 ISR 中被剔除

回答

Kafka 会动态维护每个分区的 ISR（In-Sync Replicas）列表。如果某个 Follower 副本长时间未能及时同步 Leader 的数据，超出了 Kafka 设置的最大延迟阈值（如 10 秒），该副本就会被从 ISR 中剔除。相反，一旦该副本追上了 Leader 的进度，它会被重新加入 ISR。

分析

ISR 机制是 Kafka 保证数据一致性和高可用性的关键。Kafka 并不会假定所有副本始终与 Leader 保持同步，而是实时监控副本的同步状态，只有那些落后时间在可接受范围内的副本才被视作“同步副本”。

默认情况下，如果某个 Follower 与 Leader 的同步滞后超过 replica.lag.time.max.ms 设置的时间（如 10 秒），它就会被 Kafka 控制器自动从 ISR 移除。这种做法是为了避免在选举 Leader 时，误选一个落后较多的数据副本，导致数据不一致。

另一方面，如果该 Follower 后续恢复了同步进度，Kafka 会再次将它加入 ISR。ISR 的动态调整能力保证了 Kafka 既具备快速故障转移的能力，又不牺牲数据可靠性。

6.4 如果 Leader 宕机但 ISR 为空怎么办？

回答

当 ISR 为空且 Leader 副本宕机时，Kafka 的默认行为是拒绝从 OSR 中选出新的 Leader，从而使该分区不可用。不过可以通过设置 unclean.leader.election.enable=true，允许从 OSR 中选举 Leader，此时可能会发生消息丢失。

分析

这是 Kafka 容灾机制中的一个极端场景：所有副本都因网络、延迟或宕机等原因掉出了 ISR，导致系统没有同步副本可以切换为新的 Leader。默认情况下，Kafka 为了保障数据的一致性，不会贸然从 OSR 中挑选 Leader，而是宁愿该分区暂时不可用。

此行为可以通过配置参数 unclean.leader.election.enable 来控制。如果设置为 true，Kafka 会允许从 OSR 中选出 Leader，以恢复服务的可用性，但这可能会导致数据丢失，因为这些副本可能没有完全同步原 Leader 的最新数据。

这个机制是典型的“可用性”和“一致性”之间的权衡，Kafka 允许用户根据业务容忍度自行选择。

6.5 Kafka 副本间同步是“推”还是“拉”？

回答

Kafka 副本间的同步采用“拉”的方式。Leader 不会主动推送数据，而是由各个 Follower 自主向 Leader 拉取新消息，这样可以根据自身负载情况控制拉取节奏，更加灵活。

分析

Kafka 采用的是典型的“拉”模型（pull-based replication）。当 Producer 将数据写入 Leader 后，Follower 会定期从 Leader 拉取这些新数据并追加到本地日志。相比“推”模式，这种方式具有更高的容错性和可控性。

“拉”机制的最大好处在于它让每个 Follower 可以根据自身处理能力决定同步速率，避免了因 Leader 盲目推送而导致的资源拥塞或系统崩溃。这种模型在大规模分布式系统中非常常见，像 Cassandra、MongoDB 等也采用类似策略。

此外，“拉”机制也使得 Kafka 更容易处理 Follower 的网络延迟或负载突增场景，因为副本可以暂停拉取而不会影响 Leader 正常服务。

6.6 Kafka 的高可用机制是如何实现的？

回答

Kafka 的高可用主要依赖多副本机制。每个分区的副本分布在不同的 Broker 上，一旦某个副本所在的 Broker 宕机，Kafka 会自动从其余副本中选出新的 Leader，确保分区仍然可以对外提供服务。

分析

Kafka 能在生产环境中保持高可用，一个关键的设计就是副本机制。每个 Topic 的分区都可以配置多个副本（replica），这些副本会均匀分布在不同的 Broker 上，实现跨节点容灾。

当主副本（Leader）所在的 Broker 宕机时，Kafka 控制器会从 ISR 列表中选出一个同步副本作为新的 Leader，整个过程无需人工干预，系统可以快速自愈。

这种机制可以有效应对物理层面的灾难，比如断电、磁盘损坏，甚至数据中心级的故障，只要其他副本依旧存活，数据就不会丢失，服务也不会中断。

Kafka 的多副本策略，不仅为读写服务提供冗余保障，也为企业业务的连续性提供了底层支撑，是其在大规模消息系统中获得广泛认可的重要原因。

6.7 Kafka 是如何为分区选择主副本的？

回答

Kafka 会从 ISR（In-Sync Replicas）中选择 Leader 副本。具体来说，如果原 Leader 宕机，Kafka 会优先从 ISR 中的第一个副本选出新的 Leader，确保数据一致性和最小的消息丢失风险。

分析

在 Kafka 中，一个分区可能有多个副本，而其中只有一个是 Leader，负责处理所有的写请求。Kafka 控制器会维护每个分区的 ISR 列表，这个列表记录了与 Leader 同步良好的副本。

当 Leader 宕机时，Kafka 不会在所有副本中随意选取新的 Leader，而是从 ISR 中选择第一个副本进行升级。这是为了保证新 Leader 拥有尽可能完整的数据副本，防止未同步数据丢失。

如果 ISR 为空，Kafka 的行为会受到 unclean.leader.election.enable 的影响。如果该参数为 false，那么分区会进入不可用状态；如果为 true，Kafka 会从 OSR 中选出新的 Leader，但此举可能导致数据一致性问题。

因此，Kafka 的主副本选举策略本质上是在一致性与可用性之间寻找平衡点。

6.8 Kafka 如何感知 Leader 是否宕机？

回答

Kafka 通过控制器（Controller）来监控各个 Broker 的状态。一旦控制器发现某个 Broker 失联，它会触发分区重新分配流程，并在 ISR 中选择新的 Leader，以确保服务不间断。

分析

早期 Kafka 版本中，所有副本会直接参与选举，通过与 ZooKeeper 交互争夺 Leader 地位。这种方式在分区和副本数量较多时，会对 ZooKeeper 造成较大压力，甚至影响稳定性。

为了解决这一问题，现代 Kafka 引入了 Controller 的概念。Controller 是一个特殊的 Broker 实例，它独立负责集群中所有分区和副本的状态管理。一旦 Controller 检测到某个 Broker 失联（通常通过心跳机制），就会立刻开始处理副本迁移与 Leader 重选流程。

通过中心化的故障检测和副本调度，Kafka 避免了多副本间的直接竞争，显著提升了故障响应速度和系统稳定性。