必须理解的分布式系统中雷同集群技术及原理

发布时间：2019-02-20 10:51:09 所属栏目：酷站来源：谢涛

导读：写在前面在当今信息爆炸的时代，单台计算机已经无法负载日益增长的业务发展，虽然也有性能强大的超级计算机，但是这种高端机不仅费用高昂，也不灵活，一般的企业是负担不起的，而且也损失不起，那么将一群廉价的普通计算机组合起来，让它们协同工作就像一

　　备注：默认情况下，为了保证分区的最大可用性，当acks=all时，只要ISR集合中的副本分区写入成功，kafka就会返回消息写入成功。如果要真正地保证写全部(write all)，那么我们需要更改配置transaction.state.log.min.isr来指定topic最小的ISR集合大小，即设置ISR集合长度等于topic的分区数。

　　如果所有的节点都挂掉，还有Unclean leader选举机制的保证，建议大家下去阅读kafka《官方指南》设计部分，深入理解kafka是如何通过引入ISR集合来变通大多数投票机制，从而更好地保证消息交付的不同语义。

　　什么是集群脑裂?

　　对于分布式系统，自动处理故障的关键就是能够精准地知道节点的存活状态(alive)。有时候，节点不可用，不一定就是其本身挂掉了，极有可能是暂时的网络故障;在这种情况下，如果马上选举一个master节点，那么等到网络通信恢复正常的时候，岂不是同时存在两个master，这种现象被形象地称为“集群脑裂”，先留给大家下去思考吧。呵呵，明天要早起，碎觉了，大家晚安。

　　备注：设计一个正在高可用的分布式系统，需要考虑的故障情况往往会很复杂，大多数组件都只是处理了fail/recover模式的故障，即容忍一部分节点不可用，然后等待恢复;并不能处理拜占庭故障(Byzantine)，即节点间的信任问题，也许区块链可以解决吧，大家可以下去多多研究，然后我们一起讨论，共同学习，一起进步。

　　写在最后

　　分享了这么多，请大家总结一下大多数投票机制的优点和缺点?欢迎评论区留言，哈哈，真的要睡觉了，晚安。

　　原文作者：无痴迷，不成功

　　原文链接：https://www.cnblogs.com/justmine/p/9275730.html

（编辑：温州站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2/2

首页