大型电商平台和云计算平台的后台服务都是典型的超大规模分布式系统。作为企业用户的基础服务商,一方面平台的稳定性和高可用能力不容有失,另一方面需要在分布式系统规模持续扩大的情况下避免运维成本的上升,因此声明式自愈系统的设计成为必须。本次分享将结合分布式系统理论和作者在多家互联网和云计算企业的工作经验,围绕高可用分布式系统的设计之道分享以下内容:
- 对分布式系统分析和建模的理论方法;
- 无状态和有状态分布式系统面临的问题;
- 分布式系统高可用能力的测试和验证;
- 声明式自愈系统从设计到实现的最佳实践总结。
听众受益
- 了解对分布式系统分析和建模的理论方法;
- 了解无状态和有状态高可用服务的设计方法;
- 了解分布式系统的高可用能力的测试方法;
- 了解大规模分布式消息系统的设计和实现经验;
- 了解从高可用系统的设计到实现的实践经验。