大规模业务 Kubernetes 集群托管实践丨QCon

随着容器技术的流行,越来越多的公司选择 Kubernetes 作为他们应用的执行平台,联想也不例外。在联想,我们各个业务团队在 Kubernetes 上运行着不同类型的应用,包括 AI 应用、大数据应用、区块链应用以及在线服务等等。如何为业务团队提供安全稳定、高效易用的执行环境,以及如何降低业务团队对 Kubernetes 使用成本成为平台部门面对的一大挑战。

LKS 是联想研究院 ECR 实验室设计的一个 Kubernetes 托管服务。LKS 使用一个 Kubernetes 集群 Operator 为各个业务团队提供众多 Kubernetes 集群,并将业务 Kubernetes 集群的控制面集中托管到一个中心 Kubernetes 集群进行管理。我们对业务 Kubernetes 的控制面容器做了相应的高可用改造,保证业务 Kubernetes 集群的安全稳定。除此之外,LKS 也为 Kubernetes 集群提供智能监控管理、负载均衡、配置管理等进阶功能,大幅降低了业务团队对 Kubernetes 的使用难度。随着 LKS 支撑 Kubernetes 规模的扩大,LKS 自身架构也不可避免地遇到了一些问题并做了相应的设计改变。在本次分享中,我们将介绍 LKS 的设计架构,以及在 LKS 在运营过程中的一些经验及思考。

内容大纲

1、业务 Kubernetes 集群会遇到哪些问题;

2、Kubernetes 托管带来哪些好处;

3、LKS KubeInKube 托管平台架构;

4、Kubernetes Cluster Operator 设计探讨;

5、全局 Ingress 如何设计;

6、Prometheus 服务如何让性能管理更简单;

7、一些实践经验、坑及思考。

听众收益

1、Kubernetes Cluster Operator 的设计以及提供高效 Kubernetes 计算引擎的一些注意事项;

2、Kubernetes 服务如何更好地与底层 IaaS 服务交互;

3、业务 Kubernetes 集群更关注哪些问题。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章