Kubernetes Federation整体架构解读（v1、v2版本）

近期云原生圈中多云(Multi-Cloud)和混合云的概念受到了很多关注，通过IBM、Vmware这俩笔收购不难看出，云服务商正在相继开拓混合云市场。在IBM收购Redhat的声明中，俩家公司强调它们将联合推动基于kubernetes的混合云解决方案，并致力成为多云和混合云市场的领导者。VMware对Heptio的收购中也表示，将加强PKS与Heptio产品的合作，通过Kubernetes实现跨多云的基础架构平台。

Federation(集群联邦)正是kubernetes社区中的多云管理项目，可以方便地跨地区跨服务商管理多个Kubernetes集群。其最初在1.3版本中被引入，后从主库迁移到独立repo(v1版本)[1]，由于v1版本存在的若干问题，现已切换到v2版本[2]。v1、v2版本虽然架构有较大差异，但共同目标都是使管理多个集群更为简单，主要实现了以下俩个模型：

跨集群的资源同步与伸缩(Sync and Scale resources across clusters)：提供在多个集群中保持资源同步与伸缩的功能，例如确保一个Deployment可以运行在多个集群中，并根据负载情况在集群间合理伸缩。
跨级群的服务发现(Cross cluster discovery)：提供自动配置DNS服务的功能，实现应用跨集群服务发现的能力，例如在某一集群中可以访问另一集群的应用。

Federation v1

Federation v1的架构跟k8s集群的架构非常类似，整体架构如下：

主要包含四个组件：

federation-apiserver：类似kube-apiserver，兼容k8s API，只是对联邦处理的特定资源做了过滤（部分资源联邦不支持，故使用apiserver来过滤）。
federation-controller-manager：提供多个集群间资源调度及状态通同步，工作原理类似kube-controller-manager。
kubefed：Federation CLI工具，用来将子集群加入到联邦中。
etcd：存储federation层面的资源对象，供federation control plane同步状态。

V1版本为了兼容k8s的API，将联邦的相关配置都放在了对象的annotations中。如下图所示，如果annotations中不包含联邦的相关配置，则会在每个子集群中创建同样的4个实例。如果含有联邦的配置，则federation-controller-manager会根据调度策略进行调度。

将federation层的配置写到annotations中，虽然与k8s API保持了兼容，但也带来了一些问题。由于没有federation层独立的API，导致了API版本无法很好的演进。这，也正催生了现在的v2版本（v1版本现已停止更新）。

Federation v2

Federation v2版本在v1的基础上，进一步简练、增强，主要功能仍然是跨地区跨服务商管理多个Kubernetes集群。其通过当下大热的CRD模型定义了独立的API，同时仍通过ControllerManager模型来同步、调度资源，通过kubefed2来将子集群加入联邦。CRD与ControllerManager组成的Control Plane模型（去除了v1中独立APIServer、Etcd），使其可以部署在任意的k8s集群中，同时还可将该集群也join到联邦控制面作为子集群，整体定义模型如下：

目前主要定义了Cluster configuration、Type configuration、Schedule、MultiClusterDNS这四种类型的CRD资源。

Cluster configuration

主要定义了子集群注册时的配置信息，其中主要引用了Cluster-Registry[3]这个子项目来定义cluster的配置信息。用户只需执行kubefed2 join将安装好的集群加入联邦，federation-controller-manager会自动读取新加入集群的context信息，生成cluster configuration信息，并持久化到etcd中，供后续消费。

Type configuration

主要定义了federation可以处理哪些资源对象(在v1版本中靠独立APIServer来过滤)，例如使federation处理deployment，就创建一个deployment type configuration。Type configuration中又包含了三种类型的CRD资源：

Template：定义了federation要处理的资源对象，含有该对象的全部信息，例如depoyment的template中就直接引用了k8s的deployment。
Placement：定义要将资源对象运行在哪些子集群中，如不定义该对象，则资源不会运行在任一集群。在v1版本中资源是会默认下发到每一个集群中。
Override：对于同一资源对象，在不同服务商的集群配置中可能有会有差异。例如deployment对象，其中volume可能不同云厂商实现有所不同，所以需要差异化配置volume字段，Overide就提供了差异化修改template中字段的能力（当前仅支持部分字段，后续会支持全部字段差异化修改）。

Type configuration的整体工作流程为：假设用户创建deployment的Type configuration资源对象，federation-controller在watch到该对象后会再创建一个controller，该controller主要关注Deployment Template/Placement/Override对象的增删查改，然后做相应的增删查改动作到子集群中。

目前支持了k8s的Confimap、Deployment、Job等资源，后续还会增加更多资源。当然也支持用户通过CRD资源自主定义Type configuration、Template、Placement、Override对象。

Schedule

主要定义应用在集群中的调度分布，该类型主要涉及Deployment与Replicaset俩种（该配置在v1中写在对象的annotations中）。用户可以定义对象在每个集群中分布的最多、最少实例数，并且还能在集群中做到应用实例数的均衡分布。值得注意的是，如果调度结果跟用户自定义的override冲突时，该调度算法享有优先权。例如用户override中定义为5个实例，实际调度结果只有3个，那么自定义的override中5个实例将被改为3个。

MultiClusterDNS

如字段名，该资源主要在做多集群间的服务发现，其下主要包含ServiceDNSRecord、IngressDNSRecord、DNSEndpoint这几个资源对象。整个工作流程为：

用户首先创建Service资源，需要创建Service Template、Placement、Override（可选）三个对象，使Service分布到各子集群。
创建ServiceDNSRecord/IngressDNSRecord资源，federation-controller会根据该资源的配置，收集各子集群对应的service信息，最后生成由域名与IP组合而成的DNSEndpoint资源并持久化到etcd中。
将federation-controller创建的DNSEndpoint资源中的域名与IP自动配置到DNS服务商的服务器上，可通过external-dns项目[4]自动配置。

这样，就可以实现不同集群中应用的服务发现，其实质是将各集群服务的IP与对应域名配置到公网的DNS服务器上，以通过公网域名实现跨集群服务发现。

总结

Federation v2中的CRD配置虽然略显复杂，但是能够根据负载情况，调度并调节各集群的资源分布，同时能够提供跨集群的应用故障转移，以及跨集群的服务发现。实现了方便的跨地区、跨服务商配置并管理多个k8s集群，以及多集群资源的统一管理

本文大概介绍了Federation v1、v2的整体架构，有兴趣的同学可以进一步深入阅读附录中的源码。

附录：

Kubernetes Federation整体架构解读（v1、v2版本）

Federation v1

Federation v2

总结

HTML页面关于高分屏的设置

北欧瑞典挪威芬兰瑞士TikTok海外网红与YouTube博主的合作模式

欧洲英国德国法国TikTok与YouTube海外网红达人的完美合作策略

druid数据源 xml配置

Kubernetes 請求併發控制與數據一致性（含ResourceVersion、Update、Patch簡析）

Kubernetes Federation整體架構解讀（v1、v2版本）

Golang TLS Server、Kube-Apiserver 校驗客戶端證書原理

GPU基本概念

MultiCloud利器——Kubernetes Federation整體架構解讀（v1、v2版本）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結