SRE Google运维解密——第二章Goolgle的生成环境介绍

SRE Google运维解密

Goolgle的生成环境介绍

1、硬件:物理服务器和软件服务器,  物理服务器和已运行任何类型的软件服务器,

          物理服务器对资源管理采用集群管理系统分配资源,成为Brog。

          每个物理服务器互相进行网络通信,采用虚拟网络交换机(Jupiter)这个交换机有几万个虚拟端口,Jupiter可以提供1.3Pb/s的交叉宽带。

Google的数据中心由一套全球覆盖的骨干网B4连接起来的。

            B4是指基于SDN网络技术(使用OpenFlow标准协议)构建的,可以给中规模的骨干网络提供海量带宽,同时可以利用动态带宽管理优化网络连接。

物理服务器的管理软件 :Borg 是一个分布式集群操作系统。

          (1)Borg负责运行用户提交的任务。该任务可以是无限运行的软件服务器,或者是批量任务,每个任务可以由一个或多个实例组成的。

         由于实例和机器并没有一对一的固定对应关系,不能用IP和端口指代某一具体任务的实例。故新增加一层抽象层BNS(Borg名称解析系统),BNS负责将这个名称转换为具体的IP和端口进行连接

BNS地址可能是一个字符串:/bns/<集群名>/<用户名>/<任务名>/<实例名>   解析为 IP地址:端口

          (2)Borg还负责资源分配给每个任务,每个任务都需要在配置文件中声明它需要的具体资源。Borg可以将所有的任务合理地分配到不同物理服务器上,以提高每个物理服务器的利用率,同时Borg还关注物理服务器的故障域属性。

2、存储

   集群存储系统有开源的Lustre  Hadoop文件系统(HDFS)此处有图,暂时省去

3、网络

    使用一个基于OpenFlow协议的软件定义网络(SDN),网络交换机控制器负责计算网络中的最佳路径。

   带宽控制器(BwE)负责管理所有可用带宽。优化带宽的使用目的不仅降低成本,利用中心化的路由计算,可以解决以前在分布式路由模式下难以解决的流量迁移问题。

   为了降低分布式集群的服务延迟,采用全球负载均衡(GSLB)

            (1)利用地理位置进行负载均衡DNS请求

           (2)在用户服务层面进行负载均衡

           (3)在远程调用(RPC)层面进行负载均衡

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章