基於Kubernetes的PaaS平臺設計和思考

PaaS平臺的意義

很多公司技術支持崗位的工作,如配置域名,部署環境,修改復位配置,服務重啓,擴容縮容,梳理和完善監控,根據開發的需要查找日誌等工作,需要和開發進行大量的溝通,如什麼是外網域名,什麼是內網域名、A name、C name,防火牆規則該如何設定,操作系統等基礎環境需要什麼依賴。因爲很多研發不瞭解運維的術語和知識點,導致溝通困難,效率很低。而且這樣的需求還很多,把運維壓的喘不過氣,佔用了幾乎所有的時間,但是開發的需求可能還是遲遲不能滿足。

這樣的公司可能遇到了以下問題:

  • 系統架構過於陳舊,性能、可靠性無法滿足現有的需求;

  • 原有IT架構不靈活,業務模塊新增或變更帶來巨大成本壓力;

  • 系統功能繁雜,結構紊亂,定製的代碼與系統耦合性極高;

  • 服務種類繁多,各種技術棧橫行;

  • 人員流動交接不充分,新接手的團隊對部署環境不瞭解,只能做周邊的修補,不敢遷移 。

如何才能解決?答案是流程化、標準化、自動化、平臺化。

流程化

即主動梳理運維工作任務,形成標準化的操作流程,尤其是針對需要多人協作完成的任務,比如應用的發佈部署,把流程固化到流程平臺系統中,保證每個人執行都能按照流程嚴格執行,不會有哪些環節遺漏,而且當前的流程狀態對所有人都可見,能清晰的看到誰正在處理,處理人也會更主動儘快的完成該任務。

標準化

從架構角度按照應用類別制定應用的部署標準,比如Web類型的應用,服務化的應用(我們內部用的JSF),或者是比較新的微服務的應用(Spring Boot等),部署腳本和工具平臺按照約定好的規範進行設計開發,減少了因爲應用種類繁多導致工具和平臺的複雜。

自動化

早期寫了非常多的腳本,任務執行機到要執行任務的服務器之間通過SSH免密鑰認證,再根據需要批量執行命令。隨着服務器規模和應用數量的擴張,很快腳本執行的方式無法滿足業務發展,難以理解,同一個類型的任務多個腳本並存,存在誤操作,缺乏清晰的操作歷史記錄和回滾機制,即使後續替換了如Puppet,Saltstack,Ansible這樣的配置管理工具,但根本問題並沒有解決。

平臺化

平臺化是這次分享的重點,一定要在前面三條的基礎上進行建設,如果沒有清晰的流程,明確的標準,平臺建設起來也只是自動化工具的集成,解決不了公司核心問題。

以下說的平臺化內容主要是PaaS平臺化,即主要從應用和中間件的角度,這裏不討論IaaS的內容。

PasS平臺化將問題的關注點從基礎資源上升到了應用層面,目標是提供一個幫助開發人員運行、管理應用的平臺,讓使用者更關注運行的代碼(業務邏輯)。

PaaS能解決的問題:

  • 應用聚合:如開發需要一個Redis,直接啓動一個Redis容器即可

  • 服務發現、快速伸縮、狀態管理等

  • 服務監控、恢復、容災

  • 費用統計:提供計算資源信息彙總,針對不同項目收費

  • 安全管控:不管什麼平臺,安全都非常重要,例如A應用可以訪問B,B不允許訪問A以及安全審計等。

  • 快速部署

隨着Docker容器技術的出現,讓我們有了更合適的工具建設PaaS平臺,具備了基於應用構建服務的能力。

在Docker容器調度框架上,我們又選擇了Kubernetes平臺。

爲什麼選擇Kubernetes

先列一下目前三大主流的容器調度框架的功能和特點:

Kubernetes

資源調度、服務發現、服務編排、資源邏輯隔離、服務自愈、安全配置管理、Job任務支持、自動回滾、內部域名服務、健康檢查、有狀態支持、運行監控/日誌、擴容縮容、負載均衡、灰度升級、容災恢復、應用HA。

Mesos

Mesos是一個分佈式內核,目前的發展方向是數據中心操作系統(DCOS),它同時支持 Marathon、 Kubernetes 和 Swarm 等多種框架,Mesosphere 也是 Kubernetes 生態的一員。

注意Marathon的技術棧是Scala語言,而Docker和Kubernetes的技術棧都是Go語言。

Swarm

從Docker1.12版本開始,Swarm隨Docker一起默認安裝發佈,也由於隨Docker引擎一起發佈,無需額外安裝,配置簡單。

支持服務註冊、服務發現,內置Overlay Network以及Load Balancer。

與Docker CLI非常類似的操作命令,對熟悉Docker的人非常容易上手學習。

每一種工具都有自己的核心理念

Mesos理念是數據中心操作系統(DCOS),爲了解決IaaS層的網絡、計算和存儲問題,所以Mesos的核心是解決物理資源層的問題。

Kubernetes的核心是如何解決自動部署,擴展和管理容器化(containerized)應用程序。

所以,個人認爲Mesos和Kubernetes是兩種維度,對於我們的場景來說,關心應用的狀態多於物理資源層管理,因此更關心的是容器化應用程序管理,這是我們選擇Kubernetes的主要原因。

另外選擇Kubernetes還考慮了其它優勢,如:

  • 出身名門Google,其開發和設計受到了Google著名的Borg系統的影響;

  • GitHub上關注Kubernetes項目和提交代碼的開發者非常多,社區活躍,如果遇到問題,通過社區諮詢和解決 問題速度也會比較快。

  • Kubernetes可以很好的支持有狀態的服務。

PaaS平臺上的微服務架構應用

再來看一下我眼中的基於當前最流行的微服務架構的設計是什麼樣的,即我們PaaS平臺上要運行的典型應用是什麼樣的。

用戶端的請求進來以後,首先進入前端的Nginx服務器,再進入Zuul代理網管上,由Zuul將這些任務下發到不同的服務上去。Eureka集羣作爲註冊中心服務,提供服務的發現和註冊的功能。服務後端再去調用依賴的其他服務,數據庫集羣,Redis集羣等服務。

微服務架構因爲有註冊中心自動解決了服務註冊發現的問題,所以對內部服務來講就不用依賴傳統的負載均衡器等工具,很容易將各個服務Docker化,遷移到PaaS平臺裏統一管理。

PaaS平臺架構設計

平臺建設原則

在建設PaaS平臺之前,參考《高效人士的七個習慣》設定了PaaS平臺建設的原則:

  1. 以終爲始:做一件事情要知道想達成什麼樣的目的,知道這個目的之後,就能夠圍繞這個目標採取一些措施。

  2. 知己解彼:作爲一個運維人員,需要有一個比較大的知識面。只有如此才能夠去制定一些適合自己的方案和產品。

  3. 積極主動:因爲要做PaaS所以要把自己的主觀能動性都調起來。

  4. 要事第一:上面說了很多PaaS相關的內容,由於時間、人員的限制。如何從衆多的基礎組建中挑選出來最重要的一些事情,着手建設。

  5. 雙贏:做出來的系統最好是能夠達到對開發、運維、公司都有利。

  6. 統合綜效:對待同樣的一件事,每個人都會有自己的見解。同時也要問同伴,要把所有的觀點都收集起來做一個綜合分析對比,以收到更好的效果。

  7. 持續更新:時刻提醒自己持續學習,擁抱變化,這樣才能看到平臺的不足。持續迭代出更好的產品。

基於以上的原則,我們團隊勾勒了一個最小化的PaaS圖:

  1. 最上面的Ingress服務跟傳統的負載均衡器的功能類似,提供請求分發的功能。

  2. Service相當於後端Pod的一個代理服務器,Service需要通過Ingress服務才能被外部Client訪問。

  3. Pod則相當於我們傳統的一個服務。

  4. 最小化PaaS平臺還用到了DNS組件,在內部服務運行起來之後,我們會通過DNS組件分配一個內部域名供訪問時使用。

Kubernetes對外提供服務,用的是Lvs+Ingress,每次添加一個新的服務之後會調用一次DNS的API,按照規則生成一個內部域名供訪問使用。

平臺關鍵能力說明

  • 應用持續部署,平臺實現快速、可視化自動部署功能。支持對應用的快速、可視化部署。用戶僅需在界面中選擇相應的鏡像和組件,並填寫簡單的配置信息,點擊部署按鈕,即可完成整個應用的安裝或者升級。在測試環境可通過Jenkins,可實現應用的持續集成和全自動化升級,同時支持一鍵回滾和恢復發佈功能。

  • 應用彈性伸縮,構建具有需求預測和容器按需供給能力的彈性伸縮子系統,具有基於應用的負載和資源情況進行彈性伸縮能力,以應對互聯網用戶高併發的特點,應對流量衝擊。其中,包括容器彈性伸縮、物理機彈性伸縮功能。

  • 容器和組件的統一管理,從整體應用的角度出發,平臺不僅管理鏡像和容器,而是將一個應用涉及的所有組件均做了統一管理,比如對前端的DNS、負載均衡(F5/Nginx),後端數據庫等的管理。通過對系統相關組件和容器統一管理,平臺將可以實現系統的全局統一部署、配置、升級/回滾、監控、故障處理等功能。

  • 高可靠性,容器的故障恢復,當服務器宕機時,平臺系統會自動在其它服務器上重新啓動容器併爲其分配資源,從而達到秒級啓動,恢復業務。保障業務不掉線,高可靠運行;鏡像倉庫的可靠性,通過將單機版的鏡像倉庫擴展成鏡像倉庫集羣,從而提升性能,實現Registry的無狀態化,便於實現服務的高可用性。

  • 應用Docker化封裝,系統支持如下幾類常見應用:Tomcat、Jboss、Nginx、Redis、ZooKeeper等。

PaaS平臺功能組件

具體實施時,主要有幾個基礎組件需要開發:

  • 鏡像管理,實際運行的應用鏡像由 “基礎中間件鏡像”+“應用包”+“配置” 自動構建,無需開發人員理解鏡像概念和手動製作鏡像;

  • DNS管理,定製化公司內部使用的DNS管理平臺,對公司的DNS進行統一管理;

  • 服務管理,需要定製化一套Kubernetes的Deployment模板,從Ingress到Service再到RC都定義在這套模板裏面,方便對容器進行擴容、縮容、刪除操作;

  • 服務內Pod管理,屬於Kubernetes自有範疇,查看Service內的Pod運行情況、Pod日誌輸出等功能;

  • 日誌管理,將日誌輸出到公司的日誌平臺(如ELK平臺),對接研發人員排查問題、數據埋點使用;

  • 監控管理,參考方案:cAdvisor + InfluxDB + Grafana/ Heapster + InfluxDB + Grafana/Prometheus/Zabbix。

一箇中小企業做成這樣後,日常運維的工作量即可大量減少,兩三個人就能完成日常的應用運維工作,有興趣地話可以去挑戰一下。當然做完這些後,還只是一個小型的PaaS平臺。

如果是再複雜一點的PaaS平臺,應該還有哪些要繼續做的呢?

環境管理:即一套平臺管理多套不同的Kubernetes集羣。安全管理、流程管理、計費管理等功能模塊。

還有因爲規模增加和更高的可靠性要求,對應的網絡,IO等各種優化。

其實還有很多功能就不一一列舉了,可以根據自己的實際情況添加功能模塊,設計有自己公司特色的PaaS平臺。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章