京東零售大數據雲原生平臺化實踐

導讀： 今天爲大家介紹京東零售大數據的雲原生平臺化實踐，主要包括以下幾大方面內容：

雲原生的定義和理解
雲原生相關技術的演化
京東大數據在雲原生平臺化上的實踐
雲原生應用平臺的發展

分享嘉賓：劉仲偉京東架構師

編輯整理：張明宇廣州某銀行

出品社區：DataFun

01/雲原生的定義和理解

1. 雲原生的定義

雲原生這個概念大家已經很熟悉了，但是否有一個準確的定義呢？每個人都在說雲原生，但大家對雲原生的理解是不同的。

CNCF對雲原生的定義如下：

很多時候，大家會想應用容器化就等於雲原生化，應用上了Kubernetes是否等於雲原生化，使用了Kubernetes的API是否等於雲原生化？答案是不一定，因爲雲原生的定義在變化。

2015年CNCF成立，對雲原生的定義如下：

Pivotal在2019年也對雲原生做了定義。雖然Pivotal現在已經被收購，但其在雲原生的定義和發展方面起了很大的作用。Pivotal對雲原生的定義涉及幾個方面：Devops, Continuous Delivery, Microservices和Containers。

綜上所述，不同公司或不同的組織，對其定義不同。隨着時間的變化，雲原生的定義也發生着變化。

2. 雲原生的理解

我們今天所討論的雲原生是大數據範疇內的雲原生。雲原生可以分爲雲和原生兩部分。

雲（Cloud）

雲（Cloud）是什麼？我們回顧雲的發展，起初沒有云，只有Traditional On-Premises IT，經過後續的發展，雲（上圖中深色部分）作爲提供的基礎設施（或服務）變得越來越多。作爲一個企業或企業的應用開發者，需要維護的東西越來越少，雲會提供許多服務。

原生（Native）

流行詞典中對native的定義如下：

如上圖中所示，native相當於土著，即在何處出生、生活。前幾年大家做的最多的是上雲或遷移到雲這個動作，即你的產品、應用並不是在雲上設計的，而是在雲還沒有提供服務之前就已經設計好了。Hadoop剛出來時，整個生態並不是爲雲設計的，如果雲已經像今天這樣成熟的話，那麼可能就是另外一個樣子了，因爲Yarn做的很多事情是編排調度。現在，編排調度或容器化的服務，已經完全跟Hadoop當年提出時不同，所以從Hadoop生態來說，它其實並不是On the Cloud。

對於雲原生，我提出這樣的理解：生於雲，長於雲。

生於雲即應用或整個產品在設計時，是按照有云服務進行設計的，公有云、私有云或者混合雲的形式，爲應用或產品提供很多特性或服務。我要做的是專注於本身應用的特性和邏輯，把可擴展性、彈性、安全性等特性，放到雲上或雲提供的能力上來使用，而不是我的應用自己去做。

長於雲是指除了在應用設計時利用雲服務，在應用的維護和演進過程中，也會使用雲提供的服務。隨着雲服務能力的不斷壯大，應用的新需求也會考慮使用雲服務新特性來實現，達到“長於雲”。

大數據雲原生意味着什麼？容器化上Kubernetes的確是一種雲原生，但如果現在新設計一些應用或產品，可能不只是上Kubernetes這麼簡單，而是要考慮這個產品哪些部分是可以剝離出來的、不用在自己的應用裏面去考慮的，以及哪些部分是可以直接依託於雲廠商或平臺去做的。

02/雲原生相關技術的演化

雲原生技術有哪些？我這裏列了一些時間點。

更早期的虛擬化技術我沒有列，因爲那些技術屬於上一個時代的事情，我從docker開始。因爲docker開始，大家對於容器化有了共同的認知。

2013年有了docker，2014年有了Kubernetes，但2014年Kubernetes剛發佈時並未掀起太多風浪。2015年，CNCF正式成立，它把Kubernetes當成第一個項目去運作。2018年Kubernetes畢業時，雲原生彷彿有了依託，上Kubernetes就變成了雲原生，Kubernetes變成了一個事實性的標準。後面像Istio的發佈，Knative的開源，這些技術的出現，相當於是在Kubernetes上添磚加瓦，讓Kubernetes變得更加豐富，Istio相當於容器間的通信者，Knative相當於無服務器的平臺框架。

如上圖下方所示，雲原生從微服務時代發展到服務網格時代，最後步入Serverless時代。

2021年1月，KubeVela1.0發佈，KubeVela 1.0可能沒有前面這幾個項目那麼有名。一是因爲推出的時間晚，二是因爲不是由Google推出。kubeVela相當於是阿里雲推出的一個項目，是作爲應用PaaS層的一個框架，有點類似於Knative作爲一個無服務器的平臺框架。

03/京東大數據在雲原生平臺化上的實踐

1. 雲原生技術選型

先看Knative這部分，上文中提到它是一個無服務的PaaS框架。對於京東大數據，Knative並不是好的選擇。因爲它必須是一個無狀態的http服務，而且還不能掛載PVC，所以只能去做無服務器短時任務的調度。

再看Service Mesh，它通過Sidecar的方式去提供容器間通信，但這個通信有成本，因爲它本來是兩個app之間的通信，變成了要通過sidecar去跳，那麼這個跳就意味着通信成本的增加，所以也不是很好的選擇。因此，我們現在並沒有直接使Service Mesh來管理容器間的通信。

除了上述幾個技術之外，在開源界的另一選擇是在Kubernetes上面去做Operator，就像Operators Hub，大家可以看到有很多開源服務它本身已經提供了Operator，而且也方便用，但問題是每個Operator都是各個組織自己開發的，並沒有一個公共的抽象，我們想改的話，需要對每個Operator進行修改，成本很大，所以這也不是我們的選擇。

2. 京東大數據的實踐

接下來看一下我們在京東的雲原生方式。

首先我們要定位。定位是一個PaaS層，但PaaS層是在Kubernetes的基礎之上去提供一些能力，包括資源、安全、API、應用組件配置等一系列管理能力，也包括控制能力。爲什麼單獨講控制能力呢？因爲我們做的方式跟社區的Operator邏輯一致，但又有些不同，我們把它抽象成一個統一的模型來做，而不是每個產品都做一個Operator。

業務模型分成三層，第一層是組件。Yarn裏面Node Manager或Resource Manager本身就一個程序，可以定義成一個組件。

第二層是應用模版。多個組件組合在一起就是一個應用，這個應用模板定義了一個應用。比如Yarn這個應用，它由多個組件組成。一個應用可能是單組件，也可能是多個組件，每個應用可以自己靈活組裝，提供了應用定義的靈活性。

第三層是系統模板。我們提供一個大數據的平臺，大數據平臺不是僅有一個Hadoop，而是帶着一系列產品，包括HBase、Yarn、Spark，還可以帶着數據傳輸、數據調度、數據管理、數據分析、甚至BI等一系列應用在一起，組合成一個大數據系統。

這個大數據系統可能會對不同的部門，或對不同的服務對象，可能存在不同的組合。有的可能是一個輕量級的，由最精簡的幾個應用組合成一個系統；有的可能很大規模，所以我們需要帶一系列標準。對於後面的使用者來說，只需要一個實例化的過程就可以使用。

上圖中可以看到我們有幾個主要的組件，一個是Portal，這部分是我們的管控臺，在這個管控臺裏面去定義上文中說的應用。從組件開始定義，組件裏面又包含了各個組件的配置文件、組件的鏡像image、一些動態配置，哪些配置項可以動態生成，在組件或者應用創建時，需要動態輸入。

另外，上文說的去組合成一個應用模板，以及組合成一個系列，這一系列都在合作區，由用戶來定義，定義之後會渲染出來Kubernetes裏面一個應用crd，應用crd由controller負責生成應用。Resource Watcher也是一個重要的組件，是去watch Kubernetes上面各個資源的狀態，然後再更新到外部數據庫中。

我們用了Sidecar的模式提供很多應用特性。上文說到雲原生的關鍵是可以提供一些平臺級的特性，這些特性我們是作爲Sidecar來以平臺的方式統一提供，但是各個應用可以選擇性地去配置。當然每個特性其實都在於背後的一些服務，我們會作爲一個平臺統一去提供。

這裏其實是一個具體的翻譯過程，從用戶提供的具體鏡像，鏡像裏面需要帶配置文件、一些腳本、一些二進制、包括Docker file，相當於是把這些應用的差異性下沉到應用組件裏面，由組件內部去控制差異性。如果把每個應用配置文件都做在每個Operator裏面，必然會導致整個Operator的膨脹。所以，我們的做法更多是將這些差異性放到每個組件內部，但是我們的控制器會負責調用這些腳本，由這些腳本把差異性實現出來。

整個過程與上文相同，從Portal裏面產生Application的Yaml，這是我們自定義的一個資源格式，然後再由controller翻譯成Kubernetes裏面的Service、Pod、Volume、ConfigMap等資源。

從這裏可以看出，對於用戶來說，不管是應用的生產者，還是使用者，都不需要太關心Kubernetes的這些概念。因爲對於整個行業的從業者來說，Kubernetes並非一個很簡單的東西，特別是隨之衍生出來的Knative或者Istio，很難讓大家都理解這些，並能熟練地應用所有的資源。只要我們能夠提供一層平臺，就可以把這些屏蔽掉，想要用哪個應用就用哪個。

再看一下應用crd的例子。

我們定義爲cnp，我們內部的一個Cloud Native Platform，在這個Application裏面我們可以看到它的volumes的定義，這個volumes跟Kubernetes裏面的volumes不太相同，裏面更多是具體的PVC的關聯聲明。Volumes template是我們自己獨創的一個概念，在這個模板裏面，可以定義這個模板如何聲明，爲每個Pod聲明出自己對應的volume。在每個Application裏面有多個Components，我們這個components是一個抽象的邏輯概念。在Application裏面分成多個Components，每個component可以有自己的定義。這個是對於HBase而言的，分成Master和Region Server。這裏我們特意加了一系列的Sidecar containers，這是我們平臺提供的一個特性，裏面提供一些監控或日誌的能力。每個Sidecar會在Application裏面根據Portal取得它的定義和選擇，把Sidecar定義進來。

大家如果熟悉KubeVela的項目，會看到我們在概念上有一些類似，比如我們都有統一的Application，也都有Components這樣的概念。但我們的特點在於我們是平臺直接構建Application的能力和特性，而不是一個開發框架。

因爲我們是要提供一個平臺，京東內部會統一去使用，對外提供商業化服務時也是基於這個平臺提供大數據產品和應用，所以並不需要把這個平臺做成一個框架。

再介紹我們平臺中的一個特別點——協調工作流。

上文說到我們的controller跟雲原生operation裏面的controller是一致的，但也有不同，不同就在於引入了工作流的概念。我們使用聲明式的API來聲明，或者說創建一個Application的時候，並不是讓這個Application創建的過程完全變成一個controller內部的黑盒，我們是把這個controller協調的邏輯開放出來，展示給用戶看，整個Application是如何去協調出來的，包括存儲卷的檢查、申請和後面各個組件如何去做，然後在組件內部，依然可以結合成子工作流的方式，把內部的流程再一步步展露出來。

第二個目的是可以去做自定義的Hook，這是我們平臺可以支撐多個產品的一個原因。我們可以把一些Hook點暴露出來，讓各個產品有機會在這些節點上去做自己的定義。比如在多個組件都已經啓動後，會做集羣的初始化動作，在這邊定義後，會把這個命令傳遞到集羣各個Pod裏面去。另外還可以支持組件之間的傳遞，比如component A創建或啓動之後，會產生一個dns，我們會把這個dns參數作爲下一個組件的輸入。這個很常見，在大數據裏面，比如需要啓動一個Zookeeper，啓動了Zookeeper這個多節點集羣之後，這個Zookeeper會作爲下一個服務輸入，比如Hbase或其它多個組件。

在Kubernetes的很多其他擴展work node中，不支持這種大數據裏面的多shard概念。對於每個應用來說，pod相對來說是獨立或平等的，在大數據裏面自然存在一種shard的概念。舉個例子，上了1、2、3，那1、2、3每個裏面存在自己的replica，我們會支持shard的定義，既支持多shard，也支持單shard。如果存在多shard，我們會對每個shard做親和性和反親和性的支持。pod的命名比較有意思，對於一些多shard應用來說，我們的命名方式可以很清晰地看到這個pod是屬於哪個shard裏面的第幾個副本分片，這也是我們的特點之一。

上圖是一個典型的應用場景，作爲一個應用管理員，京東內部的這些大數據產品裏面有很多團隊，每個團隊集成到應用平臺的時候，他來負責應用模板的定義和發佈，發佈到應用市場。對於用戶來說，他需要做的是應用的創建和使用。

京東內部有多個雲臺盤，比如京東雲，是對外開放的一個公有云市場，我們在京東雲上面，自己申請資源去做開發和測試的一些工作。Jdos是我們的一個生產環節的雲，我們在這上面將多地區多集羣進行部署，然後連到平臺上統一管理。但是我們現在還沒有去做跨集羣的部署能力，這是後面會考慮的事情。我們現在更多是把應用放在單個集羣，因爲從需求優先級來說，在單機羣上的效率會更高。後面如果考慮多集羣的高可用支持，我們也會考慮到地域分佈和集羣間的通信，綜合考量如何去做多集羣的高可用。

04/雲原生應用平臺的發展

我們再來看一下過去十幾年PaaS的發展，也由此展望後續的發展方向。

Heroku

2009年提出，在推動雲原生髮展過程中起到了關鍵作用，不過Heroku在2010年就被Sales Force收購了，但現在Heroku仍然作爲一個產品對外銷售，它是一個企業級的應用，平臺做得很成熟。但有一點很可惜，它是一個閉源的系統，你必須是一個資深的Heroku用戶，才能參與到開發和定製的工作。

Cloud Foundry

這是第一個開源的PaaS平臺，由Pivotal公司提供。

Openshift

Openshift是紅帽的。因爲它們有自己的容器化技術，不是我們後面所認知的容器化標準，所以造成了它現在的生命力問題。雖然到15年的時候，Open shift第三版兼容了Docker，但很複雜，很難迭代。從開源或者社區角度來說，大家去選擇或模仿它的動力不足。

國內項目

Rainbond、Kubesphere是青雲提供的容器雲概念，把現在流行的好用的組件都裝在了上面。但它並不是一個完整的應用抽象的概念，而是把一堆好用的組件集合在一起。

接下來是KubeVela，它提出的是雲原生應用的概念，以應用爲中心去做雲原生，但它提供的是PaaS的開發框架。從我們自己的思考來看，我們並沒有完全使用這樣一個框架，因爲我們有些思路和他們的定義並不完全一致。

我希望通過今天的這個分享引導大家去思考各自公司的雲原生平臺該如何設計，主要有兩部分，一部分是它是否生於雲，另一部分是這個平臺後續的發展是不是長在雲上。

今天的分享就到這裏，謝謝大家。

分享嘉賓：

京東零售大數據雲原生平臺化實踐

01/雲原生的定義和理解

1. 雲原生的定義

2. 雲原生的理解

02/雲原生相關技術的演化

03/京東大數據在雲原生平臺化上的實踐

1. 雲原生技術選型

2. 京東大數據的實踐

04/雲原生應用平臺的發展

數據治理與大模型一體化實踐

降本不增“笑”的正確打開方式

基於知識圖譜的多模內容創作技術

京東零售大數據雲原生平臺化實踐

未來數據庫需要關心的硬核創新

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結