愛奇藝推薦中臺:從搭建到上線僅10天,效率提升超30%

隨着業務的高速發展,出現大量業務需要提供推薦服務的場景,然而業務團隊一方面沒有足夠的推薦領域知識,另一方面也沒有足夠人力去搭建一套完善的推薦系統,導致業務團隊很難提升各業務內的推薦效果。在這樣的背景下,愛奇藝走上了推薦中臺之路,從搭建到上線僅10天時間,研發效率提升30%以上。我們有幸邀請到愛奇藝高級技術經理張時駿來分享一個推薦中臺完整的(技術分層)體系。今年10月,他將在 QCon全球軟件開發大會(上海站)2019對此作詳細介紹。

InfoQ:請問您對技術中臺和業務中臺是如何理解的?

張時駿: 自從馬雲的“大中臺、小前臺”口號問世,業界各公司都紛紛響應,搭建起了各種各樣的中臺。但中臺到底是什麼,大家並沒有一個完全統一的定義,大致的邊界在於快速變化的前臺和繁重的後臺之前搭建起一座橋樑,使中臺通過一些通用的功能來快速爲新的前臺業務提供支持,尤其是在瞬息萬變的互聯網行業提供快速試錯快速決策的關鍵能力,以提高公司執行效率。我個人所理解的中臺大致分爲業務中臺和數據中臺這兩大部分。業務中臺以提供通用的業務能力爲主,例如最經典的電商中臺,可以把商品、庫存、用戶、訂單等系統都囊括在內,提供完整的電商業務能力,還有推薦中臺、搜索中臺等也都是提供某一業務能力的中臺。數據中臺則是整合散落在各處的數據,經過分析處理提煉,提供給前臺能直接能使用的業務數據,例如用戶畫像數據,可以把用戶在不同業務中的行爲數據全都整合到一起,幫助新業務能更精準刻畫用戶。對於技術中臺來說,更像是提供一些與業務無關的通用技術能力,比如提供大數據處理能力,大數據存儲能力,數據中間件能力,但正因爲這些通用技術能力與具體業務無關,前臺很難通過一個技術中臺來實現一個業務,那這個技術中臺是不是還能稱爲一箇中臺也是值得商榷的。
 
InfoQ:如何看待中臺與平臺之間的關係?

張時駿:在我看來,平臺是一個更寬泛的、可大可小的概念,中臺是一種特殊形式的平臺。還是拿剛纔的電商來舉例,如果說電商中臺,那麼很明顯它不會把前臺後臺包括在內,而如果說電商平臺,那麼它是把前後臺全都包括在內的,這是個大的概念。反過來說,電商裏的一個子模塊也可以成爲一個平臺,比如訂單平臺、商品平臺,那麼這相對於電商中臺又是個小的概念。還有些剛纔說到的與業務無關的通用技術能力可以稱之爲平臺,例如大數據處理平臺、數據存儲平臺,這些都是偏底層提供基礎服務的平臺,很多業務中臺和數據中臺都是基於基礎服務平臺之上架構的。

InfoQ:愛奇藝是從什麼時候開始做中臺的?爲什麼要做中臺,在做中臺之前如果要支持新業務是什麼樣子的?

張時駿: 愛奇藝是從2018年下半年開始規劃做推薦中臺的。因爲在做推薦中臺之前,有很多業務方想要對接推薦系統,但推薦團隊人力資源有限,只能滿足一部分業務需求。對於能滿足的部分業務,推薦團隊就需要從頭搭一套針對業務的推薦系統,耗費不少人力。對於無法及時支持的業務,很多業務團隊就只能自己去搭建一套推薦系統。但業務團隊本身的強項在業務開發上,對推薦系統的瞭解不是特別深,而且能投入的人力也有限,最終推薦效果不是很好,也浪費了公司人力資源,所以推薦團隊就開始規劃實現推薦中臺,讓各個業務前臺都能簡單方便接入推薦中臺,快速實現業務需求。
 
InfoQ:愛奇藝的推薦中臺是如何推動的,組織架構方面是否有做一些配合調整?在團隊建設上,有哪些新增的要求?

張時駿:我們單獨成立了推薦中臺的團隊來推動愛奇藝推薦中臺工作的開展,然後在公司內部的一些場合爲其他團隊介紹了推薦中臺的工作進展,歡迎各個業務團隊來接入推薦中臺。在業務接入推薦中臺的過程中,遇到一些新的問題或者不支持的功能,反過來又推動推薦中臺進一步的發展。在團隊建設上,基本上和之前的要求都一樣,只是因爲推薦中臺會接入各種不同的業務,需要儘量通用化,對整體架構設計能力和大局觀有了更高的要求。

InfoQ:一個推薦中臺完整的(技術分層)體系是什麼樣的?

張時駿: 一個推薦中臺在底層需要有內容生產平臺、內容數據倉庫、用戶行爲日誌平臺、數據處理平臺、數據存儲平臺、機器學習平臺、數據分析平臺等基礎服務平臺的支撐,自身的體系內需要包括以下幾部分:推薦內容池、用戶行爲採集、特徵工程、用戶畫像、召回算法倉庫、排序算法倉庫、線上引擎、分析報表、配置平臺。推薦內容池根據業務需求從內容數據倉庫中篩選出適合進推薦池的內容,爲下游模塊提供基礎數據。用戶行爲採集從用戶行爲日誌平臺中篩選出符合業務條件的用戶行爲,並且將不同業務不同格式的用戶行爲日誌轉換成統一日誌格式,爲下游模塊屏蔽業務複雜度。特徵工程根據推薦內容池內推薦實體的meta信息生產meta特徵,根據用戶行爲數據生產用戶側和推薦實體側的統計特徵。用戶畫像採集了用戶年齡、性別、職業等靜態畫像和根據行爲日誌計算用戶對推薦實體、標籤、主題等維度的興趣畫像。召回算法倉庫和排序算法倉庫預定義常用的召回和排序算法,統一輸入輸出格式,方便靈活切換各種算法。線上引擎提供根據算法數據進行在線計算提供線上接口服務,並且支持對各種策略的配置及AB實驗。分析報表根據推薦後的用戶行爲數據分析推薦效果,爲後續的迭代優化提供數據指導。配置平臺方便前臺業務能夠通過簡單配置快速接入推薦中臺,提升效率。
 
InfoQ:是否有實際案例說明推薦中臺能提高前臺研發效率,快速實現自身業務目標的?

張時駿:在有推薦中臺之前,要支持一個新業務的推薦,通常需要按周來排期,並且需要安排大量人力100%專注在新業務上。在我們搭建起推薦中臺之後,某個業務有個圖文信息流產品想要接入推薦中臺來優化推薦效果,我們只需要簡單確認一下推薦內容池的選取規則和用戶行爲日誌規範,接下來就是配置和執行任務,每個模塊只要1-2天就能完成,其中大部分時間還都是在等待算法任務生產數據,消耗的人力微乎其微。最後整個項目從開始到上線只花了10天時間,並且上線後效果提升了30%以上,快速實現了業務方的目標。

InfoQ:在切換爲中颱過程中,有碰到什麼問題和經驗分享嗎?

張時駿: 切換推薦中臺的過程中,遇到了不少問題和挑戰,最主要的一點是通用性的設計和開發。不同的業務接入推薦中臺有不同的推薦實體、不同的用戶行爲日誌規範和不同的需求,如何能夠通過一套推薦中臺來接入所有的這些業務對於我們來說是一個最大的問題。對於不同的推薦實體我們要求業務方接入公司統一的數據倉庫,推薦中臺抽象提煉出各種實體通用的字段,再通過可配置化的字段映射表,把不同業務的不同推薦實體都統一到一張實體表上來。對於不同的用戶行爲日誌規範,推薦中臺定義了一套中臺用戶行爲日誌規範,對於公司內部主流的一些投遞規範,推薦中臺可以自動轉換,對於不滿足要求的用戶行爲日誌,則需要業務方經過轉換之後才能接入中臺。在輸入數據統一規範之後,內部流程的通用化就比較簡單,整個中臺不太需要關心業務的具體細節,對於推薦內容池的選取規則、特徵計算方式、召回排序模型的選取和調參、多樣性控制策略等都可以通過配置來實現各個業務的差異化。
 
InfoQ:愛奇藝推薦中臺未來有何演進計劃?

張時駿: 愛奇藝推薦中臺還剛剛起步,正在實踐中探索和總結,有很多不完善的地方需要改進。推薦中臺的目標始終是要讓前臺業務能夠快速高效實現業務目標,所以有2方面的工作需要不斷進行優化。一個是提升對接效率,雖然有了推薦中臺之後相比以前有了很大的效率提升,但還是有很大的提升空間,我們計劃能把對接過程儘量自動化,省去目前還存在的一些人工配置環節。另一個是提升推薦效果,業務接入推薦中臺之後並不是結束,而是一個新的開始,我們計劃把推薦中臺自營業務上的一些優化成果和業內一些最新的推薦算法都應用到推薦中臺上,讓所有的業務方都能享受到推薦效果提升的福利。

採訪嘉賓介紹
張時駿,現任愛奇藝高級技術經理。畢業於上海交通大學計算機系,現任愛奇藝高級技術經理一職,愛奇藝推薦中臺的總架構師。在愛奇藝從事推薦引擎架構和開發工作,近幾年專注於分佈式高併發線上引擎的架構,搭建了熱點信息流、小視頻信息流等推薦引擎。目前正在致力於愛奇藝推薦中臺的建設,旨在幫助公司內各業務團隊能夠以低成本、高效率、高產出的方式搭建出一套完整的推薦服務及其周邊配套設施,快速實現業務目標。

活動推薦

在QCon上海2019的演講中,張時駿將從推薦池、行爲日誌處理平臺、用戶畫像平臺、特徵平臺、召回模型倉庫、排序模型倉庫、線上引擎、報表分析平臺等方面逐一介紹推薦中臺的經驗和反思,點擊瞭解詳情

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章