快手與直播延遲卡頓較勁的這些年

2020 年,COVID-19 成爲“世界的通用語言”,截止 7 日 2 日,全球累計確診超過 1071 萬人。目前,雖然世界各國不再提倡全民主動宅家戰“疫”,但人們原先正常的工作節奏和社交習慣已被打破,各行各業出現了裁員潮。

疫情之下,百業凋零。而一場疫情卻將宅文化與宅經濟再次帶入到大衆的視野。宅文化源自於上世紀80年代的日本,當時衆多日本青少年、無業者以及在職員工沉迷於遊戲和動漫,促使日本的 ACG 產業(Animation 動畫、Comic 漫畫、Game 遊戲)得到了快速發展。而現狀之下,遊戲產業似乎再次成爲了時代的寵兒。

在疫情最嚴重的 3 月底,Newzoo 市場分析師曾發文表示,根據 Verizon 的報告,高峯時段的遊戲流量較前一週增加了 75%。同時 Twitch 和 YouTube Gaming 收看率較前一週均至少增長了 10%。管中窺豹看本質,人們在疫情期間花費了更多的時間在電子遊戲上,由此直接拉動了遊戲直播的飛速發展。
圖片來源:快手直播官網

快手作爲短視頻與直播領域的先行者之一,十分重視遊戲直播領域的發展。隨着遊戲類內容的不斷擴充,快手敏銳的觀察到由於遊戲直播興起給通信技術帶來了嚴峻的挑戰。近日,快手正式發佈了基於流式的直播多碼率自適應標準 LAS(Live Adaptive Streaming),其用於提供低延遲、平滑、流暢的直播體驗。快手科技算法科學家、傳輸算法團隊負責人周超博士表示,快手已將 LAS 端到端的解決方案開源,幫助業界更多用戶實現零門檻接入和使用 LAS 解決方案。

拿來主義真的好嗎?

從 2016 年開始,快手開始着手組建音視頻技術團隊。到了 2018 年,快手開始關注到多碼率自適應的問題,而受限於當時團隊人手不足,無法集中進行開發。2019 年,隨着直播業務的快速發展,快手遊戲直播業務激增,多碼率自適應方案再次被團隊提上日程。

根據 2019 年數據顯示,快手的直播 DAU 超過 1 億,其中游戲直播日活用戶數達到 5100 萬。周超博士表示,站在用戶角度,遊戲直播體驗至關重要,快手針對其面臨的三大痛點:卡頓、模糊與延遲大,進行了針對性的研發。

對於這些問題,單獨優化某一個指標並不難,難點在於彼此之間互相制約。例如通過降低碼率能降低卡頓率,提升觀看直播的流暢度,但降低碼率損失了清晰度的體驗,會引起直播畫面模糊。同時低延遲會帶來良好的體驗感受,但過低的延遲,客戶端的緩存數據也越少,對網絡抖動的抗性也越差,又會增加用戶的卡頓風險。

面對遊戲直播的複雜性,顯然單一的視頻質量(碼率、分辨率)或固定的檔位下發策略難以適應,多碼率方案已經成爲平衡清晰度與卡頓的最佳選擇。同時考慮到快手用戶的規模龐大且分佈廣泛,網絡差異性較大,究竟如何進行技術選型,這個難題擺在了快手音視頻技術團隊面前。

周超博士透露,針對多碼率方案,當時團隊有兩條路可以走,一是拿來主義,二是自研之路。

拿來主義:多碼率自適應是在抖動網絡下保證觀看流暢度最有效的手段之一,主要包括 MPEG-DASH 和 HLS 這類國際標準協議。優點在於部署快,見效快。但二者均是基於分片傳輸,設計之初主要用於點播場景,而非直播。其直接用於直播場景會造成延遲過大,直接影響直播體驗,顯然對於快手來說是無法接受的。雖然目前 MPEG-DASH 和 HLS 都有低延遲方案的選擇,例如 LHLS,但此類方案尚未標準化,離落地應用尚需時日。

自研之路:自主研發一套高清晰、低卡頓、低延遲的直播多碼率方案。自主研發相較拿來主義優勢明顯,首先從前期架構、算法、協議等方面考慮,快手可以自由調控,靈活結合不同業務需求進行優化。其次,對於後期部署而言,自主研發可兼容多種框架、支持多種協議,保證方案的易擴展性。但同時自研的缺點也很明顯,方案從零到一各方的不確定性將會是最大的挑戰。此外,針對快手而言,直播主要依靠第三方雲廠商進行分發,採用自研的方案,意味着需要所有 CDN 廠商配合做定製化開發。

好在快手對於自研新技術應用經驗豐富。周超博士透露,已經成熟落地的 KTP 方案便是由快手自主研發,擁有自主的知識產權。當時的快手同樣面臨兩難的選擇,經過反覆的斟酌與權衡,爲了把傳輸做到極致,快手毅然選擇了自研 KTP 方案。目前,KTP 方案已全面用於快手的各項業務,應用反饋良好,這也讓直播多碼率方案團隊擁有了更堅定的信心。

自研之路 = 理想的思路 + 執着的堅守

豐富的自研經驗以及團隊的堅定信心,讓快手再次走上了自研之路。周超博士強調,已有的解決方案均存在不足,難以滿足快手對於業務發展的需求。因此,快手自主研發了一套基於流式的直播多碼率自適應方案,其目標是在支持直播碼率自適應的同時,實現流式直播的低延遲。

低延遲與清晰度兼顧的自研思路

總體而言,本次快手推出的直播多碼率自適應方案包含兩大特性:一是基於流式傳輸,保證低延時;二是支持多碼率,依據每個用戶的網絡狀態,自適應選擇最佳的視頻清晰度。

與傳統的基於分片的多碼率架構相比,基於流式的直播多碼率能提供更低的延遲,在架構上也有一些特性,主要包括:

轉碼:不同於 MPEG-DASH 或 HLS,基於流式的直播多碼率方案在轉碼時不需要進行切片操作,只需在轉碼時保證不同的轉碼流 I 幀的 pts 嚴格對齊,從而保證視頻流的無縫切換

CDN 功能升級:CDN 側也即基於流式的直播多碼率方案的服務側,需要升級支持三種拉流模式,即默認位置拉流(傳統拉流模式)、絕對位置拉流(指定吐流絕對位置)與相對位置拉流(指定吐流相對位置)

自適應算法:在自適應算法上,與分片傳輸的策略相比,基於流式的傳輸邏輯會一定程度增加自適應算法的難度(例如在流式傳輸中,因爲源數據實時產生,觀測到的平均帶寬值近似等於當前請求的視頻碼率,無法反應真實的帶寬),但流式架構更加靈活,並且能顯著降低分片架構中存在的傳輸 ON-OFF 現象,從而降低了碼率切換過於頻繁的問題。周超博士指出,快手針對流式的直播多碼率方案,設計了一套高效的自適應算法 ,並將具體實現對外開放

自研之路沒有祕訣只有堅持

起初,基於已有的自研經驗,快手自研之路還算順利。周超博士表示,當時團隊內部氛圍積極樂觀,預估三至五個月後方案便可上線。團隊之外,CDN 廠商也都十分認可這套架構,配合度極高,解除了方案落地的後顧之憂。

但理想很豐滿,現實很骨感。經過四個月的開發與聯調工作,直播多碼率自適應方案進入了灰度與 AB 測試階段。最終,迎接團隊的不是成功的驚喜,而是失敗的心灰意冷。根據反饋數據顯示,無論是卡頓率等 QoS 數據,還是時長等 QoE 數據都呈現負向。周超博士透露,當時就連自己都產生了自我否定,開始懷疑是否是多碼率自適應算法設計存在缺陷。

到底爲何數據會呈負向,周超博士和團隊開始了漫長的求證和優化過程。首先,周超博士對算法的邏輯和實現進行了反覆檢查,基本排除了算法的因素。接着數據負向排查持續進行了數月,但方案收益依然顆粒無收,直播多碼率自適應方案一度變成了燙手山芋,甚至到了擱置的狀態。團隊內部氛圍十分低落,方案優化更是無從下手。

自研之路沒有祕訣只有堅持。周超博士認爲,做事情總該有始有終,爲了激勵團隊,自己硬着頭皮重新梳理了整個方案,責任到人,逐個環節去跟核心開發人員覈對預期需求和具體實現情況。強迫團隊內部開始行動,基於數據驅動,採用加埋點、AB 測試、數據分析與優化不斷循環的方式,不斷髮現問題、解決問題。

經過數月的分析與優化,2019 年 10 月直播多碼率自適應方案存在的問題全部得到了解決。並在“實戰”的遊戲直播中,成功的保證了直播視頻的清晰度、卡頓率與延遲,用戶時長等 QoE 收益增長明顯。當遊戲直播的收益開始凸顯,快手 APP 也決定採用該方案提升站內直播體驗。目前,這套方案已經全面應用於快手的各項直播業務。

以開源驅動行業發展

鑑於此,直播多碼率自適應方案開始逐步實現標準化與方案開源。周超博士表示,一方面,隨着方案的收益穩步提升,獲得了諸多的肯定。另一方面,考慮到如今市面上沒有針對直播多碼率標準的方案,這也許是快手爲業界作貢獻的好機會。經過團隊內部的協商,正式將該直播多碼率方案命名爲 LAS,目前快手已經將整套方案重新梳理,形成 LAS 的標準文檔,並已正式開源。

行業要發展,標準須先行。快手選擇做標準與開源,主動對外開放技術,只是希望可以幫助其他企業少走些彎路,畢竟直播多碼率自適應方案從開始調研,實現再到全量,快手解決了方案和架構選擇、工程實現、算法優化等諸多問題。

至於超越,我覺得這也是一種好事,說明 LAS 還有很大的優化空間,周超博士解釋道,快手從不怕“別人偷技術”。其實開源的意義也在於開放心態和樂於分享,這標誌着一個項目可以彙集多支團隊的智慧,也許困擾你的難題便會迎刃而解,這和閉門造車的理念形成了鮮明的對比。

目前,LAS 開源涵蓋服務端、客戶端和自適應算法。阿里雲、騰訊雲、百度雲、金山雲、網宿雲等雲廠商均已支持 LAS。此外,業內知名開源流媒體服務器 SRS 也已支持 LAS,基於 SRS 4.0 及更高版本,企業客戶也可搭建自己的 LAS 服務端以滿足個性化的需求。在客戶端,快手已經開源了 LAS Web 的實現,包括協議、架構和自適應算法。

當下只是 LAS 1.0,未來 LAS 還將進一步完善優化,主要包括以下幾個方面:

跨平臺:未來快手希望可以實現跨平臺的支持,例如移動端的支持和開源。

多協議:在協議層面,目前開源的版本是基於 HTTP-FLV 的實現,未來可以支持更多協議,例如 WebRTC、QUIC 等。

全鏈路:LAS 目前主要是針對拉流端的多碼率自適應方案,未來將涵蓋推流、轉碼,打造一套全鏈路的解決方案。

自適應算法:自適應算法是 LAS 高效性的保障。快手擁有完善的測試環境,AB 系統,爲新算法的對比、迭代優化和落地奠定了基礎。

嘉賓介紹


周超博士,畢業於北京大學,曾任職於華爲 2012 實驗室。現任快手科技算法科學家,快手傳輸算法團隊負責人。主要研究方向包括多媒體處理與通信、流媒體傳輸優化等,發表論文 40+,申請專利 50+,曾獲得 2012 年 IEEE VCIP Best Sthttp://url IEEE VCIP Best Paper Award。

如欲瞭解 LAS 的詳細文檔、架構、部署方式、測試數據等,可以登錄 LAS 官方網站

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章