世界萬象,總需要一個「端口」走進去

想潛入萬象的新世界,

需要更酷的萬能“終端”開發工具。



Cloud 

Imagine



視頻化、數字化、智能化,正在讓世界萬象重生,但進入這場音視頻主導的數字化浪潮裏,需要一個萬能的終端。

當前,終端性能挑戰加劇,端側算力遭遇瓶頸......是否存在一種可能性,讓所有企業從複雜的音視頻開發工程中抽身,重新迴歸業務本身?

一站式音視頻服務如何獲取?冗長繁瑣的SDK接入流程怎樣簡化?能否在降低開發門檻的同時,依然掌握主動權?

場景智能,會是下一個風口嗎?

面向場景建設音視頻技術能力,如何釋放更多“數字生產力”?

應對多樣化,音視頻終端套件如何滿足“千行千面”?

本文由IMMENSE、「阿里雲視頻雲」媒體服務應用端負責人洪炳峯和LiveVideoStack策劃、採訪而成。



01

掀開數字化浪潮的一面



當談論行業數字化時,我們在談論什麼?


過去幾年中,行業數字化建設如火如荼。

據權威數據,65%的行業數字化信息來自視頻,另外,還包含5%的音頻信息。不得不說,音視頻技術對於行業數字化來說,至關重要, 而音視頻數字化也正是行業數字化的先行之態

昭然可見,承載於雲計算的音視頻技術,正向各行各業加速滲透,從消費互聯網,轉向教育、醫療、金融、零售等傳統行業,產業互聯網紛紛掀起音視頻數字化風潮,遠程監考、遠程醫療、製造監控......視頻化早已是萬象之風。

更關鍵的是,這些新場景的湧現,在不停催生對音視頻能力的新訴求。顯然, 行業音視頻數字化,不再單純依賴某幾個單獨的PaaS原子能力,而更需要音視頻能力的有機組合

於是, 場景化的音視頻方案,迫在眉睫

我們發現,隨着音視頻應用場景深化,對“多SDK”的需求逐漸成爲“標配”。

往往一個音視頻場景,需要不同SDK協同運作,如直播推流+播放,短視頻拍攝+播放,直播+RTC實時互動等,但,動輒數月起步的開發週期讓衆多企業望而卻步。

當然,不只是開發週期一個痛點。 所以,當我們在談論行業音視頻數字化時,談的是衆多痛點的攻破




音視頻開發,需要一套有力的「組合拳」?


面對龐大的音視頻開發工程,企業落地的痛點顯而易見:

音視頻開發門檻高。

音視頻看似常見,卻是一個專業度極高的領域,尤其在端側開發更需要豐富技術經驗,而音視頻人才又相當緊缺,企業大多都無此儲備。

多SDK接入複雜。

每個SDK都需要分別對接、分別授權,且SDK接入能力的原子化,更提升了多SDK互相適配的難度。

海量設備兼容困難。

在行業視頻化進程中,更多“輕量化”需求隨之而來,Web/小程序等端形態在很多場景下愈發關鍵。如何保障海量多端設備的SDK兼容性,也變得愈加困難。

基於這些行業趨勢和挑戰,企業的音視頻訴求可總結爲: 高易用、高性能、場景化、多端化的多SDK組合及方案。

直面音視頻數字化浪潮,想要解穴所有痛點,一套Media“組合拳”亟需引入,以便讓更多企業走出“音視頻開發困境”,重新將視線對焦自身的業務邏輯。



02

重新定義「高易用」



MediaBox,音視頻開發的百寶箱?


爲了徹底解決音視頻開發痛點,阿里雲視頻雲推出MediaBox音視頻終端一體化套件,作爲媒體開發利器,可以助力企業加速音視頻數字化進程。

MediaBox,顧名思義,是一個 包羅萬象的音視頻魔盒,核心包括一體化的音視頻終端SDK和一系列面向不同場景構建的AUI Kits低代碼方案。

MediaBox音視頻終端SDK,以統一的技術底座,讓所有音視頻SDK在一體化架構下深度融合,實現完全自由靈活組合的同時,將Size極致化降低。同時,打通多端底層架構,實現多端一體化,做到一套代碼多端複用,目前已覆蓋iOS、Android、Web、Win、Mac等端。

MediaBox低代碼開發AUI Kits,是包含UI的低代碼集成方式。在SDK基礎上,AUI Kits封裝了場景化的UI實現,並配套實現App Server與UI聯動,整體構建了端到端的場景化方案。

依託於阿里雲視頻雲強大的PaaS雲服務和底層網絡技術,MediaBox就如同一隻百寶箱,可對音視頻能力 隨取隨用自由組合,而且 Size薄如蟬翼,輕鬆應對行業音視頻數字化中的各種疑難雜症。




誰來掌握開發主動權?


音視頻終端套件的易用、便捷、高效是基礎。而MediaBox通過 SDK靈活組合、AUI Kits低代碼接入、開源開放、支持二次開發,刷新了對「高易用」的定義。

➤ SDK簡易又靈活

MediaBox提供超過15種的SDK組合形式,根據應用場景的不同,可自由選配相應音視頻能力的SDK,並且 只需對接一次,經過一次License授權即可使用,極大簡化SDK接入流程。

➤ AUI Kits小時級上線

作爲音視頻服務的端到端方案,AUI Kits將多SDK和雲PaaS能力進行場景化封裝,打包輸出場景功能組件和相對完整的UI實現。

通過“低代碼”方式快速接入並跑通,可將月/周級的集成時間縮短爲小時級,大大降低了企業的接入成本。企業無需關心音視頻SDK的複雜邏輯和最佳實踐,而能更專注於自身的業務實現。

➤ AUI Kits開源開放、個性定製

除支持敏捷開發外,AUI Kits還在原來的低代碼音視頻工廠之上,進行 全新升級

提供開源開放的UI和App Server源碼,允許客戶 二次開發,自定義打造品牌標識和視覺風格,實現個性化業務定製,讓企業在降低開發門檻、縮短開發週期的同時,依然能夠掌握開發主動權。

相對以往低代碼音視頻工廠追求的更快速之上,MediaBox更聚焦 高度的靈活和易用

值得一提的是,AUI Kits方案當前是 免費的,企業只需爲PaaS能力付費,即可擁有接近SaaS的接入體驗,享受PaaS的低成本優勢。

“高易用”的音視頻開發工具正在被重新定義。MediaBox以靈活、快速、敏捷、個性化、低成本的方式,助力企業一站式極速獲取音視頻能力。



03

不止「工具」



在「高易用」之上,工具的另一項使命是?


音視頻開發工具,既要保證接入前的“高易用”,也要滿足接入後的“極致好用”。

企業對音視頻的期待是 高流暢、低延時、超高清、強穩定、低成本

基於此,MediaBox以高可用的穩定性體系,統一的數據指標體系、完善的自動化測試體系,不斷優化音視頻終端基礎性能和核心指標,爲客戶提供極致體驗。

爲了保證線上的高效運維,MediaBox還建設了端到端的全鏈路排障工具,通過智能分析,快速定位問題出現的鏈路節點,更快發現、排查和解決問題。

同時, 雲和端的深度融合,讓音視頻的 “極致好用” 更上一層樓。

結合底層網絡,AI技術以及雲端處理能力,阿里雲視頻雲打造了雲端一體、端到端、全鏈路的整體方案,滿足不同客戶的音視頻場景需求。

正如MediaBox與多元融合流媒體傳輸網絡MediaUni的“強強聯手”,能爲客戶提供從5-6s的普通直播,到1s以內延時的超低延時直播RTS,再到60ms的元渲染業務支持,不同端到端延時選擇,滿足企業的多樣化業務需求。




擁有“場景智能”的工具,纔是未來  ?


隨着AI大模型的發展,一些輕量化模型在終端運行也將成爲必然趨勢,AI模型在行業化的落地過程中,會衍生出更多 端智能能力

而MediaBox在場景化實踐中,同樣基於端智能技術,不斷創新突破。

例如,在播放器SDK中,智能預加載會利用智能算法,基於當前網絡狀況、用戶滑動行爲、歷史播放行爲等信息,動態控制預加載緩存、內存緩存大小,可以節省預加載流量,提升預加載內容的使用效率,達到成本和體驗的極致平衡。

隨着更多場景的深入,MediaBox將進化出更多 場景智能能力

例如,在 遠程教學一對多場景中,學生專注度下降導致教學效果差,是遠程教學的永恆痛點。

在此背景下,MediaBox推出 專注度智能檢測SDK,能夠實時檢測學生的狀態變化,將學生的專注度反饋給老師,幫助老師及時感知學生上課情況,提升整體教學效果。

場景智能,爲業務賦能帶來了更多可能性。音視頻終端套件,不止是單純的開發工具,更是行業的創新型端口,以最輕量的方式,賦予場景全新的數智化能力。



04

萬象世界,一“器”當先



開發工具,可以滿足“千行千面”?


“行業數字化”高歌猛進的背後,是對行業場景的深刻理解。

回顧音視頻技術發展歷程,音視頻在互娛行業中發展壯大,場景相對簡單且成熟,對音視頻能力的要求也相對通用。

當音視頻向更多傳統行業滲透時,由於傳統行業由一個個不同場景構成,各場景特點不同且具備明顯的行業屬性,因此, 面向不同行業、不同場景、不同特點,來建設一體化的音視頻能力,才能更好滿足行業數字化需求。

目前,阿里雲視頻雲已針對不同行業場景,推出MediaBox多場景AUI Kits方案和多SDK,包括 直播場景的娛樂直播、電商直播、企業直播, 互動場景的遠程監考、互動課堂, 通信場景的語聊房、KTV以及 點播場景的短視頻、長視頻等。

➤ 在教育行業,爲遠程教學場景而生的互動課堂AUI Kit方案,支持學生專注度智能實時檢測,1萬+學生實時白板互動,50+實時連麥,10萬+學生實時觀看,滿足大班課、公開課等場景需求。


➤ 在零售行業,各大零售商都在嘗試建立私域流量池,或自建APP進行直播帶貨。電商直播AUI Kit方案,提供豐富的互動直播功能,支撐多家企業從0到1快速構建直播電商業務。


➤ 在汽車行業,新車發佈場景廣受關注,企業直播AUI Kit方案,助力企業快速搭建直播間功能,打造面向全球車友的重磅新車發佈會直播,並保障數十萬併發下的優質播放體驗。


➤ 在數字閱讀行業,除傳統文字閱讀之外,把文字劇本轉爲短劇播放成爲新風尚,短視頻AUI Kit,基於點播場景的能力訴求,設計與實現了一站式短視頻製作播放解決方案。


➤ 在沉浸式場景,VR全景播放SDK,採用FOV的方式傳輸音視頻數據,可以在提升流暢度的同時,降低帶寬成本,同時結合空間音頻,實現極致的沉浸式音視頻體驗。


可以看到,MediaBox的超能量正在向衆多場景釋放,而更多行業、場景正需要這樣的音視頻數字化加速“利器”,以打開新的機遇和空間。




雲上藝考,是教育數字化的縮影?


阿里雲視頻雲遠程智能監考方案,可作爲“音視頻數字化”在教育行業有效探索中的一個縮影。

隨着“藝考熱”的持續升溫,組織大規模線下考試不僅需要投入大量人力物力,還需要考生承擔長距離線下赴考的時間、經濟成本,而很多藝考生往往需要短期奔赴多個學校,這更加劇了負擔。但“線下”對於“藝考”這一特殊類型,是慣例的必要。

MediaBox的場景方案,讓所有的藝考生都不必應對這樣的苦楚。

阿里雲視頻雲通過 遠程監考AUI Kit方案,聯合生態夥伴搭建遠程監考平臺,成功支撐中國美院今年的本科“雲上藝考”,強穩定保障海內外4萬+考生順利完成線上藝考。

以低代碼方式快速集成,遠程監考AUI Kit方案提供監考端和考生端的開源組件、架構設計指南,大大降低接入門檻。在端側覆蓋上,覆蓋iOS/Andriod、網頁、釘釘應用和微信小程序多端,保障遠程監考場景下的 “高易用”

基於全球3200+節點的底層網絡,以及強大的媒體處理能力,遠程監考平臺可承載10萬+考生同時在線,實現監考端視頻延時1.5秒內、1對1通話延時400ms內,全方位滿足高可靠、高併發、低延時、高清晰度的 “極致好用”

同時,在這樣的雲考試場景中,也蘊育出新的 “場景智能”,阿里雲視頻雲就此開發推出 智能防作弊SDK

相比傳統防作弊,是在雲端分析視頻截圖,分析量大,耗時久,成本高。而智能防作弊SDK, 是在端側實時檢測,包括人體行爲檢測、電子產品檢測、衣服檢測、環境檢測等,快速上報,速度更快,成本更低,目前已覆蓋Android/iOS/Web等多端設備。

藝術類考試與其他線上機考不同,要求將主機位畫面囊括整塊畫板以及考生側臉,但機位不同產生的算法調優會更爲複雜。而智能防作弊SDK以原子化接入的方式,提供多種端側實時檢測能力,並可根據不同考試場景需要,動態開啓、靈活選用, 定製化滿足線上考試的諸多場景類型。

正是源於對行業音視頻場景的深度理解,才能革新解決行業痛點和打開場景新空間。

MediaBox走向更廣的行業場景、探入更深的場景能力,未來離不開與行業 生態夥伴的共同創造。此次LiveVideoStackCon,阿里雲視頻雲也將發佈新的生態合作計劃,期待與更多生態夥伴攜手,打開行業音視頻數字化的萬象世界。




作爲加速“利器”,

MediaBox如何實現行業音視頻數字化的新升級?


7月28日下午

LiveVideoStackCon2023上海站

阿里雲視頻雲專場

阿里雲智能資深技術專家帶來演講

《MediaBox:行業音視頻數字化再加速》

釋放音視頻場景的“數字生產力”!




⬆️ 掃描上方二維碼報名專場



點擊閱讀原文立即預約專場

本文分享自微信公衆號 - LiveVideoStack(livevideostack)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章