想潛入萬象的新世界,
需要更酷的萬能“終端”開發工具。
視頻化、數字化、智能化,正在讓世界萬象重生,但進入這場音視頻主導的數字化浪潮裏,需要一個萬能的終端。
當前,終端性能挑戰加劇,端側算力遭遇瓶頸......是否存在一種可能性,讓所有企業從複雜的音視頻開發工程中抽身,重新迴歸業務本身?
一站式音視頻服務如何獲取?冗長繁瑣的SDK接入流程怎樣簡化?能否在降低開發門檻的同時,依然掌握主動權?
面向場景建設音視頻技術能力,如何釋放更多“數字生產力”?
本文由IMMENSE、「阿里雲視頻雲」媒體服務應用端負責人洪炳峯和LiveVideoStack策劃、採訪而成。
據權威數據,65%的行業數字化信息來自視頻,另外,還包含5%的音頻信息。不得不說,音視頻技術對於行業數字化來說,至關重要,
而音視頻數字化也正是行業數字化的先行之態
。
昭然可見,承載於雲計算的音視頻技術,正向各行各業加速滲透,從消費互聯網,轉向教育、醫療、金融、零售等傳統行業,產業互聯網紛紛掀起音視頻數字化風潮,遠程監考、遠程醫療、製造監控......視頻化早已是萬象之風。
更關鍵的是,這些新場景的湧現,在不停催生對音視頻能力的新訴求。顯然,
行業音視頻數字化,不再單純依賴某幾個單獨的PaaS原子能力,而更需要音視頻能力的有機組合
。
我們發現,隨着音視頻應用場景深化,對“多SDK”的需求逐漸成爲“標配”。
往往一個音視頻場景,需要不同SDK協同運作,如直播推流+播放,短視頻拍攝+播放,直播+RTC實時互動等,但,動輒數月起步的開發週期讓衆多企業望而卻步。
當然,不只是開發週期一個痛點。
所以,當我們在談論行業音視頻數字化時,談的是衆多痛點的攻破
。
面對龐大的音視頻開發工程,企業落地的痛點顯而易見:
音視頻看似常見,卻是一個專業度極高的領域,尤其在端側開發更需要豐富技術經驗,而音視頻人才又相當緊缺,企業大多都無此儲備。
每個SDK都需要分別對接、分別授權,且SDK接入能力的原子化,更提升了多SDK互相適配的難度。
在行業視頻化進程中,更多“輕量化”需求隨之而來,Web/小程序等端形態在很多場景下愈發關鍵。如何保障海量多端設備的SDK兼容性,也變得愈加困難。
基於這些行業趨勢和挑戰,企業的音視頻訴求可總結爲:
高易用、高性能、場景化、多端化的多SDK組合及方案。
直面音視頻數字化浪潮,想要解穴所有痛點,一套Media“組合拳”亟需引入,以便讓更多企業走出“音視頻開發困境”,重新將視線對焦自身的業務邏輯。
爲了徹底解決音視頻開發痛點,阿里雲視頻雲推出MediaBox音視頻終端一體化套件,作爲媒體開發利器,可以助力企業加速音視頻數字化進程。
MediaBox,顧名思義,是一個
包羅萬象的音視頻魔盒,核心包括一體化的音視頻終端SDK和一系列面向不同場景構建的AUI Kits低代碼方案。
MediaBox音視頻終端SDK,以統一的技術底座,讓所有音視頻SDK在一體化架構下深度融合,實現完全自由靈活組合的同時,將Size極致化降低。同時,打通多端底層架構,實現多端一體化,做到一套代碼多端複用,目前已覆蓋iOS、Android、Web、Win、Mac等端。
MediaBox低代碼開發AUI Kits,是包含UI的低代碼集成方式。在SDK基礎上,AUI Kits封裝了場景化的UI實現,並配套實現App Server與UI聯動,整體構建了端到端的場景化方案。
依託於阿里雲視頻雲強大的PaaS雲服務和底層網絡技術,MediaBox就如同一隻百寶箱,可對音視頻能力
隨取隨用、
自由組合,而且
Size薄如蟬翼,輕鬆應對行業音視頻數字化中的各種疑難雜症。
音視頻終端套件的易用、便捷、高效是基礎。而MediaBox通過
SDK靈活組合、AUI Kits低代碼接入、開源開放、支持二次開發,刷新了對「高易用」的定義。
MediaBox提供超過15種的SDK組合形式,根據應用場景的不同,可自由選配相應音視頻能力的SDK,並且
只需對接一次,經過一次License授權即可使用,極大簡化SDK接入流程。
作爲音視頻服務的端到端方案,AUI Kits將多SDK和雲PaaS能力進行場景化封裝,打包輸出場景功能組件和相對完整的UI實現。
通過“低代碼”方式快速接入並跑通,可將月/周級的集成時間縮短爲小時級,大大降低了企業的接入成本。企業無需關心音視頻SDK的複雜邏輯和最佳實踐,而能更專注於自身的業務實現。
除支持敏捷開發外,AUI Kits還在原來的低代碼音視頻工廠之上,進行
全新升級:
提供開源開放的UI和App Server源碼,允許客戶
二次開發,自定義打造品牌標識和視覺風格,實現個性化業務定製,讓企業在降低開發門檻、縮短開發週期的同時,依然能夠掌握開發主動權。
相對以往低代碼音視頻工廠追求的更快速之上,MediaBox更聚焦
高度的靈活和易用。
值得一提的是,AUI Kits方案當前是
免費的,企業只需爲PaaS能力付費,即可擁有接近SaaS的接入體驗,享受PaaS的低成本優勢。
“高易用”的音視頻開發工具正在被重新定義。MediaBox以靈活、快速、敏捷、個性化、低成本的方式,助力企業一站式極速獲取音視頻能力。
音視頻開發工具,既要保證接入前的“高易用”,也要滿足接入後的“極致好用”。
企業對音視頻的期待是
高流暢、低延時、超高清、強穩定、低成本。
基於此,MediaBox以高可用的穩定性體系,統一的數據指標體系、完善的自動化測試體系,不斷優化音視頻終端基礎性能和核心指標,爲客戶提供極致體驗。
爲了保證線上的高效運維,MediaBox還建設了端到端的全鏈路排障工具,通過智能分析,快速定位問題出現的鏈路節點,更快發現、排查和解決問題。
同時,
雲和端的深度融合,讓音視頻的
“極致好用”
更上一層樓。
結合底層網絡,AI技術以及雲端處理能力,阿里雲視頻雲打造了雲端一體、端到端、全鏈路的整體方案,滿足不同客戶的音視頻場景需求。
正如MediaBox與多元融合流媒體傳輸網絡MediaUni的“強強聯手”,能爲客戶提供從5-6s的普通直播,到1s以內延時的超低延時直播RTS,再到60ms的元渲染業務支持,不同端到端延時選擇,滿足企業的多樣化業務需求。
隨着AI大模型的發展,一些輕量化模型在終端運行也將成爲必然趨勢,AI模型在行業化的落地過程中,會衍生出更多
端智能能力。
而MediaBox在場景化實踐中,同樣基於端智能技術,不斷創新突破。
例如,在播放器SDK中,智能預加載會利用智能算法,基於當前網絡狀況、用戶滑動行爲、歷史播放行爲等信息,動態控制預加載緩存、內存緩存大小,可以節省預加載流量,提升預加載內容的使用效率,達到成本和體驗的極致平衡。
隨着更多場景的深入,MediaBox將進化出更多
場景智能能力。
例如,在
遠程教學一對多場景中,學生專注度下降導致教學效果差,是遠程教學的永恆痛點。
在此背景下,MediaBox推出
專注度智能檢測SDK,能夠實時檢測學生的狀態變化,將學生的專注度反饋給老師,幫助老師及時感知學生上課情況,提升整體教學效果。
場景智能,爲業務賦能帶來了更多可能性。音視頻終端套件,不止是單純的開發工具,更是行業的創新型端口,以最輕量的方式,賦予場景全新的數智化能力。
“行業數字化”高歌猛進的背後,是對行業場景的深刻理解。
回顧音視頻技術發展歷程,音視頻在互娛行業中發展壯大,場景相對簡單且成熟,對音視頻能力的要求也相對通用。
當音視頻向更多傳統行業滲透時,由於傳統行業由一個個不同場景構成,各場景特點不同且具備明顯的行業屬性,因此,
面向不同行業、不同場景、不同特點,來建設一體化的音視頻能力,才能更好滿足行業數字化需求。
目前,阿里雲視頻雲已針對不同行業場景,推出MediaBox多場景AUI Kits方案和多SDK,包括
直播場景的娛樂直播、電商直播、企業直播,
互動場景的遠程監考、互動課堂,
通信場景的語聊房、KTV以及
點播場景的短視頻、長視頻等。
➤ 在教育行業,爲遠程教學場景而生的互動課堂AUI Kit方案,支持學生專注度智能實時檢測,1萬+學生實時白板互動,50+實時連麥,10萬+學生實時觀看,滿足大班課、公開課等場景需求。
➤ 在零售行業,各大零售商都在嘗試建立私域流量池,或自建APP進行直播帶貨。電商直播AUI Kit方案,提供豐富的互動直播功能,支撐多家企業從0到1快速構建直播電商業務。
➤ 在汽車行業,新車發佈場景廣受關注,企業直播AUI Kit方案,助力企業快速搭建直播間功能,打造面向全球車友的重磅新車發佈會直播,並保障數十萬併發下的優質播放體驗。
➤ 在數字閱讀行業,除傳統文字閱讀之外,把文字劇本轉爲短劇播放成爲新風尚,短視頻AUI Kit,基於點播場景的能力訴求,設計與實現了一站式短視頻製作播放解決方案。
➤ 在沉浸式場景,VR全景播放SDK,採用FOV的方式傳輸音視頻數據,可以在提升流暢度的同時,降低帶寬成本,同時結合空間音頻,實現極致的沉浸式音視頻體驗。
可以看到,MediaBox的超能量正在向衆多場景釋放,而更多行業、場景正需要這樣的音視頻數字化加速“利器”,以打開新的機遇和空間。
阿里雲視頻雲遠程智能監考方案,可作爲“音視頻數字化”在教育行業有效探索中的一個縮影。
隨着“藝考熱”的持續升溫,組織大規模線下考試不僅需要投入大量人力物力,還需要考生承擔長距離線下赴考的時間、經濟成本,而很多藝考生往往需要短期奔赴多個學校,這更加劇了負擔。但“線下”對於“藝考”這一特殊類型,是慣例的必要。
MediaBox的場景方案,讓所有的藝考生都不必應對這樣的苦楚。
阿里雲視頻雲通過
遠程監考AUI Kit方案,聯合生態夥伴搭建遠程監考平臺,成功支撐中國美院今年的本科“雲上藝考”,強穩定保障海內外4萬+考生順利完成線上藝考。
以低代碼方式快速集成,遠程監考AUI Kit方案提供監考端和考生端的開源組件、架構設計指南,大大降低接入門檻。在端側覆蓋上,覆蓋iOS/Andriod、網頁、釘釘應用和微信小程序多端,保障遠程監考場景下的
“高易用”。
基於全球3200+節點的底層網絡,以及強大的媒體處理能力,遠程監考平臺可承載10萬+考生同時在線,實現監考端視頻延時1.5秒內、1對1通話延時400ms內,全方位滿足高可靠、高併發、低延時、高清晰度的
“極致好用”。
同時,在這樣的雲考試場景中,也蘊育出新的
“場景智能”,阿里雲視頻雲就此開發推出
智能防作弊SDK。
相比傳統防作弊,是在雲端分析視頻截圖,分析量大,耗時久,成本高。而智能防作弊SDK,
是在端側實時檢測,包括人體行爲檢測、電子產品檢測、衣服檢測、環境檢測等,快速上報,速度更快,成本更低,目前已覆蓋Android/iOS/Web等多端設備。
藝術類考試與其他線上機考不同,要求將主機位畫面囊括整塊畫板以及考生側臉,但機位不同產生的算法調優會更爲複雜。而智能防作弊SDK以原子化接入的方式,提供多種端側實時檢測能力,並可根據不同考試場景需要,動態開啓、靈活選用,
定製化滿足線上考試的諸多場景類型。
正是源於對行業音視頻場景的深度理解,才能革新解決行業痛點和打開場景新空間。
MediaBox走向更廣的行業場景、探入更深的場景能力,未來離不開與行業
生態夥伴的共同創造。此次LiveVideoStackCon,阿里雲視頻雲也將發佈新的生態合作計劃,期待與更多生態夥伴攜手,打開行業音視頻數字化的萬象世界。
作爲加速“利器”,
MediaBox如何實現行業音視頻數字化的新升級?
7月28日下午
LiveVideoStackCon2023上海站
阿里雲視頻雲專場
阿里雲智能資深技術專家帶來演講
《MediaBox:行業音視頻數字化再加速》
釋放音視頻場景的“數字生產力”!
本文分享自微信公衆號 - LiveVideoStack(livevideostack)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。