讓客戶實現 AI 算力“自由”,博雲與趨動科技完成算力調度容器化驗證

背景

近年來,國家對算力的重視程度不斷提升。在算力基礎設施方面,先後發佈《全國數據中心應用發展指引》、《關於加快構建全國一體化大數據中心協同創新體系的指導意見》等;在算力服務方面,發佈了《推動企業上雲實施指南》、《雲計算髮展三年行動計劃》等。

雖然國家對算力的不斷重視使得算力發展進入快車道,但是在社會應用層面依然各式各樣的問題亟待技術界、產業界一一解決。例如,在支持 AI 技術的應用方面,GPU 是其中一個關鍵要素。GPU 擅長更高效地處理大量並行的數據和任務,經常與 CPU 搭配使用,以發揮各自的長處。

然而近些年,全球衆多企業用戶卻陷入了買不到或買不起的“芯片危機“,以及算力需求不斷增長的矛盾之中。因此,企業在面對業務對算力不斷高速增長的需求和有限的資源之間的矛盾時,如何高效地發揮 IT 設施的算力能力、如何高效地調度算力資源提高使用效率成爲了 CIO 必須解決的問題。


得益於近些年同樣發展得如火如荼的雲原生技術,尤其是作爲雲原生技術底座的容器雲技術的高速發展和產業化落地,業界發現,將 GPU 等算力資源容器化、資源池化,可以使算力的管理能力拓展到整個數據中心。這個解決方案將 AI 應用和 GPU 服務器硬件解耦,實現虛擬 GPU 資源的動態伸縮和靈活調度,給對 AI、大數據、高性能等計算服務有顯著需求的企業解了燃眉之急。

博雲作爲國內容器雲市場佔有率排名前五的唯一創業型廠商,在容器雲領域擁有多年的深耕和積累。博雲容器雲產品在 AI 應用支撐、高性能計算方面也做了專門佈局。

例如,在爲國內某高精尖領域頂級研究機構建設的容器雲平臺中,其 AI 應用支撐模塊僅僅在上線初期就實現了資源利用率提升 30%以上,作業調度能力提升 60 倍的效能提升,隨着建設的不斷深入,效能還在不斷提升。

近日,博雲聯合在 AI 算力資源池化領域的領先者趨動科技,共同驗證了趨動科技優秀的 AI 算力資源池解決方案“OrionX AI 算力資源池化軟件”與博雲的容器雲平臺“BeyondContainer”的兼容性、可靠性、穩定性及運行性能。

 

  • 資源按需分配功能:驗證 OrionX 可根據用戶實際應用需求按百分比分配 AI 加速卡算力,按 MB 爲單位分配 AI 加速卡顯存。

  • 資源遠程調用功能:驗證 OrionX client 容器可在沒有配置 AI 加速卡的服務器上運行,並通過 OrionX 使用遠端服務器上的 AI 加速卡資源。

  • 多用戶 AI 加速卡資源切分功能:驗證多個 OrionX client 容器可對同一 AI 加速卡服務器上的 AI 加速卡資源進行切分,同時進行訓練或推理任務。

  • 資源聚合功能:驗證 OrionX 在用戶進行單機多卡模型訓練時,可將本地和遠端的 AI 加速卡資源進行自動匯聚以滿足訓練任務對 AI 加速卡資源的需求。

  • 資源動態分配功能:驗證 OrionX 支持資源共享功能,當啓動 OrionX Client Runtime 對應的 Pod 時,OrionX Controller 不會馬上將申請的 OrionX vGPU 資源分配給該 Pod,在 Pod 運行期間,只有 AI 應用在調用 的時候,該部分 資源纔會被該 Pod 佔用,AI 任務結束停止時,資源即被釋放。

雙方通過對組件兼容、測試模型和數據集、單機單卡、資源切分、資源聚合、資源排隊、資源超分、遠程調用、資源動態、算力控制等十個功能測試,驗證了 OrionX 在博雲容器雲平臺上的運行情況。測試結果表明雙方產品完全兼容,各項功能運行正常,性能表現優異,通過 OrionX 按需調用、遠程調用、資源聚合等能力的賦能,博雲容器雲平臺擁有了對 AI 算力資源進行細粒度管理和監控的能力,可在大數據、雲計算、人工智能等應用場景中爲客戶提供可靠、穩定、高效運行的 AI 算力。

 “數字化、網絡化、智能化“已成爲 AI 行業應用的基本特徵,並在一步步促進行業應用向多樣化與多元化方向發展。在智能化時代,“強大的算力”將成爲驅動技術創新與行業高質量發展的重要引擎。

 雲原生是解決國家經濟建設、社會發展、科技創新、國家安全重大挑戰性問題的重要手段,以降低企業投入成本,提高計算資源使用效率爲目標的高性能雲計算,將成爲數字變革的賦能底座,滿足千行百業數字化轉型對算力的差異化、定製化需求。

 博雲與趨動科技在基於容器實現 GPU 資源池化管理方面的結合,將爲企業級客戶的數字業務發展提供強大的助力!


博雲公司介紹

江蘇博雲科技股份有限公司(博雲)是國內雲原生領域的創新領導者,國家高新技術企業,江蘇省專精特新小巨人企業。自 2012 年成立以來,專注爲客戶提供自主可控的國產軟件基礎設施產品和技術服務,幫助客戶構建面向雲原生應用的新型 IT 基礎架構,快速實現 IT 架構革新,以應對新一代信息技術下實現數字化轉型的迫切需求。

博雲旗下擁有容器雲產品族、DevOps 開發運維一體化平臺和雲管理平臺三大核心產品線。在雲原生領域,博雲容器雲產品族提供以應用爲中心,以容器云爲底座,面向多種應用類型的雲原生操作系統,助力企業提升應用交付效率,增強應用穩定性,實現簡化管理,降本增效。博雲 DevOps 平臺爲客戶提供企業級“全科技業務域管理”的整體規劃、產品交付與解決方案實施。在多雲管理領域,博雲一體化雲管理平臺提供“雲納管+雲服務+雲運營+雲運維”四位一體的中立雲管理服務,實現對多雲環境的一體化管理、統一雲服務提供和精細化運營,幫助企業高效管理和使用雲資源。

博雲容器雲平臺被 Gartner 評爲中國 CaaS 領域代表廠商,市場佔有率位列全國前五(IDC 容器軟件市場報告);博云云管理平臺被 Forrester 列入中國混合雲管理軟件市場領導者象限。博雲 DevOps 平臺首批獲得中國信通院應用開發域的最高級別的先進級認證。博雲產品推出以來,廣泛成熟應用於金融、製造、能源、政務、電信、醫療等不同領域,支撐了 400+ 家大型企業客戶的生產系統穩定高效運行,爲客戶的數字化轉型保駕護航。

 

趨動科技公司介紹

北京趨動科技有限公司於 2019 年成立於北京中關村高新技術園區,擁有專業的研發、運營和服務團隊,被評爲 WISE2020「新基建創業榜」最具成長性創業公司 TOP20、「REAL 100 創新家」、「2021 創業邦 100 未來獨角獸」等。趨動科技專注於爲企業用戶構建數據中心級 AI 算力資源池和 AI 開發平臺,趨動科技的 OrionX 獵戶座 AI 算力資源池化軟件能夠幫助用戶提高資源利用率和降低 TCO,提高算法工程師的工作效率。趨動科技的雙子座 GEMINI AI 訓練平臺,爲客戶提供強大的 AI 算力管理服務以及高效的算法開發和訓練支持,能夠化繁爲簡,幫助企業建好 AI 平臺、管好 GPU、用好 AI 服務。

憑藉標準化、可複製的產品架構,趨動科技得到了包括互聯網、金融、電信運營商、科研機構和高校等大量行業頭部客戶的認可。資本市場對於趨動科技的發展充滿信心——趨動科技成立兩年多已經完成近億美元的融資,頂級的投資機構持續支持趨動科技的發展,包括國開裝備基金、沙特阿美旗下多元化風投基金 Prosperity7 Ventures、元禾重元、招銀國際、順爲、高瓴、嘉御、戈壁、訊飛和湧鏵在內的國內外頂級 VC 正在見證趨動科技銳意進取的腳步。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章