vivo AI計算平臺在線業務落地實踐

一、背景

vivo人工智能計算平臺小組從2018年底開始建設 AI 計算平臺至今,已經在k8s集羣、以及離線的深度學習模型訓練等方面,積累了衆多寶貴的開發、運維經驗,並逐步打造出穩定的基礎容器平臺 - AI容器平臺(VContainer)。爲了支撐公司AI在線業務的發展,滿足公司對算力資源的高效調度管控需求,需要將在線業務,主要包括C端、推理等業務,由原來的虛擬機或物理機遷移至AI容器平臺。於是小組從2020年初開始,基於在線業務的需求對AI容器平臺進行進一步建設,並將平臺與公司的CMDB、CICD等基礎模塊進行打通,使在線業務能夠順利從虛擬機、物理機遷移至AI 容器平臺。

目前AI容器平臺已遷移了4成左右的AI在線業務,大大小小100+在線應用,流量峯值超過22w qps,數百臺服務器支撐着在線業務容器的運行。

本文是 vivo AI 計算平臺技術演進系列文章之一,着重分享了計算平臺的底座 - AI容器平臺(VContainer)的在線業務容器化落地過程中所遇到的問題及解決的思路,vivo AI  計算平臺相關的技術實踐可參考此前發佈的《vivo AI 計算平臺的K8s填坑指南》。

二、容器化部署的優點

與虛擬機或物理機的部署相比,將業務部署到AI容器平臺有很多優點:

原文鏈接:【https://www.infoq.cn/article/zKhOwJvTSrLlOCEc0c5N】。未經作者許可,禁止轉載。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章