函數計算助力領健信息爲“看牙”注入 AI 活力

作者:姜偉、龔楊、周韜、王彬

發展背景

領健成立於 2015 年,總部位於上海,並在全國設立了 20 餘家分支機構,擁有 100 項軟件著作權、91 項註冊商標、35 項發明專利,致力爲口腔診所、醫美機構等消費醫療企業提供經營管理一體化解決方案。

領健擁有 ISO/IEC27001 國內國際雙認證、公安部等保三級認證及工信部通保三級認證,全面賦能消費醫療機構的數字化經營,助力機構完成開源、避險、節流、增效的健康經營閉環。

領健創新 SaaS + X 模式,旗下擁有 e 看牙軟件、e 看牙商城、領健悅見等品牌。e 看牙軟件爲口腔機構提供單店/連鎖管理、電子病歷、客戶關係管理、進銷存管理、智能營銷、BI 商業智能分析、影像集成等覆蓋口腔機構業務全流程的 SaaS 軟件服務;e 看牙商城鏈接產業鏈上游 1000+ 國內外知名耗材品牌,嚴選近 2 萬+耗材商品,爲口腔機構提供一站式耗材採購服務;領健悅見以“精確診斷·精準正畸·精準監控”爲理念,是新一代隱形正畸解決方案服務商,現已推出悅見成人矯治、悅芽兒童早期矯治等多個產品系列。

領健作爲業界領先的口腔機構,在技術和服務上始終追求卓越。領健面向口腔診所,提供了正畸算法,口腔醫生在日常接診過程中,對消費者的口腔牙齒狀態進行拍照,通過算法能夠給出相應的診斷和治療建議,提升口腔醫生的效率。

平臺特點及業務痛點

口腔診所的上班時間比較固定,一般都在 08:30~18:00,節假日會更加繁忙一點,時間拉長到一個月,可以看到明顯的波峯波谷。

領健信息早期在雲上購買了一波 GPU 機器用於算法的部署,提供對外服務,但在使用過程中遇到了不少問題,主要有以下幾個:

  • 資源利用率低,成本浪費: 採用按月持有機器,在下班時間沒有業務流量,由於考慮到可能的業務高峯,持有多臺 GPU 機器,平峯期利用率不高。總體資源利用率維持在 5% 左右。
  • 高峯期業務響應慢: 應對突發流量能力不足,超出預期的流量會導致服務負載加大,請求響應時間變長,直接影響終端客戶的使用體驗,在業務最高峯,曾經出現單個請求排隊 10 分鐘的情況。
  • 監控和排查能力不足: 正畸算法在持續的迭代,在迭代部署的過程中,會出現請求偶發卡頓和程序報錯的情況,但由於本身監控和告警能力不足,沒法第一時間主動感知,常常需要終端使用門店反饋情況,降低了主動優化算法的效率。

除此之外,頻繁的運維動作和持續的的平臺建設,也給運維同學帶來很多的日常工作,同時也加大了系統的不穩定因素,加上 GPU 技術在近年發展迅猛,領健技術同學也需要在這個領域持續投入不少精力,對於以上這些問題,領健技術同學開始在雲上尋求更好,更高效的解決方案。

解決方案

領健技術團隊一直在尋求更好的解決方案,期望在成本,服務體驗,運維效率上都能得到改善,在對比了阿里雲的多個雲產品之後,最終將重點放在了函數計算上。

阿里雲函數計算是事件驅動的全託管計算服務。通過函數計算,客戶無需管理服務器等基礎設施,只需編寫代碼並上傳。函數計算會準備好計算資源,以彈性、可靠的方式運行代碼,並提供日誌查詢、性能監控、報警等功能。

函數計算除支持傳統的 CPU 算力,也支持 GPU 的算力,採用服務器無感知計算的理念,通過提供一種按需分配的 GPU 計算資源,有效地解決原有 GPU 長駐使用方式導致的低資源利用率、高使用成本和低彈性能力等痛點問題。爲客戶提供更加便捷、高效的 GPU 計算服務,有效承載 AI 模型推理、AI 模型訓練、音視頻加速生產、圖形圖像加速等加速工作負載。

函數計算 GPU 資源架構圖如下:

函數計算 GPU 採用虛擬化技術,做到算力,顯存,故障的強隔離,100% 兼容原生應用。函數計算通過兩級的資源池,保證算力的快速供給,函數計算 GPU 資源池平臺持有,客戶只需要按量使用,無需爲閒置資源買單。

函數計算 GPU 資源請求模型如下:

當 GPU 函數部署完成後,客戶可以通過配置預留 GPU 實例的彈性伸縮策略開啓預留 GPU 實例,以提供實時推理應用場景所需的基礎設施能力。函數計算平臺將根據客戶配置的伸縮指標進行預留 GPU 實例的 HPA ,客戶請求將優先分配至預留 GPU 實例進行推理服務,平臺完全遮蔽冷啓動,業務保持低延遲響應。除此之外,平臺集成了可觀測,日誌,監控,告警等系統,以簡化問題的排查效率和日常的運維工作。

最終,領健技術團隊經過一系列驗證之後,在函數計算的最終架構圖如下:

架構圖非常簡單,業務流程如下:

  1. 客戶將正畸算法做成標準鏡像放入阿里雲鏡像倉庫 ACR;

  2. 當前端有正畸的調用請求時,需要初始化實例時,FC 通過拉取 ACR 中鏡像以及底層 GPU 資源完成實例的初始化工作,完成算法應用的部署;

  3. 正畸計算請求發送至新創建的 GPU 應用上進行計算,並返回結果。

成果和優勢

通過將 GPU 計算負載放到函數計算,領健技術團隊很好地解決了先前遇到的使用問題:

  • 成本優化: 函數計算按量付費的計費方式,真正做到了按照實際請求處理時間收費,最大限度的降低了資源持有的成本,相比早前的按月持有 GPU 資源,函數計算的費用降低了 90% 左右,達到了很好的降本效果。
  • 高峯期業務體驗: 通過業務高峯期的提前資源拉起和突發資源的按量彈性,做到了後端資源及時的供給,採用函數計算部署後,門店再也沒有出現長時間排隊的情況,大大提升了使用體驗。
  • 高效運維: 通過函數計算內置的監控,日誌和告警系統,可以實時關注業務的大盤運行情況,通過配置監控告警,在異常時,可以第一時間收到異常推送,並藉助完善的日誌系統和函數計算專業的技術團隊,及時定位並解決程序問題。

除此之外,採用函數計算部署,給了整個系統很好的伸縮性,對於將來業務的增長,也不必擔心核心的 GPU 資源規劃問題,這一點也爲業務的持續發展打下了堅實的基礎。

總結&展望

通過將核心應用遷移到函數計算平臺,領健技術團隊不僅成功應對了業務增長帶來的挑戰,還顯著優化了成本結構,同時加速了開發和運維流程,實現了前所未有的敏捷性和效率。

展望未來,領健技術團隊將繼續深化與函數計算的合作。隨着公司業務版圖的不斷擴展,預見更多的應用場景將得益於函數計算的彈性伸縮、低成本及高效率的優勢。領健技術團隊計劃在新業務部署時,優先考慮採用函數計算架構,以期進一步縮短產品上市時間,提升用戶體驗,並持續降低運營成本。

阿里雲函數計算也期待與領健共同探索更高效、更智能的醫療服務解決方案,助力醫療健康產業的數字化轉型。相信在雙方的緊密合作下,領健能夠更好地服務於患者與醫療從業者,推動行業向更加智能化、高效化的方向邁進。

點擊此處,體驗函數計算。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章