我們爲什麼構建自己的serverless計算平臺，而非使用AWS Lambda？

原創

2021-01-27 14:38

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"本文最初發表於"},{"type":"link","attrs":{"href":"https:\/\/www.cortex.dev\/post\/serverless-machine-learning-aws-lambda","title":"","type":null},"content":[{"type":"text","text":"Cortex網站"}]},{"type":"text","text":"，經原作者Caleb Kaiser許可由InfoQ中文站翻譯分享。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"對於模型部署來講，AWS Lambda是一個很有吸引力的方案。從表面上來看，其收益是很明顯的。Lambda可以："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"bulletedlist","content":[{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"讓數據科學家和機器學習工程師在部署時無需管理基礎設施"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在最大化可用性的同時，能將成本降到最低"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"爲定義預測API提供了一個簡單的接口"}]}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"但是，問題在於，儘管這都是serverless架構的收益，但是像Lambda這樣的通用serverless平臺通常會有一些限制，這些限制使得它並非機器學習的最理想方案。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我們親身體會到這一點。在着手實現Cortex之前，我們曾經嘗試通過Lambda運行部署。事實上，正是由於Lambda的不足，在一定程度上促使我們建立一個專門用於機器學習的serverless計算平臺。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"Lambda不能部署大型的模型（比如Transformer模型）"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"現在，你可能已經讀過很多關於機器學習模型增長的文章了。可以說，在很多適用於機器學習的領域，尤其是自然語言處理方面，模型正在迅速地變得越來越大。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"例如，在過去幾年中，Hugging Face的Transformers庫成爲了最受歡迎的NLP庫。從傳聞中看到，用戶經常在生產API中使用它。這個庫爲如下的模型提供了便利的接口："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"bulletedlist","content":[{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"GPT-2：完全訓練後大約是6GB"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"BlenderBot：完全訓練後大約是5GB"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"RoBERTa：完全訓練後大於1GB"}]}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"而這僅僅是看上去比較合理的模型。有些模型，比如T5，可能會超過40GB，不過我承認，自己沒有遇到過太多團隊大規模地部署這種規模的模型。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"適用於現代機器學習需求的serverless平臺需要能部署大型的模型，但是Lambda做不到這一點。Lambda限制部署包的大小爲未壓縮的250MB，並將函數限制到了30008 MB的內存。如果你想運行任何一種最先進的語言模型，Lambda都不是合適的可選方案。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"爲進行模型處理，需要GPU\/ASIC的支持"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"隨着模型變得越來越大，它們的資源需求也會隨之增加。對我們前文所討論的一些大模型來說，使用GPU推理是唯一能以接近實時延遲的速度處理它們的方式。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"類似的，像Inferentia和TPU這樣的ASIC在某些情況下正在改變模型處理的經濟效益，並且隨着它們的不斷成熟，有潛力在更大的範圍實現這一點。即使是相對比較年輕的方案，但是我們已經對某些模型的性能進行了基準測試，使用Inferentia的效率能提高一個數量級。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在過去，GPU\/ASIC推理被認爲是相對小衆的場景，但是它正在越來越多地成爲機器學習工程的標準。令人遺憾的是，Lambda並不支持它。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"對大量的Cortex用戶來說，僅憑這一點就讓Lambda失去了將模型部署到生產環境的機會。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"Lambda處理模型的效率太低"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Lambda實例能夠服務於連續的請求，但不能處理併發的請求。在處理模型的時候，這是一個大問題。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"推理是一項計算成本高昂的任務，通常伴隨大量的延遲（因此經常需要GPU\/ASIC）。爲了防止推理成本的飆升，很重要的一點就是在分配計算資源的時候，要儘可能保持高效，同時不能對延遲產生負面影響。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在Cortex中，我們實現這一點的方式是提供預測前和預測後的鉤子，它們可以異步執行代碼。通常來講，當一些IO請求（比如從數據庫中調用用戶信息、寫入日誌等）與推理函數相連接的時候，就會用到它。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"這些異步鉤子提供的優勢在於，它允許我們在預測生成後立即釋放推理所需的資源，而不必等到響應發送之後。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"然而，在Lambda中，這是不可能實現的。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"因此，如果使用Lambda處理模型的話，很可能會因爲每個實例上閒置的資源浪費而導致過度擴展。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"機器學習需要一個專門的serverless平臺"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Serverless架構天然適合模型部署。但問題在於，我們在適用於MLOps的任何場景中都會遇到的問題是，機器學習的需求非常具體，使得流行的DevOps工具（如Lambda）並不適用。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我們構建Cortex的部分使命就是構建一個平臺，提供我們在Lambda中喜愛的易用性，同時解決ML基礎設施的具體挑戰。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"原文鏈接："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"link","attrs":{"href":"https:\/\/www.cortex.dev\/post\/serverless-machine-learning-aws-lambda","title":null,"type":null},"content":[{"type":"text","text":"https:\/\/www.cortex.dev\/post\/serverless-machine-learning-aws-lambda"}],"marks":[{"type":"underline"}]}]}]}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

京東內部研效架構師訓練營，首次對外公開課，不可錯過的研效之旅！

五月繁花似錦，讓我們帶你走進京東，開啓研效實戰之旅！四大單位聯合發起本次活動由“全國雲計算技術行業產教融合共同體”發起，聯合工業和信息化部電子第五研究所、E³CI軟件研發效能度量工作委員會、京東雲共同主辦，重磅推出“卓越研效架構師”

京東雲開發者

2024-04-19 11:16:30

RocketMQ 事件驅動：雲時代的事件驅動有啥不同？

作者：林清山（隆基）前言：從初代開源消息隊列崛起，到 PC 互聯網、移動互聯網爆發式發展，再到如今 IoT、雲計算、雲原生引領了新的技術趨勢，消息中間件的發展已經走過了 30 多個年頭。目前，消息中間件在國內許多行業的關鍵應用中扮演着

2024-04-15 21:12:21

智能製造與AI大模型

隨着科技的飛速發展，人工智能（AI）已經滲透到我們生活的方方面面，尤其在製造業中，AI大模型的應用正在改變着傳統的生產模式。本文將探討AI大模型在智能製造領域的應用，以及它如何成爲提升生產力的關鍵力量。首先，AI大模型爲智能製造提供了強大

2024-04-10 23:29:40

技術引領，策略升級：騰訊雲與你共探數字金融新篇章

引言 2024 年 3 月 27 日下午，在北京騰訊總部，一場關於大模型與數據要素時代數字金融發展的深入討論火熱進行中。【TVP 走進騰訊：大模型與數據要素時代的數字金融發展論壇】是在騰訊二十年發展歷程和數字化實踐的基礎上，進一步探索

2024-04-03 23:09:31

通義靈碼走進武漢大學：讓 AI 編碼助手激活大學生的創造力

阿里雲面向全國大學生正式啓動雲工開物“高校訓練營“，計劃在 15 座城市、70 所全國高校巡迴開營，幫助學生用雲計算與 AI 工具進行雲上開發及應用創新。首期高校訓練營-通義靈碼專場在武漢大學開營。本次分享，以阿里雲通義靈碼爲核心，聚焦代

2024-04-02 21:12:12

Redis開源協議調整，我們怎麼辦？

本文分享自華爲雲社區《Redis開源協議調整，我們怎麼辦？》，作者：華爲雲PaaS服務小智。 2024年3月20日, Redis官方宣佈，從 Redis 7.4版本開始，Redis將獲得源可用許可證 ( RSALv2 ) 和服務器端公共許可

2024-04-02 10:32:23

阿里雲 ApsaraMQ 率先完成消息隊列全系 Serverless 化，攜手 Confluent 發佈新產品

雲原生時代，消息隊列成爲現代化應用的關鍵組件，也是雲原生架構底層通信的基礎設施。阿里雲消息隊列發展至今已有十多年曆程。 3 月 29 日，在阿里雲最新一期的“飛天發佈時刻”上，阿里云云原生應用平臺負責人丁宇宣佈，雲消息隊列產品升級全新品牌

2024-04-01 21:12:25

AI、腦機接口、大數據，騰訊雲攜手行業領袖共探新一代數字化轉型

引言在數字化轉型的浪潮中，企業正面臨着前所未有的機遇與挑戰。這場轉型，既是技術的革新，也是管理和運營模式的徹底重塑。隨着人工智能、雲計算、大數據等技術的成熟和普及，它們如何實現從理論到實踐的躍遷，如何在企業中發揮最大價值，成爲了業界

2024-03-28 12:05:21

重新審視 CXL 時代下的分佈式內存

消息傳遞與分佈式共享內存隨着摩爾定律增長的逐漸減緩，系統規模的水平擴展已經成爲提升系統性能的關鍵策略。然而，這種擴展依賴於分佈式系統架構的支持，而分佈式編程的固有複雜性給構建高效、可靠及彈性的系統帶來了嚴峻挑戰。因此，簡化分佈式編程依舊

2024-03-22 00:28:31

華爲雲數據庫創新發展論壇，打造行業更優數據庫底座！

本文分享自華爲雲社區《華爲雲數據庫創新發展論壇，打造行業更優數據庫底座！》，作者： GaussDB 數據庫。 3月15日，由華爲雲、華爲終端雲服務聯合主辦的云云協同創新峯會2024在安徽黃山成功舉辦。以“行業更優數據底座，華爲雲數據庫創新發

2024-03-19 11:02:57

大模型技術調研與端應用形態探索

在人工智能領域，大模型（Large Model）技術的崛起標誌着深度學習進入了一個全新的階段。這些模型通常包含數十億甚至千億級別的參數，通過大規模的數據訓練，能夠在語音識別、自然語言處理、圖像識別等多個領域取得令人矚目的成就。那麼，大模型究

2024-03-08 12:36:05

雲消息隊列 Confluent 版正式上線！

作者：阿里雲消息隊列前言在 2023 年杭州雲棲大會上，Confluent 成爲阿里雲技術合作夥伴，在此基礎上，雙方展開了深度合作，並在今天（3月1日）正式上線“雲消息隊列 Confluent 版”。通過將 Confluent 在 A

2024-03-06 21:16:50

臻圖信息：以數字孿生技術服務社會，推動企業高質量發展

隨着“十四五”規劃和2035年遠景目標綱要中提出，要加快數字化發展，建設數字中國。爲建設數字孿生智慧城市提供了國家戰略指引。新興技術是數字孿生髮展的助推劑，臻圖信息通過數字孿生技術及研發的實景三維渲染引擎，搭

2024-02-23 01:22:55

【騰訊技術答人挑戰賽】答題贏iPad、Switch與海量鵝廠公仔~

在當今數字化時代，技術的更新換代速度遠超以往。程序員需不斷主動學習、拓展知識邊界、補齊技能短板以適應變化的市場需求，讓自己在「存量」之餘尋求新的「增量」時，更加遊刃有餘。騰訊雲開發者社區誠邀你參與騰訊技術答人挑戰賽，探索知識邊界，書寫

2024-02-20 11:57:02

3秒開服《幻獸帕魯》！如何抓住遊戲背後的雲計算機遇？

導語 | 2024 年伊始，《幻獸帕魯》的火熱就爲新一年的遊戲市場帶來了極高的熱度，無論是超千萬份的銷量還是關於遊戲“縫合”與“借鑑”的爭議，都使得開年遊戲市場的銷售前景與話題度拉滿。而在遊戲市場之外，雲服務市場尤其是其面向個人或小團

2024-02-18 12:42:36

24小時熱門文章

最新文章

最新評論文章