Zilliz @ GOTC:大模型的記憶體——向量數據庫的現在與未來

近日,2023 全球開源技術峯會(Global Open-source Technology Conference,以下簡稱 GOTC 2023 ) 在上海張江科學會堂召開,Zilliz 創始人兼首席執行官星爵、Zilliz 合夥人兼技術總監欒小凡以及 Zilliz 開發者關係及市場運營負責人李晨受邀參會。

GOTC 2023 由上海浦東軟件園、開放原子開源基金會、 Linux 基金會亞太區和開源中國聯合發起,以行業展覽、主題發言、專題論壇、開源市集多種形式呈現, 主題爲 Open source,into the future,在本次主題的框架之下,開源、AIGC、供應鏈安全等話題成爲大會討論的重點。

其中,引人側目的是主論壇關於 AIGC 主題的討論。2023 年,ChatGPT 的發展引發 AI 領域關於 AIGC 技術的討論。在騰訊開源聯盟主席、OpenCloudOS 社區祕書長單致豪的主持下,LF AI & Data 基金會執行董事、PyTorch 基金會執行董事 Ibrahim Haddad,Zilliz 創始人兼首席執行官星爵,NVIDIA 工程和解決方案高級總監賴俊傑,Untiy 中國技術副總裁左瑞文探討了 AIGC 技術如何重塑互聯網領域和全球社會。

星爵表示:“以 ChatGPT 爲代表的大模型仍處於發展過程中,‘知識儲備’十分有限,經常出現‘AI 幻覺’,加上大模型的訓練成本高昂,使得大模型的應用受到諸多限制。向量數據庫作爲大模型的記憶體,不僅能夠爲其提供數據存儲,而且能通過數據檢索的方式讓大模型進行知識增強。在向量數據庫的加持下,大模型將變得博聞強識、成本可控。”

Zilliz 創始人兼首席執行官星爵

在隨後關於開源話題的探討中,星爵感慨頗深:從大教堂模式到集市模式,開源以它那海納百川般的創新精神感染着每一位開發者,也爲開源項目賦予了持久的生命力和力量,Zilliz 的第一個開源項目 Milvus 也不例外。從在 GitHub 上將第一行代碼開源到成長爲全球領先的向量數據庫,從一個開源項目發展成擁有成千家企業級用戶體量的產品,Milvus 受益良多,而這一切都源自開源。

開源的力量自不必說,這股星星之火燒到了大模型時代,星爵認爲,未來一定會出現越來越多的開源模型,尤其是垂直領域的小模型。當下,ChatGPT 的通用大模型是超級計算機,而大家手中常用的工具是 PC 筆記本、手機等,未來可能同時需要十幾個模型配合工作,這時候小模型的優勢就會凸顯出來。再配合垂直領域訓練的加持,小模型在資源配置方面會變得更加高效。因此,開源大模型與開源小模型並存將是常態。

在次日的“數據與數據庫技術”論壇中,欒小凡則帶來了名爲《大模型構建的 AI 原生數據庫 Milvus》的主題演講。

Zilliz 合夥人、技術總監欒小凡

欒小凡提到,當下“AI 幻覺”是大模型的主要痛點之一,由於信息密度不足,大模型經常會生成一些無意義或不可信的內容。在此情況下,有三種方案可以解決這一問題:微調模型、控制 prompt、構建知識庫。

微調模型是大概三五年前比較流行的處理方式,一來需要足夠多的數據對微調進行支撐,二來對算力要求較高,整體較難實現。控制 prompt 是通過 prompt 對內容的選擇和長度加以限制,不過這同時也會限制信息量,最終仍無法得到理想的結果。知識庫是爲大模型灌輸額外的知識,爲其提供更多參考,不過由於知識庫的內容未必都對問題有幫助,需要對它們進行語義搜索或初步篩選,這時候便需要 CVP Stack。

何爲 CVP Stack?C 是 ChatGPT,即利用大語言模型實現以 ChatGPT 爲代表的智能問答;V 是 Vector database,即通過向量數據庫爲 ChatGPT 提供大規模的、可靠的知識庫;P 是 Prompt as code,即使用提示匹配用戶問題與來自知識庫的參考內容。CVP Stack 的應用場景代表爲面向開源用戶和開源社區運維人員的問答機器人 OSSChat(https://osschat.io/)以及 GPT 的緩存層 GPTCache(https://github.com/zilliztech/GPTCache)。

在整個 CVP Stack 中,向量數據庫扮演着重要角色,它是爲 AI 而生的數據庫,Milvus 是這一賽道的奠基者與領先者。Milvus 2.0 是雲原生分佈式的一款向量數據庫,具有百億規模的向量可擴展性,能夠實現存儲計算分離、離在線一體化等。同時,Milvus 2.0 的性能亦值得關注,它的查詢速度高於 ES 10 倍,高於主流競品 2 倍,具備毫秒級延遲響應。此外,可插拔引擎、雲端一體的特點也讓 Milvus 2.0 成爲全球領先的向量數據庫。

而 Milvus 的下一站是全託管 SaaS 服務的 Zilliz Cloud,它具備維護成本低、使用門檻低、豐富的企業級特性、安全放心的特點。目前,Zilliz Cloud 已支持 AWS、GCD,今年 6 月底即將登陸阿里雲,以便能夠更好地爲國內用戶服務。

在“AI is Everywhere”的論壇上,李晨以《向量數據庫,大模型的記憶體》爲主題進行了分享。

Zilliz 開發者關係及市場運營負責人李晨

李晨着重解釋了向量數據庫爲何是大模型的記憶體。他表示,在 CVP Stack 之中,Vector Database 作爲一個大模型的外部存儲,可以爲大模型提供最有效的知識增強方案。再深入點理解,如果把大模型看作人類的大腦,那麼這個大腦除了需要具備強大的計算能力,還需要擁有與之匹配的存儲能力。在傳統的經典計算架構中,馮·諾伊曼架構是計算與存儲分離的形式,這也成爲大模型的趨勢。原因在於,縱觀整個計算機發展歷史,存儲的價格用於低於計算價格一個乃至多個數量級,大模型也不例外,在成本與計算的雙重考量下,如向量數據庫一般的外部存儲的重要性,不言而喻。

在向量數據庫的加持下,大模型將以更低的成本得到更智能的知識增強效果。那麼,得到知識增強後的大模型,下一站在哪裏?答案是智能體( Intelligent agents)。

例如 Auto-GPT,可以理解爲完全自制的 GPT-4,它完全具備思維推導與執行的能力,未來甚至可能產生類似智能體的思考。又如斯坦福和谷歌做的名爲“Generative Agents: Interactive Simulacra of Human Behavior”的研究,他們在一個虛擬環境中模擬了幾個卡通人,每個卡通人都具備自主的判斷能力和意識,可以在虛擬世界中生活、交互、成長。

此外,第一個智能體機器人的虛擬社區 Chirper.ai、AI 分身、小說創作公司開始製作人物的虛擬實體、遊戲公司開始用虛擬分身與玩家交互、聊天……

這其中,除了需要藉助大模型的能力,也要用到向量數據庫的能力。在此情況下,向量數據庫未來將迎來百萬級的市場增長,未來可期。

  • 關於 Zilliz

Zilliz 作爲向量數據庫領域的拓荒者與奠基者,不僅開創了向量數據庫賽道,也提供了世界上最快的向量數據庫產品。隨着近一年來大模型的火爆,Zilliz 也迎來了全世界的關注:早在 3 月份英偉達全球開發者大會上,Milvus 便作爲向量數據庫的代表被黃仁勳提名;緊接着 Zilliz 旗下的 Milvus 和 Zilliz Cloud ,也成爲了 OpenAI 官方首批 plugin 合作的向量數據庫。最近,Zilliz 先後接入和支持了各種熱門的項目,例如 LangChain、 Auto-GPT、BabyAGI 等,成爲全球最炙手可熱的向量數據庫品牌。

Zilliz 產品生態豐富,致力於構建開源+雲的大模型加強方案,其中開源向量數據庫 Milvus 扮演着大模型知識庫的角色;Towhee 可以爲大模型提供編排服務;GPTCache 則爲大模型提供緩存;Zilliz Cloud 可以爲用戶提供開箱即用的全託管向量檢索服務。


  • 如果在使用 Milvus 或 Zilliz 產品有任何問題,可添加小助手微信 “zilliz-tech” 加入交流羣。
  • 歡迎關注微信公衆號“Zilliz”,瞭解最新資訊。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章