揭祕 LLMs 時代向量數據庫的 3 大實用場景


過去一年,ChatGPT 和其他大語言模型(LLMs)的爆火也帶動了向量數據庫的發展。


許多用戶在搭建檢索增強生成(RAG)系統過程中選擇了使用向量數據庫 Zilliz Cloud ,但 Zilliz Cloud 的功能不止於此,它在搜索和檢索系統中的應用也十分廣泛。這也反映出了 Zilliz Cloud 產品的設計初衷——幫助計算機真正理解人類數據,包括文本、圖像、銀行交易用戶行爲等。


近期,Zilliz Cloud 發佈了新版本,並上線了Range Search、多租戶和 RBAC 等新特性。同時,Zilliz Cloud 搜索和索引性能也提升了 10 倍,獲得了許多用戶的積極反饋。本文將通過 3 個真實的用戶案例,展示 Zilliz Cloud 的新特性是如何爲其賦能的。


01.

智能問答機器人


對於智能問答機器人而言,一個重要組成部分就是記憶——特指傳入 LLM 中的上下文文本片段。通過記憶,問答機器人就可以獲取歷史信息。但是 LLM 的上下文窗口有着嚴格限制:


1)長度限制

2)上下文長將明顯降低文本生成速度

3)大多數長上下文 LLM 只傾向於“記住”上下文窗口開始和結束的信息


向量數據庫能夠很好地解決上述問題。以客服機器人爲例,機器人會收到許多不同的信息,包含原始知識庫、用戶的所有提示、用戶上傳的圖像、音頻片段、回覆內容等,這些都存儲在 Zilliz Cloud 中以便進行快速檢索。每當用戶輸入消息時,都會優先檢索來自知識庫和之前對話的所有相關內容。這樣一來,系統的讀寫負載會加重,每秒需要存儲大量消息數據。此外,提供給客服機器人的的數據本質上是多模態的,因此,僅有文本搜索是遠遠不夠的。


Zilliz Cloud 的分佈式數據庫架構能夠很好地解決上述問題:增加查詢節點數量以提高讀取吞吐量,增加數據節點數量以提高寫入吞吐量。此外,新發布的 Cardinal 搜索引擎中進行了多方面的性能優化,包含 Zilliz 自研的向量索引、機器代碼級別的計算優化,以及優化緩存感知算法等。


總而言之,在問答機器人的用例中,用 Zilliz Cloud 後可以實現與其他向量數據庫相同的搜索和索引吞吐量,但價格卻不到其他解決方案的三分之一。因此,在考慮成本但同時保障性能的用例中,Zilliz Cloud 絕對是一個不錯的選擇。


02.

商品推薦


推薦系統(https://zilliz.com.cn/use-cases/recommender-system)會根據消費者之前的觀看或瀏覽歷史推送各種內容,例如產品、新聞、用戶內容等,向量數據庫非常適合用來搭建這類應用。開發者可以將內容轉化爲向量並將數據存儲在 Zilliz Cloud,隨後通過調用collection.search便可輕鬆進行向量相似性搜索獲取相關內容,完成推薦。

搜索速度和相關性是所有 B2C 產品的基石。在電商領域,產品推薦結果對整體用戶體驗尤爲關鍵,很大程度上可以決定收益。Zilliz 在實際應用中發現,有用戶的訴求就是通過藉助 AI 的力量提升產品推薦系統性能。這些用戶和用例對延時和吞吐量有着極高要求——向量數據庫需要在 10 毫秒內完成查詢。此外,推薦系統還需對搜索結果進行過濾(例如,根據服裝的特定尺寸或特定鞋碼篩選搜索結果)。從本質上來說,商品數據是複雜的多模態數據,包含了產品名稱、產品描述、產品圖片等數據


Cardinal 能夠滿足用戶對性能的要求,再配合動態 Schema 功能和支持 JSON 的特性加持,Zilliz Cloud 便成爲此類用戶的不二之選。有了 Zilliz Cloud,用戶便能夠根據每個產品類別的特定特徵,定製自己的數據模型,從而確保有效存儲和查詢每個商品向量數據多樣且複雜的元數據。


03.

AI 製藥


製藥過程其複雜困難,不同的藥物分子大小不同,有些藥物可能具有幾十個原子的“小分子”,有些則是具有數萬個原子的大型生物製劑。機器學習可以根據藥物功效(如治療特定疾病或緩解特定症狀)將每個分子轉化爲向量。


在此用例中,Zilliz Cloud 的 Rang Search 功能就能發揮關鍵作用。研究人員可以將需要治療的疾病或症狀轉化爲向量,並在 Zilliz Cloud 中搜索相關藥物。相比基礎的 top-k 搜索,Rang Search 能夠在一定距離內找到與目標相似的所有向量(分子),提供所有在此範圍內的相關搜索結果,而不僅僅是固定數量的結果。此功能不僅對 AI 製藥至關重要,也適用於欺詐保護、網絡安全等領域。例如,在銀行系統中,我們可以將交易轉化爲向量並通過範圍搜索與新交易進行比較,以識別類似的歷史活動,有助於進行異常檢測。


本文中我們通過 3 個業界典型用例介紹了 Zilliz Cloud 的部分新特性,歡迎大家上手嘗試 (https://cloud.zilliz.com.cn/signup) !


本文作者

Frank Liu

Zilliz 運營總監(US)、機器學習架構師    


推薦閱讀



本文分享自微信公衆號 - ZILLIZ(Zilliztech)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章