12 月 6 日,備受矚目的
人工智能領域全球頂級學術會議 NeurIPS'21 的向量檢索比賽
結果新鮮出爐,Zilliz 團隊憑藉磁盤存儲優化算法贏得磁盤方案賽道第一名,將十億級別數據集的範圍查詢提升到新高度。
神經網絡的出現,使得語音、圖像、視頻等海量非結構化數據得以被編碼爲向量,而向量檢索是進一步分析這些非結構化數據的關鍵途徑。
作爲
國際首屆向量檢索比賽
,此次比賽由來自微軟研究院、Facebook 人工智能研究所、卡內基梅隆大學、Yandex 等公司的專家學者牽頭組織,雲集了來自清華大學、南京大學、英特爾、英偉達、快手科技等學界與工業界實力選手。此次比賽首次使用了六個十億級別的數據集,Facebook、Microsoft Turing、Microsoft Bing、Yandex 專門爲本次比賽發佈了四個新數據集。
比賽中,Zilliz 自研的
基於磁盤的近似搜索方案 BBAnn 綜合排名賽道第一,在 Facebook 開放的 SimSearchNet++ 數據集上表現尤其突出
。該數據集用於精確檢測圖像的細微變化,使用範圍查詢的方法,找到目標向量周邊一定半徑內的所有向量。由於範圍查詢結果數量不確定性較高,這種查詢對研究人員提出了較高的要求。經測試,Zilliz 的研究成果在 SimSearchNet++ 數據集上得到結果數量佔真實結果數量的 88.573%,遠超 16.274% 的基準線,
彌補了十億級別數據集上範圍查詢的空白
。
在未來,Zilliz 的這項研究成果將助力向量數據庫 Milvus 磁盤方案落地,以滿足不同場景下的用戶需求。Milvus 數據庫是 LF AI & Data 基金會的畢業項目,能夠管理大量非結構化數據集,在新藥發現、推薦系統、聊天機器人等方面具有廣泛的應用。Zilliz 將持續投入,通過開源和雲原生解決方案爲企業解鎖海量非結構化數據的隱藏價值。
Zilliz 以重新定義數據科學爲願景,致力於打造一家全球領先的開源技術創新公司,並通過開源和雲原生解決方案爲企業解鎖非結構化數據的隱藏價值。
Zilliz 構建了 Milvus 向量數據庫,以加快下一代數據平臺的發展。Milvus 數據庫是 LF AI & Data 基金會的畢業項目,能夠管理大量非結構化數據集,在新藥發現、推薦系統、聊天機器人等方面具有廣泛的應
用。
解鎖更多應用場景
本文分享自微信公衆號 - ZILLIZ(Zilliztech)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。