用 AI 給向量檢索加 buff,Milvus 亮相數據庫頂會 VLDB


2021,數據庫領域的研究有哪些突破? 

本月舉行的全球數據庫頂會 VLDB 上,Zilliz 與哈佛大學、卡內基梅隆大學、清華大學、微軟等多家高校與企業受邀介紹最新研究進展,分享了將機器學習方法應用到數據庫系統的經驗。Zilliz 高級研究員易小萌介紹了開源向量數據庫 Milvus 的開發背景、設計思路,以及開發過程中遇到的挑戰與技術創新點。



VLDB 與 SIGMOD 和 ICDE 是數據庫領域久負盛名的三大頂會。此前,由 Zilliz 研發團隊貢獻的研究成果  Milvus: A Purpose Built Vector Data Management System 因其底層功能過硬、業務場景完善,而被 SIGMOD 評委會相中,收錄爲今年 21 篇工業界論文 之一。

人們每時每刻都在生產大量的圖像、音頻、視頻數據,其中超過 80%的數據都是處理難度較大的非結構化數據,而傳統的數據庫只能存放有限的、經過提取和加工後的數據。對此,Milvus 團隊的工程師們設想了一種可能:儘管數據具有不同的類型,在語義(Semantics)層面上可以用向量對數據進行統一的表示。 易小萌談到,如果使用 AI 神經網絡模型提取數據類型的語義,將其以向量的形式統一呈現,許多數據的處理邏輯可以直接在向量上執行。

Milvus 專爲分析和檢索海量特徵向量而設計,提供完整的向量數據更新、索引與查詢框架,在滿足動態數據實時搜索的同時,也能滿足實際業務中多樣化的查詢需求。目前,Milvus 已經發布 1.0 單機版與 2.0 分佈式版兩個版本,所有代碼完全 開源 ,已被廣泛應用於人工智能前沿領域,經過了全球 1000 家用戶的實踐驗證,性能大幅超越同類向量檢索系統。

在分享中,易小萌介紹了 Milvus 2.0 雲原生優先、日誌即數據、批流一體的設計理念,在初代的基礎上,Milvus 2.0 爲用戶提供智能、穩定、流暢的查詢體驗。

面對數據庫構建中索引的選擇和數據調優兩大挑戰,易小萌相信 AI 能夠提供可能的解決方案。例如,先在小數據集上進行評估新配置,再將結果轉移到大數據集,讓機器學習已有的數據集,用它來指導新數據集進行配置,從而達到比目前的 BOHB 算法更優的解法。




想知道更多幹貨內 容?戳 OSCHINA 網站上的幹 貨分享版!

https://my.oschina.net/u/4209276/blog/5207483(長按複製鏈接到瀏覽器)



  易小萌   
Zilliz 研究員、研究團隊負責人、華中科技大計算機系統結構博士。
主要工作領域爲向量近似搜索算法和分佈式系統的資源調度,相關研究成果在 IEEE Network Magazine、IEEE/ACM TON、ACM SIGMOD、IEEE ICDCS、ACM TOMPECS 等計算機領域國際頂級會議與期刊上發表。


📖   Milvus docs

Milvus 文檔鏈接奉上:https://milvus.io/cn/docs/home

🚀 Milvus Roadmap  

關於 Milvus 的未來的更多規劃,歡迎大家通過 Roadmap 項目來了解:https://milvus.io/docs/v2.0.0/roadmap.md

🙏 Thank you contributors!

最後感謝 Milvus 社區的 147 位貢獻者 ❤️  有了他們纔有了今日的 Milvus 2.0。也歡迎大家開 issue 吐槽,或是加入社區一起貢獻:https://milvus.io/community



Github @Milvus-io|CSDN @Zilliz Planet|Bilibili @Zilliz-Planet

Zilliz 以重新定義數據科學爲願景,致力於打造一家全球領先的開源技術創新公司,並通過開源和雲原生解決方案爲企業解鎖非結構化數據的隱藏價值。  

Zilliz 構建了 Milvus 向量數據庫,以加快下一代數據平臺的發展。Milvus 目前是 LF AI & Data 基金會的畢業項目,能夠管理大量非結構化數據集。我們的技術在新藥發現、計算機視覺、推薦引擎、聊天機器人等方面具有廣泛的應用。

本文分享自微信公衆號 - ZILLIZ(Zilliztech)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章