信息爆炸時代,我們每時每刻都在生產語音、圖像、視頻等非結構化數據向量數據。如何高效分析這些海量的數據?神經網絡的出現使得非結構化數據得以被編碼爲向量,而 Milvus 數據庫正是一款基礎的數據服務軟件,能幫助你完成向量數據的存儲、搜索、分析。
如何快速上手 Milvus 向量數據庫?
有小夥伴抱怨,SDK 執行命令也太長了吧,根本記不住啊……
能不能提供一鍵式的命令行直接操作數據庫?
Milvus 向量數據庫專屬命令行工具 — Milvus_cli 來了!
Milvus_cli 是一款便捷的數據庫客戶端,支持數據庫連接、數據導入和導出、向量間距離計算。可以使用交互式命令行提示符通過終端執行命令。Milvus_cli 支持如下特性:
-
Win,Mac,Linux 全平臺適用
-
Pip 在線安裝/離線pip安裝包
-
綠色可執行文件,即開即用
-
Python SDK 功能全覆蓋
-
內置幫助文檔,隨查隨用
-
支持自動補全,提升效率
Milvus_cli 全平臺可用,不依賴外部包,哪怕是在離線環境下,拷進 U 盤插上就能用。接下來,讓我們上手試試看吧!
安裝方法
你可以使用 Python 包管理在線安裝,注意 Python 版本要在 3.8 以上。在線安裝只需要一條命令即可:
pip install milvus-cli
是不是很簡單?
考慮到 Milvus 數據庫本身可能部署在離線環境,你可以直接從 release 頁面直接下載 tar.gz 包離線安裝。
milvus_cli 現有安裝包,地址:https://github.com/zilliztech/milvus_cli/releases
下載好安裝包後,在命令行敲:
pip install milvus_cli-<version>.tar.gz
安裝完畢後,直接敲 milvus_cli
進入即可。
如果你是蘋果 M1 芯片的用戶,或者你沒有 Python 環境,你可以下載綠色文件安裝。在 release 頁面直接下載對應操作系統的可執行文件即可,記得在使用之前 chmod +x
修改可執行權限,然後 ./
執行就可以啦。
以 v0.1.8-fix2-macOS
版本爲例:
sudo chmod +x milvus_cli-v0.1.8-fix2-macOS
./milvus_cli-v0.1.8-fix2-macOS
看到 milvus_cli > 提示符就代表已經進入 Milvus_cli,可以開始使用了!
使用方法
- 如何連接到 Milvus 數據庫?
首先,確保你安裝了 Milvus 數據庫,安裝方法可參考文檔:https://milvus.io/cn/docs/v2.0.0/prerequisite-docker.md
如果你已連接本機並且不需要修改默認端口,直接敲 connect
:
如果你需要需要自定義 ip / 端口,可以參考以下示例:
connect -h 172.16.20.67 -p 19530
- 如何創建 collection?
💡 Collection 包含一組 entity,可以等價於關係型數據庫系統(RDBMS)中的表。如果你想了解更多關於 Milvus 數據庫的術語,請參考:https://milvus.io/cn/docs/v2.0.0/glossary.md
接下來,我們嘗試創建 collection:
開發小哥哥還貼心地提供了一個 example🤩,我們直接試一下這個測試 collection:
create collection -c car -f id:INT64:primary_field -f vector:FLOAT_VECTOR:128 -f color:INT64:color -f brand:INT64:brand -p id -a -d 'car_collection'
- 查看創建的 collection
採用列表的方式查看:
list collections
你可以使用 describe
命令查看更多的細節:
describe collection -c car
- 如何進行向量計算?
接下來,讓我們來做個簡單的向量間距離計算。先導入在線測試數據:
import -c car 'https://raw.githubusercontent.com/zilliztech/milvus_cli/main/examples/import_csv/vectors.csv'
使用 query
命令查詢 colletion 中記錄的 id:
然後按照步驟一步步輸入計算距離所需要的參數:
- 如何刪除數據?
如果你想要刪除剛纔創建的 collection:delete collection -c car
以上就是一個完整的創建 collection 並進行向量計算的過程。
更多幫助
Milvus_cli 的功能不僅限於這些。你可以隨時敲 help
查看幫助,瞭解更多命令用法。對於某條具體命令,可以在具體命令後敲 --help
查詢。
或者參考文檔:
https://github.com/zilliztech/milvus_cli/tree/main/doc
https://milvus.io/docs/v2.0.0/cli_overview.md
希望 Milvus_cli 可以幫助你更輕鬆地使用 Milvus 向量數據庫!
Milvus_cli 正在持續優化中,我們歡迎你加入 Milvus_cli 的建設爲我們貢獻代碼,如果你有任何問題,歡迎提交 GitHub Issue!
Zilliz 以重新定義數據科學爲願景,致力於打造一家全球領先的開源技術創新公司,並通過開源和雲原生解決方案爲企業解鎖非結構化數據的隱藏價值。
Zilliz 構建了 Milvus 向量數據庫,以加快下一代數據平臺的發展。Milvus 數據庫是 LF AI & Data 基金會的畢業項目,能夠管理大量非結構化數據集,在新藥發現、推薦系統、聊天機器人等方面具有廣泛的應 用。
解鎖更多應用場景
本文分享自微信公衆號 - ZILLIZ(Zilliztech)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。