用 Git 操作的數據庫?這個項目火了!

Git 是一個開源的分佈式版本控制系統,可以敏捷高效地管理代碼,讓項目代碼支持同時存在多個不同的版本和分支,是程序員在項目開發中的必備工具。

版本控制

除了代碼文件可以進行版本控制之外,數據其實也可以版本控制

今天,Dolt 項目榮登 GitHub 趨勢榜榜首,該倉庫的介紹是 “Git for Data”,一個面向數據的 Git,目前已收穫了幾千個 star。

GitHub 趨勢

下面我們來簡單瞭解下 Dolt 項目。

什麼是 Dolt?

根據官方介紹,Dolt 是一個基於 Git 協議的開源 SQL 數據庫,使用 Golang 語言編寫。

首先它和 MySQL 關係型數據庫一樣,用於存儲和管理數據,具有表、視圖等概念,支持數據的增刪改查等操作。

對 Dolt 執行數據庫操作

然而更棒的是,它提供了一個命令行工具,完美支持所有的 Git 命令,並且語法完全相同!允許用戶像使用一個 git 倉庫一樣對數據進行 fork、clone、branch、merge、push 和 pull 等操作。

Dolt 命令行

當你提交數據到存儲庫時,Dolt 會自動存儲提交日誌,比如本次修改的內容、作者、提交時間等,從而實現了對數據單元的版本控制,便於多人對數據進行協作和優化。

Dolt 日誌

比如一個班的同學在使用公共數據做實驗時,可能需要針對實驗提供不同的數據,這個時候就可以用 Dolt 來進行數據的版本控制。

數據版本控制

你還可以隨時查看上次提交的數據與當前數據的區別,一旦有人不小心把公共數據改錯了,發現當前數據有異常時,可以輕鬆地回滾和修復問題。

查看不同版本的數據區別

Dolt 簡直就是 Git 和 MySQL 的孩子!

這也不像啊

關於 Dolt 的使用方法,官方已經給了詳細的教程,還是比較簡單的。

DoltHub

就像 Git 擁有 GitHub 作爲代碼的開源遠程託管平臺一樣,Dolt 官方也提供了相應的遠程託管平臺,即 DoltHub。

DoltHub 允許用戶將自己的 Dolt 數據庫免費託管到他們提供的雲存儲服務中,便於管理和協作。你可以像瀏覽 GitHub 一樣瀏覽 DoltHub,在這裏發現優秀的數據集,比如 Coronavirus(冠狀病毒)、Google Open Images 等,拿去實驗和數據分析都是極好的!

DoltHub

雖然數據版本控制的概念在很早之前就已經被提出和落地,但是 Dolt 的熱門應該能夠幫助更多同學瞭解和使用這類系統,我還是很期待他的發展。

本文分享自微信公衆號 - 1024譯站(trans1024)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章