數據工作者的福音:Google 發佈正式版數據搜索工具啦!

作爲數據工程師,平時在工作中一定少不了到處搜找測試數據,常用的網站包括:Kaggle、Freebase、Data.gov 等等,有時候要挨個網站搜索關鍵字和主題,然後下載了又發現數據集可能並不適用,非常浪費時間。

好消息是,上個月 Google 推出了正式版的數據搜索工具 —— Dataset Search

覆蓋了 2500w 個公開數據集,而且用戶可以使用過濾器進行搜索條件限定,篩選是否爲免費數據集、數據格式、數據更新時間等。

按照你所輸入的關鍵字和限定條件,Dataset Search 會爲你進行全網搜索,搜索結果包括每個數據集的描述,如:數據更新時間、數據來源、數據集組成、數據集內容等等。比如我們搜索關鍵詞「climate」,可以直接在右側看到符合條件的數據集的基本情況:

真的是非常方便!

Google 的這個數據搜索工具不同於其他的數據網站,Google 並不是直接提供這 2500w 數據集的下載,只是幫助你更快進行全網搜索。

如果你知道有某些公開的數據集,而 Dataset Search 搜不到,那你可以聯繫數據持有者爲其添加 schema.org 標記,這樣其他人就可以通過 Dataset Search 訪問到這些數據集了。


⬇️ 掃描下方二維碼關注公衆號【數據池塘】 ⬇️

回覆【算法】,獲取最全面的機器學習算法網絡圖:

發佈了38 篇原創文章 · 獲贊 23 · 訪問量 7萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章