GitHub “唯星論”可以休矣

本文最初發表在 Towards Data Science,經原作者 Caleb Kaiser 授權,InfoQ 中文站翻譯並分享。

開源項目在 GitHub 上的星(Star)並不是它的全部意義。

譯註:星是倉庫的書籤或讚賞表示。星標是項目受歡迎程度排名的手動方式。

憑直覺我們都知道,GitHub 的星,對於開源項目來說並不是決定性的因素。點擊“星”按鈕這個行爲只是表示用戶認爲:“我覺得這個項目很有趣。”這是一個不錯的信號,但它並不是項目是否成功的定論。

儘管如此,GitHub 的星還是很有誘惑力的。星很簡單,可以計數,而且還是積極反饋的信號。作爲用戶,較高的星標數讓你有理由查驗一個項目而不是另一個項目。作爲一個維護者,每一次星標數的增長都會讓你感到興奮——這是我的經驗之談。

我在 Cortex 工作,Cortex 是開源機器學習基礎設施,儘管明知如此,我仍然會對星標數的激增感到莫名的亢奮。

來源:https://star-history.t9t.io/#cortexlabs/cortex

很顯然,我並不孤單。圍繞着 GitHub 的星,有一個完整的生態系統。開源營銷已經成爲自己的利基市場。

開源團隊致力於通過公告實現星的里程碑。已經出現了一套完整的工具,可用於跟蹤和分析星標數增長的情況(見上圖)。

曾不知幾何起,GitHub 的星,從“支持一個項目的公開方式”悄然變爲“開源軟件的流通貨幣”,因此,重新評估 GitHub 的星到底有什麼價值是很有必要的。

爲什麼 GitHub 的星沒有你想象的那麼重要

GitHub 的星確實是有價值的,不過這一點我們稍後再談。但今天對它們的強調,卻有些不相稱。總的來說,GitHub 的星並不像我們所認爲的那樣有價值,原因有以下幾點:

1. 星並不等同於用戶

你可以在不使用項目的情況下就爲它標星。你也可以在不標星的情況下去使用某個項目。這可能是顯而易見的事實,但必須強調的是,星與用戶之間並不存在必然的因果關係(當然,其中一個可以導致另一個)。

例如,在 Cortex,就有數量驚人的用戶沒有在其倉庫上進行標星。

我們評估 Cortex 是否健康是看它在生產環境中部署模型的人數。我們通過與實際用戶的互動來衡量。如果這個數字上升,我們就知道我們做的是對的。如果它下降了,就說明我們有一些問題需要去解決,即使星標數仍在增加。

2. 星高度依賴環境

GitHub 的星並不是一個一致的價值單位,不同項目之間的星標數比較,並非完全直截了當。

一個項目的社區規模和活躍度、潛在用戶的數量以及維護者的營銷力度,都對該項目的星標數有着巨大的影響。

比如,如果你是前端 JavaScript 框架,並且你有 Facebook 的營銷預算,那麼你的星標數就會比 DevOps 工程師的工具還要高。換言之,與 Elasticsearch 的星標數爲 4.9 相比,Rect 的星標數只有 14.8 萬,但這一事實並不能說明 Elasticsearch 是否成功——它們的關係就好比蘋果和橘子一樣,沒有可比性。

3. 從根本上說,GitHub 的星仍然是一種社交媒體

雖然 GitHub 顯然不是 Twitter,但 GitHub 的星仍然是一種社交媒體,所有通常的注意事項都適用。

首先,一些 GitHub 用戶在社交方面比其他用戶更爲活躍。有些用戶爲 2000 個項目進行了標星,而有些用戶幾乎就沒標過星。

同樣,很多 GitHub 用戶也會用標星來表示對一個項目的普遍支持,即使他們從未打算使用這個項目。例如,當我們剛推出 Cortex 時,我們收到了很多來自 Go 社區用戶標的星,甚至是那些對機器學習不感興趣的人。這並沒有什麼不對,我們非常感謝大家的支持,但這只是強化了星與使用量的脫節。

星並非所有的一切,但它們仍然很有價值

儘管我提出瞭如前所述的注意事項,但如果你能獲得一顆星,仍然是好事一樁。

GitHub 的星是人們普遍對一個項目感興趣的信號,同樣的道理,星標數可以爲類似項目之間提供一個有用的基準。比較 React 和 Elasticsearch 可能沒有什麼意義;但 React 的星標數是 Angular 的兩倍以上,這一事實可能是有意義的。

GitHub 的星也會提供一些反饋,告訴你哪些人覺得這個項目有意思。對於 Cortex,我們發現這個項目不僅在數據科學家中很受歡迎,在開發人員中也很受歡迎,這一點很讓人驚訝。這就影響了我們如何開發這一項目的一些決策。

最後,我要說的是,GitHub 的星,能夠讓一個項目更容易被發現。除去顯而易見的事實外,較高的星標數有助於項目脫穎而出,還會影響 GitHub 的推薦。我經常發現新的機器學習項目,那是因爲我曾經給類似的項目標過星:

出於所有這些原因,GitHub 的星還是有價值的,只不過它們並非評估開源項目的完整指標。

作者介紹

Caleb Kaiser,Cortex Lab 創始團隊成員,曾在 AngelList 工作,最初在 Cadillac 供職。

原文鏈接

https://towardsdatascience.com/github-stars-are-overvalued-15ba780b36

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章