Zilliz創始人星爵:國產開源需要更多利他主義

在技術以及市場均有局部領先優勢凸顯的情況下,國內基礎軟件+開源領域真正出現一傢俱有全球影響力的創新企業的概率極大。

邁入 2020 年,迫於外部環境的變化與調整,一些此前不被看好的開源以及數字化基礎設施層項目,也開始迎來了資本市場的重視。

以一級市場上真實的投資案例爲例,國內物聯網大數據平臺濤思數據與雲管理軟件及服務提供商騫雲科技兩家企業,均分別在今年各自獲得兩輪融資。而在國外,開源數據庫 CockroachDB、雲存儲技術服務商 Snowflake 等企業也均有新進融資。

可以說,在全球經濟增速下行,科技產業競爭格局日趨加劇的大背景之下,大國之間科技自主可控的需求進一步凸顯,而夯實底層技術與產品能力,以開源創新釋放新的增長動能,也因此變得極爲重要。

近日,InfoQ 特別面向廣大新一代信息技術領域的技術中堅羣體,正式推出「中國技術力量」之「中國開源創新 30 人」欄目,特別針對國內活躍的開發者社區和企業開源組織生態,重點約訪國內主流的開源理念倡導者、企業型開源業務領導者,輸出他們對於開源創新、技術前瞻,以及未來企業發展的思考精華。

「中國開源創新 30 人」第 1 期,我們邀請到 Zilliz 創始人星爵以及公司合夥人顧鈞接受了我們的採訪。2020 年星爵成功當選 Linux 基金會人工智能子基金會董事會主席,這也是中國代表首次擔任國際頂級開源 AI 社區的最高職務。

在 Linux 基金會職務之外,星爵於 2017 年創立的 Zilliz 也已先後兩次獲得資本助力,公司在 2019 年 10 月 15 日正式開源的第一款產品——向量搜索引擎Milvus,在7個月內積累了300多家企業級用戶。

或許,通過對 Zilliz 以及公司創始人隊伍的瞭解,我們能對國內“基礎軟件+開源”產業的發展現狀有更清楚的認識。

做 AI 時代的 ElasticSearch

在整個 IT 領域,以文本、圖像、音頻、視頻等爲代表的非結構化數據,已經牢牢佔據了整體數據量超過 80%的比例。而隨着 5G、AI、雲計算等技術的普及發展,海量數據的爆發已成爲必然到來的事實,而非結構化數據所佔據的比重與分量,也將越來越重。

可以說,面對海量的互聯網數據,如何將越來越重要也越來越基礎的非結構化數據進行存儲、查詢、分析、挖掘和利用,已經成爲了 AI 時代極其迫切而又意義重大的事情。

成立於 2017 年的 Zilliz,正是這樣一家致力於讓機器更快讀懂非結構化數據,進而加速產業數智化轉型升級的初創型企業。

“在 AI 大數據時代,非結構化的數據必然需要有一些專門的數據處理類企業來做,這就意味着將會有企業發展崛起的機會出現。”這是星爵開始創業的理由。

“我們要做 AI 時代的 ElasticSearch。”提及公司未來發展可能參考的對象,星爵的回答目標性極強。畢竟在美國,ElasticSearch 這家開源從事數據實時搜索與分析的競對企業,如今已登陸納斯達克,市值高達 80 億美元。

在朝着“成爲 AI 時代的 ElasticSearch”進發的過程中,Zilliz 所採用的是一種與大多數初創技術型企業都不同的方式——將公司辛苦研發了兩年的非結構化向量數據搜索引擎Milvus完全開源了。

對於一家初創技術型企業而言,在創業初期就將公司最核心的代碼開放出去,無疑是一個非常冒險的決定,畢竟公司技術骨幹辛苦研發的代碼一下子就這麼免費了。要知道,Milvus 研發了 300 多天,在完成 3600 多個 commit、5 次版本迭代和 7 萬多行源代碼後,纔有了 Milvus 的第一個開源版本 Milvus 0.5.1。

除了精力和時間,這一做法在可見範圍內的商業回報自然也將大打折扣,看似得不償失。不過在星爵看來,決定把代碼開源,其實是深思熟慮之後的大膽嘗試。

一方面,作爲被定義爲基礎軟件的產品,一個衡量硬指標就是使用規模。一個基礎軟件產品或者服務要想覆蓋全球數千萬家用戶,在產品的市場化過程中最重要的方式便是通過開源與用戶建立聯繫與信任,降低營銷和獲客成本。待用戶形成消費習慣再去做服務,這個時候對於新產品的推廣會變得更加容易。

另一方面,越是基礎層產品,要滿足人們普適的需求,長期來看,其成本必須要無限降低並接近於零。當一件產品的成本太高,那麼能夠使用它的人也勢必會減少。

“如果你做一款基礎軟件,同時還不選擇開源,那麼你已經輸在起跑線上了。”星爵表示。軟件正在吞噬世界,而開源則正在吞噬軟件。

所幸,由於相比 Facebook 開源的 Faiss 向量搜索庫和微軟開源的 SPTAG 庫,Milvus 能夠提供更加完整的向量數據更新、索引與查詢框架。開源半年之後,Milvus 已經成功爲 Zilliz 帶來了 300 多家企業級用戶。而一直積極參與 Linux 開源基金會建設的星爵,也於今年 4 月 22 日當選 Linux AI 基金會的新一屆董事會主席。

AI 下半場大有可爲

在 IT 技術領域,我國在越早期、越基礎的層面,往往落後越發明顯。反而是在移動互聯網、O2O、AI 等新近出現的技術領域,我們已經在一定程度上達到了追趕甚至於齊平國外發達地區的水平。

這一點,市場的反映更爲直觀。在 PC 時代,我國在操作系統技術層面嚴重落後,致使國內 IT 產業“少魂”。而到了 4G 時代,“抖音們”已經走出國門,通過技術創新實現了全球市場領先。

在新一輪的智能化產業變革浪潮中,國內市場與海外發達市場站到同一起跑線上競爭,彎道超車的可能性出現,這成爲了促使 Zilliz 以更加積極的態度佈局 AI 時代非結構化數據的關鍵。

而在另一方面,在彎道超車的同時,市場領先機會的出現同樣堅定了 Zilliz 對於 AI 賽道的押注。

從宏觀的經濟與科技產業發展哲學角度來看,一個國家和地區經濟發展導致的市場需求領先,最後往往能夠倒逼技術和產品的領先。“上一輪信息產業發展熱潮中,蘋果、英特爾等技術公司主要出現在美國,這是有原因的,因爲當時的文化、信息技術都是美國領先,市場和需求領先之後倒逼出的產品和技術也是領先的。”

在星爵看來,國內企業的AI 下半場大有可爲。

事實上,在 2019 年計算機領域知名的 CVPR 大會上,來自中國的學者發表的論文數量佔總論文數的比例高達 40%,而且最佳論文獎等大獎項幾乎全都被華人包攬,這直接證明了我國在 AI 研發以及運用領域的後發優勢明顯。

受制於教育背景以及環境熟悉等方面的條件限制,人在解決特定問題時,其實並不能夠達到 100%精確的程度,大多數在 80%~90%左右。而在這樣的辨識度下,目前限定場景下的計算機視覺技術已經能夠很好地滿足業務處理精度需求,AI 已經局部具備走入真實生活場景並解決問題的能力。

在上一輪以算法和模型爲主的產業發展浪潮當中,商湯、曠視等企業取得了先發優勢,但隨着算法的進步逐漸成爲瓶頸,上半場的商業機會和市場紅利開始接近尾聲;進入下半場,結合具體場景的需求做運用以及進行創新的機會纔剛剛浮現,並且勢頭正旺。

據星爵介紹,目前 Zilliz 有 50 多名員工,其中有 40 多名是工程師,公司正在強化人才以及技術的儲備,希望在今年內實現團隊人數從 50 多人到 100 人的擴充。然後在 2021 年底突破 1000+用戶,達到開源項目的規模效益臨界點,並進行商業化探索嘗試。

**通過開源的方式,Zilliz 正在構建專屬於 AI 時代的新型基礎設施。
**

開源需要更多利他主義

對於加在身上的一些職位殊榮,星爵看得很淡。“我更多將它看做是一個責任,期待能夠更多的服務於社區,讓更多人蔘與進來,一起創造價值。”在採訪過程中,星爵多次提及利他主義這個詞。

“在利他主義的驅使之下,前輩們先後開源了 Java、Hadoop、Spark 等一系列項目,讓國內企業從中受益。在這種開源利他主義的趨勢之下,如果有一天你有機會真正參與到開源項目當中,也把自己的產品開源出去幫助到別人,那會是一件非常有意義的事,同時也是對於前輩利他主義的一個迴應。”在星爵看來,積極參與開源,已經上升成爲了公司發展的使命。

“開源其實是減少重複造輪子的重要手段,對於一些比較基礎的底層技術,如果各家企業都各自閉門研發,必然造成重複投入以及後續市場的惡性競爭。”在 Zilliz 合夥人顧鈞看來,通過開源共建的方式促進國內信息技術的創新發展,是產業發展的一劑良方。

但是就目前的情況來看,國內想要真正催生出具有全球性影響力的開源產品,還面臨着諸如開源項目商業化模式不清晰,知識產權保護亟需提升,以及市場包容性不強等方面的難題。

長久以來,開源在國內往往被看做是與免費等同的概念,用戶對於開源產品的接受度和付費意願較弱。一旦開源項目得不到市場的認可並形成惡性的商業形態,項目的可持續性就會被打上問號,選擇用這一產品的人也就越來越少,於是開源生態想要發展就會變得更難。

“將開源等同於免費本質就是一種開源市場上利他精神缺失的體現,如果你用一家公司的產品,卻一直去薅這家公司的羊毛,最後這家公司沒能經營下去倒閉了,那其實這對你多少也會帶來一些影響。”在星爵看來,開源創新的實現,首先需要建立在一個良性且可持續發展的環境基礎上。

結語:國產開源的潛行

目前,國內開源領域的參與者主要可以分爲三類:首先是以阿里、百度等大型企業爲代表的大型企業開源生態;其次是以鵬城實驗室等爲代表的,具有一定政府以及產業背景的第三方組織機構;此外才是 Zilliz 這一類由初創型企業組成的開源力量羣體。

三類羣體中,大企業是開源力量的主力,但他們參與開源的目的更多的在於通過技術能力的外放,提升自身的美譽度,進而達到一定的人才吸引以及企業生態組織的目的。以行業協會或者第三方機構組成的開源羣體往往具有一定的行業引導以及治理傾向。而以 Zilliz 這一類初創企業爲代表的企業,他們在參與開源的時候往往也伴隨着一些獲客或者商業化的目的。

在擁有全球最大的用戶市場的同時,國內科技產業在新一代的 AI、雲計算等智能化技術的發展歷程中都具備了充分的技術儲備以及先發優勢。長遠來看,在技術以及市場均有局部領先優勢凸顯的情況之下,國內基礎軟件+開源領域真正出現一傢俱有全球影響力的創新企業的概率極大。

但是我們仍然需要看到的是,在看似一切皆有可能的背後,國產開源開放度與活躍度不高,社區治理以及開發者貢獻方面仍然有許多有待於提升的地方。

在國外已經出現了包括 Apache、Linux 開源基金會,以及 GitHub、MongoDB 等不同形態的開源生態參與者時,國內開源生態的形成仍然處於早期發展階段,後續仍然需要持續耕耘付出,在不斷摸索之中潛行。

嘉賓介紹


星爵:Zilliz 創始人兼首席執行官,是一位擁有超過 18 年經驗的數據庫和 AI 專家,目前還擔任 LF AI 基金會的董事會主席。LF AI 是 Linux 基金會旗下的子基金會,支持人工智能、機器學習和深度學習領域的開源創新。 在 Zilliz 之前,星爵在 Oracle 美國總部工作了多年,負責 Oracle 關係型數據庫系統研發。他是 Oracle 12c 雲數據庫項目的創始成員和主要貢獻者。,目前Oracle 12c 已累計實現了超過百億美元的收入。星爵擁有威斯康星大學麥迪遜分校的計算機科學碩士學位和華中科技大學的學士學位。

顧鈞:Zilliz 的合夥人、首席佈道師,擁有超過 16 年數據庫產品經驗,他目前還擔任 LF AI 基金會的技術諮詢委員會投票成員。在 Zilliz 之前,顧鈞先後服務過工商銀行(數據庫工程師), IBM (信息管理產品售前技術專家), Morgan Stanley (副總裁,數據庫專家),華爲(數據庫產品戰略規劃專家)。顧鈞擁有北京大學的計算機科學學士學位。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章