我,大廠離職,拿着千萬美元融資搞了個近乎全是程序員的公司

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"入職 Facebook 做了第一代高性能圖索引系統,代號 Dragon,卻被螞蟻金服的一場年會吸引進而成功入夥;覺得自己可能並不是天生的創業者卻轉頭搞了一家幾乎全是技術人的公司,併成功拿到紅點創投中國基金、經緯中國近千萬美元融資;沒有一個銷售卻服務了美團、騰訊、京東數科等衆多大廠;沒有極力推廣,團隊開源的圖數據庫項目 Nebula Graph 卻已經在 GitHub 上獲得了 5.8k 的 Star(截至發稿時)...... 這些聽起來稍顯凡爾賽的詞條全都指向了一個人——杭州歐若數網科技有限公司(vesoft Inc)CEO Sherman Ye,他身上有太多故事和想法值得挖掘。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"embedcomp","attrs":{"type":"video","data":{"id":"355168","name":"我,大廠離職,拿着千萬美元融資搞了個近乎全是程序員的公司","poster":"https:\/\/static001.infoq.cn\/resource\/image\/88\/78\/880618d57f3547c21acbcbc10fbb0978.jpg"}}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"大廠幹得好好的卻離職自己做,創業對這個技術宅而言到底有什麼吸引力?爲什麼選擇競爭者衆多、本身還不是很火熱的圖數據庫領域?爲什麼從一開始就選擇用開源的方式去做?在項目介紹中稱這是世界上唯一能夠容納千億個頂點和萬億條邊,並提供毫秒級查詢延時的圖數據庫解決方案,是什麼樣的技術能力讓這羣技術人如此有底氣?帶着這些問題,極客邦科技創始人兼 CEO、InfoQ 中國創始人霍泰穩與杭州歐若數網科技有限公司 CEO Sherman Ye(以下簡稱 Sherman)展開了一場深度對話,以下爲正文內容。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"先後離開 Facebook、螞蟻金服,選擇創業"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"“面試螞蟻金服的時候,面試官就問過我以後有機會的話會不會創業,我的回答是有機會一定去創業,沒想到就成真了。”"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"自 1997 年出國留學拿到學位之後,Sherman 就一直在國外工作,直到 2011 年初加入 Facebook 纔開始接觸圖數據庫。沒成想,這次觸電讓圖數據庫成爲了他日後創業的主賽道。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"“我最初加入的是 Facebook 的搜索引擎團隊,Facebook 的很多關係查詢是基於搜索引擎做的,後來慢慢發現搜索引擎無法很好地滿足關係的複雜查詢。2011 年底,我跟另外的同事做了二級圖索引項目試圖解決這個問題,算是 Facebook 圖數據庫項目的早期雛形。”"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"雖然在 Facebook 做得還不錯,但 Sherman 心裏還是希望未來可以回國發展,直到 2014 年,在 Facebook 工作了四年之後,Sherman 決定回國。"}]},{"type":"heading","attrs":{"align":null,"level":3},"content":[{"type":"text","text":"被螞蟻金服的一場年會拿下"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"2014 年,Sherman 一位在螞蟻金服工作的朋友向其發出了邀請,希望他回國後可以考慮加入螞蟻金服。同年 5 月份,Sherman 收到螞蟻金服回國面試的邀請,便匆匆回國了。"},{"type":"text","marks":[{"type":"strong"}],"text":"“我記得特別清楚,那天是 5 月 10 號,正好趕上了阿里日活動。面試完,對方邀請我參加他們下午的活動,地點是杭州的黃龍體育館,一進入場館就讓我覺得非常震撼,整個體育館大概容納了一萬人,氣氛也和我想象中的國內企業完全不同,我當時覺得加入這樣一家企業未來的發展一定會非常好”。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Sherman 與螞蟻金服的緣分就從這樣一場盛大的年會開始了。轉年 1 月份,螞蟻金服開始考慮將關係網絡應用於金融風控領域,Sherman 順利成爲該團隊的負責人,繼續研究起了圖數據庫。“我們當時試用了很多第三方產品和開源產品都覺得不太行,最後又開始自己做了”。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"就這樣,Sherman 帶領團隊在僅僅 3 年多的時間裏,成功研發出具有高性能、高可用性、擴展能力強和極佳移植性的 GeaBase。離開螞蟻金服之後,Sherman 選擇在圖數據庫領域繼續前行。單就實戰近十年這一點來看,這個選擇似乎沒有任何問題。但是,創業顯然不是一人、一刀、一槍再配上熱情就可以的事情。大部分創業公司早期階段需要吸納融資以維持研發過程的成本,所以選擇資本看重的領域非常重要。相比於投資圈聊得火熱的雲原生、人工智能、中臺等,圖數據庫領域略顯冷清。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"爲什麼選擇“不溫不火”的圖數據庫?"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"“可能是因爲我除了圖數據庫也沒有其他什麼特長,所以只好在這個領域創業了吧。”Sherman 打趣道。“事實上,過去幾年,我們看到了圖數據領域的迅猛發展,我認爲未來 3-5 年,圖數據庫不能說取代主流的關係型數據庫,但一定會成爲非常重要的輔助產品。”"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"根據 Sherman 的判斷,未來 3-5 年,就像現在幾乎所有企業都在使用關係型數據庫一樣,大多數的企業也會使用一套圖數據庫來保存關係,這個判斷是基於對整個業界的業務、技術以及數據量做出的判斷。在與衆多企業接觸的過程中,Sherman 發現越來越多的業務方開始對數據之間、實體之間的關聯關係感興趣,因爲他們發現其中可以挖掘出非常大的業務價值,這些關聯關係就是圖數據庫要解決的問題。基於這樣的想法,Sherman 聚集了一羣研發人員開始投入研發過程。作爲一個典型的技術宅男,雖然 Sherman 從大學開始就一直想創業,但始終感覺自己不太適合創業。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"“我們公司到現在爲止也沒有一個銷售同學,大部分都是研發人員,我們做的開源分佈式圖數據庫又是一個偏底層的技術產品,對研發同學的技能要求又比較高,之所以能吸引到這麼多優秀的人才,主要還是因爲這些人都是有技術情懷的,願意接受有技術挑戰的事情,希望可以做一個能夠給社區和社會帶來價值的產品,同時也體現出自己的價值”。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在這樣一個相對純粹的研發氛圍中,整個技術團隊用了 7 個月的時間就搞出了 Nebula Graph,一個使用 Apache 2.0 許可證的開源圖數據庫項目,短短時間內就在 GitHub 上收穫了 5.8k Star,美團、騰訊、小紅書、京東數科等衆多企業通過開源社區找到 Sherman 團隊,希望可以合作。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"談到開源背後的邏輯,Sherman 沒有絲毫猶豫地表示:"},{"type":"text","marks":[{"type":"strong"}],"text":"“做這個項目的第一天,我們就決定把它開源。”"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"開源意味着代碼需要經過社區全體開發者的檢驗,這也意味着後續需要進行長期的社區維護。Sherman 對此也有着自己的思考,我們決定做開源其實主要有三個原因:一是希望圖數據庫這個領域可以快速被大衆所熟知,畢竟當時瞭解圖數據庫的人並不多,開源可以讓用戶更容易地使用起來;二是學過傳統數據庫的人都知道大學裏是有相關課程設置的,但是圖數據庫並沒有,一些圖的基本理論也都屬於數學範疇,開源可以讓用戶很容易學習,並且大家可以在開源社區裏面互相交流、互相幫助;三是我們想做國際化,任何一個產品無論是從技術層面還是架構層面都不應該只針對國內市場,技術人可能多少都有一點情懷,希望自己做的項目可以爲更多人帶去力量和價值。因此,Nebula Graph 這個項目從第一行代碼、第一行註釋、第一份文檔開始全部都是英文的。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"如果說團隊還有一點私心的話,基本就體現在 Nebula 的名字上了。“Nebula 意爲星雲,我們以此代指圖中錯綜複雜的關係和節點”。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"千億頂點、萬億條邊、毫秒級查詢延時"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在 Nebula Graph 的 GitHub 項目主頁上有一句很“霸氣”的介紹:世界上唯一能夠容納千億個頂點和萬億條邊,並提供毫秒級查詢延時的圖數據庫解決方案。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"“其實,我們說的是實話,不是爲了市場宣傳的。”Sherman "},{"type":"text","text":"表示,Nebula 項目設計之初就是爲了解決大數據量的問題,所以起初的架構搭建對分佈式的擴縮容及彈性做了深度規劃。從實際應用來看,很多用戶的數據量確實達到了千億甚至萬億級別。查詢效率達到毫秒級的主要原因是數據庫從設計之初就針對 OLTP 場景也就是線上實時查詢場景進行了規劃,包括數據分區、查詢執行計劃等,每次查詢的延時其實和總數據量並沒有關係,因爲僅查詢單次任務中涉及的數據量,可能僅是一個小的子圖,這就是 Nebula 可以在如此大的數據量級下保持毫秒級延時的原因。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"與傳統數據庫類似,圖數據庫領域也分爲 OLTP 和 OLAP 兩類,OLTP 指的是提供在線查詢的服務,其特點是對延時要求苛刻,同時併發量較大,比如金融風控場景,每秒的交易量可以達到上百筆甚至上千筆,且交易過程較快。從用戶視角來看,無論是轉賬還是支付都希望在極短的時間內完成,這就極大壓縮了風控的過程和時間,如果調用圖數據庫可能只需要幾十毫秒就可以完成。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在這個羣雄逐鹿的圖數據庫市場,有些產品是爲了計算而生;有些產品是爲了在線查詢的低延時、高併發場景而生,Nebula 顯然是後者。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Nebula Graph 項目地址:"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"https:\/\/github.com\/vesoft-inc\/nebula-graph\/blob\/master\/README-CN.md"}]},{"type":"heading","attrs":{"align":null,"level":3},"content":[{"type":"text","text":"Nebula 2.0 版本發佈:從社區中來"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"經過了開源社區的磨鍊,Nebula Graph 的 2.0 GA 發版在即,新版本 2.0 最大的特點就是從社區中來,解決了很多社區開發者的實際問題。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"根據 Sherman 的介紹,2.0 版本最大的改動是支持 Neo4j 的查詢語言 Cypher,幾乎做到了 70% 的兼容,後續版本會逐步提高兼容度。原 Neo4j 的用戶在數據量較大後,查詢速度會變慢,且由於 Neo4j 是單機版無法保存大量增長的數據,所以很多用戶希望從 Neo4j 遷移至其他更加適合自身需求的系統,甚至爲此重寫了 Query,Nebula Graph 新版本會讓原 Neo4j 用戶更加平滑的過渡到 Nebula Graph。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"爲了實現這一功能,整個團隊對 Nebula Graph 的架構做了重構,雖然用戶可能感知不到,但這對 Nebula 的後續發展至關重要,這讓整個架構更加接近傳統的 SQL 數據庫,有了分析器、優化器、執行器等一整套組件,可以更加容易地支持不同的查詢語言,對系統進行擴展和執行不同的調度策略,使得整個體系更加靈活,擴展性也變得非常強。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"此外,團隊還針對社區開發者呼聲較高的需求進行了響應,新版本增加了全文檢索功能;在原有 64 位整型支持的基礎上新增了 String 類型,這些特性的增加爲整個項目的後續發展打下了堅實的基礎。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"與此同時,整個項目持續開發雲上服務。"},{"type":"text","marks":[{"type":"strong"}],"text":"“做圖數據庫對資源的消耗是非常大的,因爲需要進行各種計算,而云計算按需取用的特點是天然適合這一場景”。"},{"type":"text","text":"目前,Nebula Graph 的圖數據庫雲服務平臺 Nebula Graph Cloud Service 處於公測階段,支持一鍵部署 Nebula Graph。而且,公測期間不會就雲服務收取任何費用,歡迎開發者免費試用。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"基礎軟件的浪潮來了,圖數據庫的未來呢?"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"從宏觀視角來看,圖數據庫屬於基礎軟件,而基礎軟件是國家當下非常重視的領域。一般來說,基礎軟件可以分爲操作系統,數據庫,開發工具等。目前來看,Sherman 表示,中國的市場非常大,所有智能設備的裝機量可以佔到全球市場的四分之一到三分之一,所有的這些設備都需要操作系統、數據庫的支持,其上應用的研發又需要開發鏈和開發工具,所以市場空間是非常巨大的,只是目前國產軟件的市場佔有率還是偏低的,這也意味着中國的基礎軟件公司還有很大的潛力。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"到底什麼樣的公司可以脫穎而出,Sherman 認爲簡單一句話就是做市場需要的產品,這句話說起來容易,做起來並不簡單。首先,軟件需要具備一定的技術門檻,無論是誰都有能力開發的產品很難在市場上做大;其次,要做符合市場需求的產品,反之技術再牛也無法得到用戶的認可;最後,聆聽社區的聲音,感知用戶的真實反饋,並在技術上不斷提高,逐步建立自己的技術壁壘纔可能成功。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"作爲數據庫的分支,圖數據庫本身的市場佔有率還不足 2%。究其原因,Sherman 表示其實圖數據庫的需求就在最近 2-3 年比較旺盛,尤以金融領域爲最。金融領域存在着大量賬戶之間的關聯關係,這些關係組成了一張非常大的網絡增加了風控的難度,單靠用戶畫像做出判斷是遠遠不夠的,圖數據庫的出現可以更好地解決這一問題。從另外一個角度來說,僅用兩三年的時間可以在發展了四五十年的數據庫領域佔據 2% 的市場已然非常快了。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在基礎軟件全面崛起的浪潮下,圖數據庫存在巨大的市場空間。根據分析機構的預測,到 2025 年,圖數據庫將佔據整個數據庫市場 9% 至 10% 的份額,這其實是一個非常大的數字,基本是以每年 50% 至 60% 的速度遞增,雖然目前的佔有率還不高,但可以認爲處於爆發的前夜。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"目前,圖數據庫還存在許多挑戰需要解決,比如數據的完備性、一致性,分佈式事務的支持以及 AP 和 TP 融合等。對 Nebula 而言,本身更多偏向於 TP,未來要想做到真正的 AP 和 TP 的有機融合在技術上還面臨着非常大的挑戰。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"“未來,我覺得還有很長的路要走,對技術產品來說,攀登是沒有止境的,每當你達到一定的高度,用戶就可能提出新的需求,做技術產品的人需要不斷地跟用戶交流,滿足用戶的需求並提高自己的產品,其實這是一個迭代交替上升的過程。”"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"嘉賓介紹:"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Sherman Ye,杭州歐若數網科技有限公司(vesoft Inc)CEO,圖數據庫領域資深專家。2011 年 1 月至 2015 年 1 月就職於 Facebook,參與和領導了搜索引擎、圖索引引擎等分佈式系統的設計和開發,這是他所研發的第一代圖數據庫(Dragon)。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"2015 年回國後加入螞蟻金服,擔任螞蟻金服圖計算及存儲技術團隊負責人,主導研發了他的第二代圖數據庫 GeaBase。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"離開螞蟻金服後,創立 vesoft Inc. 研發新一代開源分佈式圖數據庫 Nebula Graph,致力於推進圖數據庫領域的技術發展。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"歐若數網公司的創始團隊來自於硅谷和國內互聯網公司阿里巴巴、Facebook 等,技術團隊領導開發過分佈式圖數據、移動大數據、數據存儲管理等核心創新項目。"}]}]}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章