這匹“費馬”有點酷

認識洪春濤,其實是在BDTC大會上,當時在微軟亞太研究院的他還是一頭長髮,如今,身爲費馬科技的CEO,洪春濤用一頭幹練的短髮迎接了老孫的來訪。

費馬到底是一匹什麼“馬”?

對於許多人來說,相對於微軟亞太研究院,費馬科技的名頭就小多了。但如果聚焦到圖數據庫領域,這家由清華大學的多名博士聯合組建,專注於圖數據技術,爲企業提供高性能圖數據存儲及分析平臺的國家高新技術企業,還是頗有名氣的。

關於費馬的名稱的由來,還有一個小故事,爲了搞定這個名字,費馬的團隊展開了激烈的討論,最終學霸們爲項目起了個速度爲王的名字:F=ma(費馬)。F=ma是牛頓第二定律,意爲“加速”;同時FMA也是計算機的乘加指令(比快更快),中文名字致敬了數學家皮埃爾.德.費馬。從此快如電光的LightGraph和PandaGraph有了更快的名字“費馬”。

而費馬科技也沒有辜負這個名字,基於自主研發的費馬圖數據平臺,費馬科技爲金融、電商、電力和物聯網等行業提供高性能可擴展的圖數據存儲和分析產品,以更科學的方法實現大數據關聯關係分析。 目前已有包括中國工商銀行、京東金融、搜狗搜索、國家電網、中國民生銀行、拉卡拉在內的多家業內頂尖企業正通過費馬圖數據平臺實現大規模圖數據分析並獲得數千倍的性能提升。

實際上,圖數據庫並不是一個很新的技術,圖數據庫是一種非關係型數據庫,它是NoSQL數據庫的一種類型,應用圖形理論存儲實體之間的關係信息。最常見例子就是社會網絡中人與人之間的關係。關係型數據庫用於存儲“關係型”數據的效果並不好,其查詢複雜、緩慢、超出預期,而圖數據庫的獨特設計恰恰彌補了這個缺陷。

而在圖數據庫領域,比較出名的當屬Neo4j,這也是圖數據庫領域的“前輩”,而費馬圖數據庫和Neo4j比起來確實應該稱作是“晚輩”,不過,相對於先行者,後來者也有自己的優勢。

“Neo4j一個很大的問題是它整個設計的理念就是奔着1億量級去的,這是由於它設計的時期是比較早,因此,1億量級的節點,那個時候他們可能覺得就足夠了,所以,Neo4j最大的問題是1億級以下的節點上它都可以跑得很不錯,但一旦超過1億節點,性能就會急劇下降。但國

內的情況是,擁有上億賬戶的用戶比比皆是,因此,很容易就會突破1億節點的規模,因此,就導致Neo4j在國內的應用效果大打折扣。此外,由於Neo4j畢竟設計的較早,所以有很多更先進的設計方法它並沒有採用。而我們相當於站在他們的肩膀上,在做設計之前,我們會去看Neo4j的設計是怎麼做的,他們的優缺點在哪裏,我們會去根據這些做重新的設計。因此,我們從數據結構設計上以及設計目標上都會和Neo4j有很大的不同。”洪春濤侃侃而談。

而基於這樣的設計,再加上使用了效率更高的C++語言,相對於其他的圖數據庫,費馬圖數據庫的性能快百倍,內存消耗少十倍。因此,從這個意義上來說,費馬正如其名,實際上就是一匹動如閃電的“快馬”。

爲什麼要創立費馬

雖然費馬在圖數據庫領域是一馬當先的一匹“快馬”,但同軟件帝國微軟比起來,幾乎可以忽略不計。那洪春濤爲何要捨棄在微軟的優厚工作,轉而走一條創業的艱辛之路呢?

“從小的目標說,做圖數據的平臺、圖計算、圖數據庫這些技術,是覺得圖計算技術從現實上會有用,我們既有這個歷史的積累,又覺得這個有前景,所以希望去做一個最好的圖計算、圖數據的平臺。而從更長遠、更廣闊的角度說,就是希望能夠在國內做一家比較好的系統軟件的公司,因爲我們整個實驗室一直在做系統軟件,我自己也做過很多的系統軟件,而在國內,其實是沒有一個真正稱得上成功的系統軟件公司的。”洪春濤如此解釋自己創立費馬的原因。

“國內爲什麼一直沒有比較好的系統軟件公司,國內的軟件公司爲什麼一直成長不起來,我也一直在思考這個問題,我覺得還是需要有一個商業化的運作,既要有高水平的學生、程序員加入進來,更需要有商業化的運作,可以持續的投入時間、精力以及資金。我創立這個公司也是希望能夠把這條路走通,從而可以告訴國內的這些做系統軟件的人,這條路是可以走通的,在中國也是可以孕育出一個好的系統軟件公司的。”洪春濤堅定的說。

洪春濤接着詳細的解釋了中國目前沒有好的系統軟件公司的原因,他認爲,一方面,從系統人才的培養上,國內確實起步較晚,另一方面,系統軟件需要長時間積累,而由於國內起步較晚,因此,就不太可能有長時間積累的過程;第三,國內缺乏做系統軟件的風氣以及商業氛圍,很多時候是在模仿。

“很多時候大家並不覺得這有什麼太大的問題,但是作爲有‘潔癖’的人。我們希望從底層就做得和人家不一樣,我們要做得更徹底,徹底去掌握其中的關鍵技術,而不是說去稍微改一改,滿足一個很低端的需求,我們更希望從整個系統的角度來掌控。”洪春濤說。

正如洪春濤所說,雖然同是做圖數據庫,但費馬科技確實是紮紮實實的從最底層做起,團隊重構了圖數據系統,優化了系統可用性,內置了大量的算法,封裝接口等等,支持豐富的接口和調用語言,並提供數據快速導入導出、可視化等外圍工具,便於管理和使用,使其更適應商業應用場景。而洪春濤所說提及的“潔癖”,實際上是指整個開發團隊,對於代碼嚴謹性和簡潔性的要求。也就是說,每段代碼,都會寫兩遍,第一遍的目的是實現功能、跑通程序,第二遍是更合理更簡潔更完美的實現,這種良好的代碼編寫習慣,也爲費馬系統的嚴謹性、可靠性、高效率打下了良好的基礎,而這,也是費馬系統快如閃電的祕密之一。

圖數據庫的未來

費馬所”押注”的圖數據庫,其實在金融方面應用比較廣泛,比如說,在貸款的背調工作中,圖數據庫就能發揮重要的作用,可以通過圖數據庫去研究貸款人的社交關係、交易關係,從而判斷貸款人的風險等級。事實上,金融方面基本上各個領域,都同圖數據庫有着或多或少的聯繫。

此外,在公共安全方面,圖數據庫也有很多應用,特別是在研究關聯性的領域,圖數據庫可以發揮非常重要的作用。但洪春濤表示,現在圖數據庫和圖計算平臺本身還是處於一個比較早期的階段,很多方面都不標準,比如說沒有一個統一的、標準的接口,因此需要像費馬這樣的公司,來統一標準、規範接口。另一方面,還需要有教育、培養出更多圖數據庫領域的人才。

此外,圖數據庫從系統、技術上還有很多可以做的事情,比如從性能上面,因爲圖計算本身很複雜,現在很多系統只要數據量大到一定的程度,就會變的非常緩慢,甚至無法使用,這就需要從系統上去進行改進,而這還需要一段很長的時間。

另外,還有一些比較現實的實踐上的問題,比如說超大數據量的時候怎麼處理,哪些問題應該用用圖數據庫來解決,哪些東西應該用圖計算來解決,現在也都還沒有一個比較標準的答案,所以基本上還是靠自己一個個問題去思考。

洪春濤認爲,未來,圖數據庫肯定會和人工智能做更緊密的結合,包括圖數據網絡這些技術,它實際上可以幫助用戶去更接近他真正要實現的場景,所以它會往場景方向上繼續發展。

要做中國版的Oracle

談到費馬的目標,洪春濤坦言,數據庫巨頭Oracle是他最想模仿的目標。不過,洪春濤也深知要成爲中國版Oracle的不易。

“做系統軟件,要有一點理想主義。因爲一個系統剛開始做的時候肯定不如老系統,會有一些短板,這個時候是需要堅持的,你要堅持不斷改進它,慢慢趕上來。這段時間,可能是系統軟件公司最容易‘死’掉的時間,所以我覺得很重要一點,就是要有一些理想主義,要堅持以自己認爲對的方向走下去。而太多的國內公司會屈服於現實,爲了活下去而改變自己的初衷。在這一點上,我們的整個團隊還是比較一致的。而且從目前看來,整個投資的環境對我們還是比較友好的,因此,我們可以按照我們自己的節奏,一步一步的走下去!”洪春濤最後說。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章