上海“隨申碼”研發幕後:一艘沒有故事的光速飛船

本期採訪嘉賓:星環科技研發總監、TGO 鯤鵬會會員 劉汪根

2020 年 2 月 7 日,農曆正月十四的深夜,中國大部分人正在睡夢中迎來元宵節,度過這“加長版春節”的最後幾天。

這一天是個週五,新冠肺炎在全國感染了 9692 人,並有疑似病例 15238 人,但上海的復工潮卻即將開始。

與其他人不同,劉汪根在入睡前接到了一通電話。電話裏,他得知上海市已準備上線一種可以標註用戶感染風險的健康碼:隨申碼 —— 綠色放行,黃色觀察,紅色隔離,簡單有效。

星環科技是上海市相關數據管理單位的基礎設施最主要的承辦方之一,而作爲星環科技大數據雲平臺的研發總監,他責無旁貸。

週一,隨申碼就將灰度上線,所以,留給劉汪根團隊的時間只有 3 天,工作內容包括研發、測試、多方聯調;要求是,實時計算健康碼狀態,支撐每秒至少 10 萬 + 的併發查詢。

在劉汪根看來,這就是一個“戰爭任務”。

右二爲劉汪根,他戴着一頂帽子,始終在現場“督戰”

3 日戰疫

劉汪根以最快的速度爬起牀,一邊聯繫團隊內的主力工程師們,一邊與相關管理部門完成了需求的溝通,同時也很快和管理單位講解隨申碼的架構設計和開發過程,與相關合作單位進行細粒度的需求規劃。

在隨申碼項目裏,星環科技負責的是底層數據庫系統及高併發數據服務的構建,上層移動應用架構則交給並肩作戰的其他團隊共同完成。隨申碼的底層數據庫服務能力,來自於 TDC(Transwarp Data Cloud,由星環科技研發的智能大數據雲平臺),這是劉汪根的心血結晶。

劉汪根曾對 TDC 如何實現服務化、應用化做出過長達數年的探索,而隨申碼項目,就像一場針對平臺服務化的綜合考試。

隨申碼的研發現場

差不多在 2 月 8 日的凌晨 1 點,星環科技資深工程師李光躍的電話響了:“我接到老劉(劉汪根)的電話,問我能不能幫忙寫一個服務。我當時還在想,怎麼這麼着急?”

當晚,CEO 孫元浩、研發總監劉汪根等管理層都聚集在現場——那是一個臨時開闢出來的辦公區,一排排分佈着幾十個工位,聚集着各層領導和各業務方代表。

如李光躍一般收到通知的工程師,則在深沉的夜裏開始遠程辦公,黎明時分再前往這個小小的“戰時陣地”。

久居江南的人,頗瞭解南方冬天的厲害:“室外冷,室內更冷”——又溼又涼。此時正值疫情發展的高峯期,空調被迫關閉,斷絕了採暖,使這場“戰爭”顯得尤爲折磨。最開始現場無法睡覺,大家就在椅子上休息,用大衣蒙着頭,劉汪根說:“後面才趕緊買的行軍牀,讓大家湊合湊合。”

短暫休息的研發人員

另一大難處在於吃飯,外賣餐飲幾乎銷聲匿跡。劉麗君在星環科技的市場部工作,她曾經趕到現場慰問技術團隊,後來回憶道:“桌子上有個寫着‘大潤發(一家量販超市)’的袋子,外面散落着咖啡和一些麥當勞漢堡。但大家幾乎沒有時間吃,每個人都拿着電腦走來走去。”

星環科技的技術團隊每 24 小時換一班,有近 30 人實時跟進,劉汪根說:“沒聽到抱怨的,一般是實在挺不住了,才問:‘能不能換個人……’”

週日凌晨,上層應用已經開始了對底層 TDC 服務的壓測。無論中間出現怎樣的 BUG 或性能問題,數據庫一直都非常穩定。

到了週一,各方壓測、聯調已經基本結束,隨申碼開始灰度上線,劉麗君說:“孫總(孫元浩)和汪根(劉汪根)的眼神都有點渙散,他們都熬了兩個通宵。”

右一爲星環科技 CEO 孫元浩

對於劉汪根來說,隨申碼項目的壓力很大,但並非無法承受。一個很重要的原因是, TDC 產品性能和研發效率已經相當優越,在整個測試過程中表現都非常穩定,一次上線,後面都沒有發生變更。

作爲 TDC 的主要負責人,劉汪根對其傾注了相當多的心血,以至於從 2018 年開始的一段時間,他經常失眠:“有一段時間我經常睡不着覺,所以我兩鬢白頭髮特別多,做數據 PaaS 平臺有太多需要思考的內容,技術方向、目標場景、產品質量,都要去想。”

“老劉”的失眠,TDC 的生長

那段失眠的時間,他思考最多的是 TDC 的發展方向問題,有時候想的興奮了,就睡不着了;想到苦惱的問題,就更睡不着了。

“最早在大數據領域,只需要解決幾個核心場景的數據問題,比如建設數據倉庫、數據湖,做好數據的存儲、管理、調用,事情差不多就解決了。”劉汪根補充道,“但接下來,我們發現的問題是數據要深入服務場景,讓所有人都能使用,這就是服務化。而大數據要做到服務化,最好的方式就是雲化。”

在 2014 年前後,大數據平臺服務化,在整個行業都沒有較好的落地形式——虛擬機的支撐效果很差,實體服務器的價格又比較昂貴。

在容器技術尚沒有進入業界主流視野的時刻,包括劉汪根在內的星環科技技術管理者,已經覺察到這可能是一個非常好的大數據系統雲化的主體。

他們在 2015 年開始技術預研,並在幾個月內完成了系統原型的構建。與物理機相比,基於容器技術構建的數據庫性能沒有明顯損失,而相對於容器化架構,採用虛擬化方式則有超過 30% 的性能下降,於是再沒有猶豫,大家堅定的選擇將大數據的雲服務構建在容器化 + Kubernetes 之上,並深度研發了底層的數據中心操作系統(Transwarp Cloud Operating System)。

但與技術結論相反的是,早期部分客戶出於謹慎考慮,並不都是看好容器技術的實踐。

“最開始也有客戶說:‘容器技術纔出來啊,不夠好,不夠穩定,你就給我維護個不用容器的老版本好了’”,劉汪根苦笑道,“但時間證明了我們的選擇,到了 2018 年末,這種聲音基本消失了。對於星環來說,尤其對於我來說,有一件事情是堅守的:始終要把底層數據平臺這件事情做好,把底層核心的東西做好,這可能是一種堅守吧。”

這種堅守使得星環科技已經成爲業界第一個使用容器編排技術實現大數據和 AI 服務彈性化的公司,可以藉助容器技術無縫鏈接私有云、混合雲和和邊緣計算,爲三者提供統一的計算平臺。

在國內,To B 行業還處在早期發展狀態,像劉汪根一樣的技術 Leader 往往需要不知疲倦地趕路,翻過一座山,卻發現面前還有一座山。

構造一個大數據雲平臺是技術問題,實現一個真正意義上的雲服務則是理念問題。

現在,TDC 已經開始探索第三個階段:使用數據雲技術打通各地數據中心,實現大型基礎設施的互聯互通。

聽起來,劉汪根又要失眠了,但 TDC 也不停的成長。

沒有故事的光速飛船

堅守底層核心技術的企業往往矗立互聯網花邊輿論之外,它沒有漂亮的 PPT,沒有“語不驚人死不休”般的媒體言論,也從不捲入大佬的朋友圈互撕。它缺乏故事,沉默、硬核,對技術突破習以爲常。

2018 年,星環科技成爲全球第一家通過 TPC-DS 測試的大數據企業。對此,劉汪根卻認爲此事是“理所當然”:“對於公司很重要,對我們研發內部倒是沒什麼感覺,說實話,因爲那個基準測試天天在我們研發集羣裏面跑,然後某天發佈了一個報告,說我們測試通過了。”

實際上,在星環科技剛成立的年頭, TPC-DS 只是一把測量性能的“尺子”,被這羣硬核工程師於不知不覺間跑通了。後來公司參加 Strata + Hadoop World(現更名爲 Strata Data Conference)大會時,正巧 Cisco 的展位就在旁邊,於是雙方一拍即合,Cisco 提供 UCS 服務器,星環科技提供數據庫軟件,就這麼“隨隨便便”地通過了 TPC-DS 官方測試。

“只不過測試周期比較長。“劉汪根總結道。

TPC 官網展示的測試通過記錄

作爲市場人,劉麗君“吐槽”道:“他們(技術團隊)真的有點像一羣專注於技術的直男,所以這些成績在他們看來都是理所當然的事情。經常有許多領導或客戶到星環科技參觀,一般公司的員工會注意避開參觀區域,但我們公司的技術人就像完全不知道一樣。”

李光躍也開心地驗證了劉麗君的吐槽:“對我們沒有太大影響,一般公司羣裏會通知下,但也就象徵性地看看。”

右一爲李光躍,正在同團隊一起辦公

有一次,劉麗君以技術認證爲主題,寫了一篇關於 TDC (Transwarp Data Cloud,劉汪根主導研發的大數據雲平臺)的 PR 稿件,發送給劉汪根確認。因爲某處描述存在微小的不嚴謹問題,劉汪根 diss 了劉麗君一頓,並建議她改進工作方法。

在其他公司內,事情本該到此爲止。但隨後,劉汪根居然認真講起工作方法的重要性,並將一份關於“工作方法”的 PDF 發給了劉麗君,讓其哭笑不得。

這一切彷彿展示了一個有關於技術人的烏托邦 ,其質感如同這家公司及其衆多產品的名字:

公司名:星環科技 ——《三體》裏第一艘人造光速飛船;
產品 TDC、TDH:Transwarp —— 超曲速,曲速引擎的高階形式;
AI 平臺:Sophon —— 《三體》裏三體世界派到地球的智能粒子;
流計算平臺:Slipstream —— 《三體》和《星戰》中裏超快的曲速引擎;
數據庫開發 IDE :水滴 —— 《三體》裏外星人的探測器;
……

在這艘光速飛船裏,很少出現驚心動魄的故事,有的只是無數個“理所當然”。

假象的《三體》水滴 作者:zaoeyo@站酷

2020 年 5 月 15 日,如同過往的六個暮春一樣,這艘飛船“理所當然”地抵達了新的星系,迎來又一次新品發佈會,公佈新一年的產品戰略。其內部海報全部是太空背景,照片裏的講師全部穿着宇航服、戴着頭盔。

正如狄蘭·托馬斯在詩歌裏期望的一樣,他們咆哮着走入那個良夜,又蘊含着足以重啓 2020 年的無限希望。


TGO鯤鵬會,是極客邦科技旗下高端技術人聚集和交流的組織,旨在組建全球最具影響力的科技領導者社交網絡,線上線下相結合,爲會員提供專享服務。目前,TGO鯤鵬會已在北京、上海、杭州、廣州、深圳、成都、硅谷、臺灣、南京、廈門、武漢、蘇州十二個城市設立分會。現在全球擁有在冊會員 800+ 名,60% 爲 CTO、技術 VP、技術合夥人。

會員覆蓋了 BATJ 等互聯網巨頭公司技術領導者,同時,阿里巴巴王堅博士、同程藝龍技術委員會主任張海龍、蘇寧易購 IT 總部執行副總裁喬新亮已經受邀,成爲 TGO 鯤鵬會榮譽導師。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章