谷歌保持技術競爭力的祕訣:以全球規模工程爲先

本文內容,源自我在谷歌提供軟件工程師這六年當中的親身實踐,以及對谷歌內部廣泛工程運營活動的觀察。希望通過這篇文章,能夠對谷歌的全球規模工程實施做出一番宏觀概述。

從 2013 年 8 月到 2019 年 4 月的這六年時間,我有幸加入谷歌參與一系列項目。最近,我剛剛跳槽至洛杉磯當地的另一家初創企業,擔任創始工程師職務。

在谷歌任職期間,這位科技巨頭在構建並運營全球規模的軟件方面表現出的強勁實力,給我留下了極爲深刻的印象。

雖然無法透露太多細節,但相信有心的朋友都已經感受到,過去十年以來分佈式系統所迎來的發展與由此體現出的巨大優勢。Hadoop 本身已經發展爲價值 10 億美元的行業;實際上,谷歌內部的類似系統不僅設計水平更高,其家族中的兄弟姐妹也更爲興旺——正是這近百種系統的相互協同,支撐起谷歌龐大而繁榮的業務體系。

谷歌將全球工程視爲其核心業務價值之一。以雲遊戲平臺 Stadia 爲例,雖然多年之前就曾經有類似的小規模產品上線,但只有谷歌有能力將其拓展爲真正的全球化平臺、供來自世界各地的用戶隨意使用。

事實上,谷歌的幾乎每一款產品都是以全球規模作爲既定發展目標。谷歌一直努力爲世界上那些最具挑戰性的技術難題投入大量資金,其中最典型的例子當數 Waymo(目前爲 Alphebet 旗下的獨立公司)。很明顯,就在自動駕駛汽車還只處於研究階段時,谷歌就已經決意投入鉅額資金。與之對應,任何無法服務於全球客戶的項目都將被降級甚至直接裁撤。最近一個突出案例當數 Google+——谷歌一直在努力將這項社交網絡服務推向客戶,但在意識到其未能得到受衆的認可之後,Google+ 項目已經(面向非商業客戶)被關閉。

谷歌的全球視角工程能力體現在以幾個關鍵領域當中:

  • 人員管理:全球規模的工程必然需要一支全球規模的工程團隊。谷歌公司擁有超過 4 萬名世界一流的軟件工程師,以及同等數量、在日常運營中同樣不可或缺的非技術人員。他們在全球數十個國家 / 地區設有辦事機構,正是這種遍佈全球的業務體系使得谷歌能夠吸引到衆多頂尖人才。他們具備截然不同的個人與專業背景,也抱着不同的信念加入谷歌公司。一般來說,與谷歌體量相當的巨頭級企業往往會建立自己的全球辦事處,負責處理企業績效與營收等相對次要的工作。但谷歌的情況完全不同:以旗下 Borg 團隊爲例,除了谷歌的 maib 園區之外,Bog 還有多位重要成員在華沙負責開發與維護工作,SRE 團隊則身處蘇黎世。自 2003 年成立以來,Borg 下轄的各小組就保持着這種距離遙遠、但又密切合作的協同方式。
  • 技術:技術是一切的基礎,負責爲人們在協作、運營優化、商機創造以及創新實現等領域提供工具與保障。全球工程組織不可能依賴於第三方供應商。這方面技術成果非常難於構建,但一旦完成,又足以成爲企業佔據競爭優勢地位的核心要素。谷歌爲工程師們提供一套完整的開發者工具,幫助他們隨心所欲發揮才華與靈感。谷歌還在分佈式系統、AI/ML 以及安全性等方面實現了諸多突破,使自家軟件始終保持着高性能、高可靠性與高安全性。谷歌掌握着多款世界級重磅軟件產品,這些產品無論在規模上還是質量方面,都擁有着無可比擬的強勢地位。有統計數字表明,谷歌在構建及運行大型軟件系統方面擁有夢幻般的表現,展現出傲視同儕的高級技術擴展能力。更重要的是,谷歌不僅打造出了這樣的系統,還通過優異的市場表現借全球用戶受衆之手證明了其技術投資的合理性。
  • 運營:怎樣才能充分利用技術基礎設施?如何正確解決短期與長期工程中的目標與風險問題?爲此,谷歌開創了 SRE。與傳統運營團隊不同,SRE 每天需要將至少 50% 的工作時間投入到日常運營自動化軟件的編寫當中。這既能夠保證對卓越運營的持續投入,又能保證基礎設施與應用程序具備出色的質量水平。此外,數據驅動型決策也早已成爲每一位谷歌員工日常工作中的重要組成部分。
  • 業務發展:由這些因素相互整合而實現的能力,最終還是需要在具備實際業務價值的產品當中有所體現。由於作者對這方面議題並不熟悉,因此很遺憾無法做出詳細介紹。

縱觀整個基礎設施體系,谷歌在產品當中掌握着全面的技術棧儲備。從數據中心、跨洋光纖鏈路、定製化服務器、編程語言與開發者工具,到多種操作系統、基礎集羣服務、中間件、應用程序框架、大數據、AI/ML 框架與工具、乃至消費級硬件等,谷歌始終牢牢把持着全球第一梯隊的位置,甚至在多個領域做到了無可爭議的最高水平。

英文原文

Google’s global scale engineering

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章