許式偉:畢業 2 年成爲首席架構師,我的技術學習方法論|極客時間

你好,我是許式偉。

今天想和大家聊聊架構,和架構以外的二三事。

在過去的工作經歷裏,我看到不少架構師都傾向於把架構看作一項純技術性的行爲。他們的工作流程是這樣的:產品經理根據用戶的需求做出產品設計,架構師再依據產品設計給出實現,也就是軟件的架構設計方案。

在我看來,這恐怕是個誤解。我們做架構,空有一身技術是遠遠不夠的,知識的深度和廣度,往往會對架構能力起着決定性的作用。這些知識,從你踏入 IT 行業那一刻起,甚至更早就應該開始儲備了。

關於如何學技術,怎樣儲備知識,我想聊聊我的個人經歷,希望給你一些別樣的啓發。

一、學技術不能過於專精,需要橫向理解,向廣度挖掘。

大學時,我接觸到《理論物理》這門課,發現拉普拉斯方程式可以解高中的所有物理問題,《現代數學》中的分形幾何也讓我頗爲着迷,不僅將圖書館裏所有關於分形和混沌的書都看了個遍,還專門寫了程序,將接觸過的分形模型都用計算機模擬了一遍。

這兩門課讓我看到了許多事物之間的內在聯繫,並開始思考和探究背後的原因。
 
這種思維方式對我後來的工作有很大影響,舉個例子,很多人認爲,存儲不就是把東西存到磁盤裏嗎,跟數學有什麼關係呢?但我發現往高深去做,存儲系統和數學有非常緊密的關聯。

通常的存儲服務要保證數據不丟,必須存多份,這樣會增加存儲成本,經典的 3 副本存儲,冗餘度是 3。想用更低的成本存儲,就要用到域代數。域代數遵循自然代數的加減乘除規律,但數據值控制在有限區域,不管怎麼算,結果都在 0 到 255 這個域裏面,所以稱作域代數。

存儲文件可以認爲是 0 到 255 的一個序列,舉個例子,一個 100K 的文件拆成 10 份,每份是 10K,存在 10 個地方,但文件仍然是一份。這時用域代數裏的加法(其實就是計算機中的異或操作),從這 10 份數據裏取出一份校驗數據,數據變成了 11 份,它的冗餘度是 1.1。

這是一種基於校驗碼的存儲方式,成本比較低,但效果和雙副本差不多,其中任何一個數據丟了,都能恢復回去。利用域代數降低成本,是存儲領域發展的必然方向,七牛的[存儲2.0][3]就已經採用了這種方式。

所以,任何一個方向的技術要做到頂峯,都必須橫向地去理解,因爲世界上一切事物都彼此關聯。學技術是不能過於專精的,在專精的過程中遇到瓶頸,就要往廣度方向去挖掘。

二、任何一件事情,想做到極致,就要當成學科去研究。

2000 年我加入金山,當時分配給我的任務是軟件的讀盤和存盤模塊。這個模塊當時的重要性並不高,看着也比較簡單,但我發現了不少有意思的挑戰,其中之一,是要求你理解軟件的所有功能,以及每個功能的數據表達方式。

這讓我無意中觸及到軟件系統最核心的東西——數據。順着這條線索,我研究了微軟 Office 各個功能模塊的數據存儲方式,並把一些有趣的實現方法分享給同事,他們吸收了其中有益的部分,並據此修改了原有的軟件設計。

一年後金山開始研發 WPS 2002,新版本被稱作“格式兼容之戰”,爲了實現對微軟 Office 文件格式的兼容,I/O 成了戰略層面的技術,存盤功能從邊緣模塊,一下變成了整個 WPS 研發的核心模塊。

於是,在 2002 年底,我作爲首席架構師,開始領導 WPS 的整體架構設計,用了 3 年的時間做出了 WPS Office 2005,完全重新架構開發,做三大兼容:文件格式兼容、二次開發接口兼容、用戶操作習慣兼容,產品定位:先立後破,做 Office 的替代品。

我們在軟件架構層面做出創新,引入一個數據層,抽象出所有數據的存儲過程,改變了此前只能通過對命令的反操作來實現的傳統“撤銷/重做”功能,讓所有數據可天然回滾,輕鬆支持多版本存盤、Undo/Redo(撤銷/重做),以及各種異步操作。
 
這個創新並不是對微軟的簡單模仿,其靈感來源於對增量存盤的思考。Office 有個“快速存盤”概念,用戶正在編輯的內容,如果已經存過了一次盤,修改過後再次存盤,只需在原基礎上補加數據。

相當於對同一個文件,存了兩個版本的數據。於是我想,既然可以做快速存盤,就不必關心用戶到底做了幾個操作,要實現撤銷和重做功能,只需要基於數據狀態做前進和回退即可。

數據層的架構大大降低了研發的複雜度,在當時的金山起到了非常重要的作用。乍看上去,我像是運氣很好,做的東西從邊緣模塊變成了核心模塊。但我相信之前很多人都接觸過存盤,但有多少人深入思考過其中的原理呢?

我始終認爲,任何一件事情,想要做到極致,就必須把它當成一個學科來研究,把它琢磨透。假設這個東西很好玩,你要去思考,如果把它做到極致,最終應該是什麼樣子。如果僅僅當成一個簡單的任務完成,能取得的成果會很有限

三、光有技術遠遠不夠,必須理解業務及其運作方式,思考產品和商業的關係。

2006 年是我職業發展的分界點,WPS 雖然累計了不少用戶,但並沒有取得商業上的成功。如果產品無法讓用戶買單,從某種意義上說,你的價值並沒有被認證

彼時,國內盜版軟件盛行,金山開始探索辦公軟件的互聯網化。辦公軟件不同於遊戲,遊戲能成功轉身,很重要的原因在於每個遊戲都有其生命週期,但辦公軟件是工具,必須沿襲用戶的習慣,互聯網化相對難很多。

如果僅僅把辦公軟件在 Web 上做一套,能夠爲用戶提供什麼新的價值呢?辦公互聯網化,最終必須顛覆原有形態,而不是做一個 Web 上的 WPS,但在當時,我們實在找不到更好的方式。

於是突然我意識到,光有技術遠遠不夠,必須理解業務及其運作方式,思考產品和商業的關係。爲了拓寬眼界,我一方面廣泛參加行業裏的會議、沙龍,找不同朋友聊產品方向;另一方面,我做了一個技術社區 ECUG,探討 Server 端相關技術演進。

這期間,我逐漸跳出辦公,橫向接觸其它領域。在研究搜索引擎時,我發現分佈式存儲的技術門檻相對較高,並且可以發展出獨立的商業模式。當時移動互聯網正處於萌芽期,雷軍已經開始投資這個領域的初創公司。

所以,我預想一旦手機開始流行,鍵盤就不會再是人與人交互的主要形式,圖片、語音、視頻等富媒體會成爲潮流,這將導致未來存儲的需求出現爆發式增長
 
雖然確定了新的方向,但如果想以此創業,我感覺自己還是太技術化了一點,欠缺的東西很多,於是我從零開始組建團隊,建立了金山實驗室,自由探索新產品,重點放在分佈式存儲研發,並承接了金山一些內部項目,好讓自己的存儲產品落地。

四、選擇和信息的對稱程度有關,當你對某個領域瞭解得足夠透徹,決策過程會非常自然。

在我剛剛成立七牛時,最初的產品方向是網盤,9 月中旬產品發佈,10 月我就決定轉向底層存儲,期間只花了一個月時間思考。這個決定做得很艱難,但從公司的核心競爭力考慮,必須做調整。

原因有 2 點:其一是當時國內雲計算環境還不夠好,七牛如果做網盤,很難找到一個第三方存儲供應商,同時做底層存儲和網盤應用,精力上會比較分散;其二,團隊的基因偏極客,對終端用戶瞭解不夠深入,而程序員是我們最熟悉的羣體,所以,權衡之下,我選擇了雲存儲這條路。

同時,七牛也是國內第一家選擇 Go 語言做服務端主體語言的公司,儘管當時 Go 的語法特性還未完全穩定,這個決定看上去有點激進和冒險,但實際上是經過我嚴格論證的,並非隨意爲之。

我一直認爲:選擇和信息的對稱程度有關。你越不瞭解一個東西,越會趨向選擇保守性的方案,而當你對某個領域瞭解得足夠透徹,你的決策過程會非常自然。

在做決策時,我的方法論是:

  • 先試圖瞭解整個背景,看別人一般會怎麼做
  • 有哪些新興的 idea,這些 idea 是否靠譜
  • 如果我來做,會傾向於往哪個方向走

當你深入研究了新技術的思考方式,以及它要解決的問題,就會知道它和自己要解決的問題有多大的相關性,這要求你具備嚴謹的思維方式。或許在很多人眼裏,嚴謹是古板的,會扼殺創新。

但在我看來,嚴謹不是創新的對立面,而是創新的基礎。奇思妙想再好,如果不經過嚴謹的推理過程,就無法變成行動力。用這樣的方式去分析,可能會出現一些比較大膽的選擇,但並不是隨意爲之。

做架構也是一樣,需要做嚴謹的設計推演。這就要求我們建立完整的架構知識體系,看書學習當然是一個非常好的方式。但我發現,當我想推薦一本經典的架構書時,並不能快速想到推薦哪本。細數我接觸過的那些與架構相關的圖書,大概有以下幾類:

  • 架構思維類。通常從一些著名的架構理論講起,比如開閉原則、單一職責原則等等。其弊端在於過度理論化,而計算機科學歸根到底屬於工程技術類,應該實踐第一。
  • 設計模式類。這類一般上來就進入架構的局部細節,每個模式的來龍去脈並不容易理解。就算理解了某個具體的模式,也很難真正做到活學活用。
  • 分佈式系統架構設計類。通常從服務端的通用問題如一致性、高可用、高併發挑戰等話題講起,闡述大型業務系統面臨的挑戰。這些知識雖然非常有價值,但無法延伸至通用業務架構,對大部分企業的架構實踐不具備真正的指導意義。
  • 重構類。主要講如何如何改進代碼,其實是最實用的一類。但在我看來,一個模塊最初的地基是最重要的,基本決定了這座大廈能夠撐多久,而重構更多側重於大廈建成之後,在服務於人的前提下怎麼去修修補補,延長生命。

這些架構類的圖書並沒有達到我個人的期望,在我看來,它們都沒有揭開架構設計的全貌。所以一直以來,我就心存這樣一個念頭:“寫一本不一樣的架構書”。這個念想,正是《許式偉的架構課》這個專欄的由來,它和你現在能看得到的大部分架構書都不太一樣。

在專欄中,我會通過理解軟件架構的宏觀視角,從零開始構建出整個信息世界,在這個過程中,闡述了架構思維範式,以及這些範式在日常工程實踐中應用。

在內容設計上,我希望這是一個門檻最低的架構設計專欄,不僅幫助到想成爲架構師的初學者,還可以讓已經成爲架構師的技術人規避一些錯誤的經驗。在行文上,我會盡量避免深奧的術語,以通俗易懂的文字描述信息世界構建者們的所思所想。

關於「我」

我是許式偉,七牛雲 CEO,ECUG 社區發起人,一個開源愛好者。曾就職於金山、盛大,在搜索和分佈式存儲相關技術領域有十幾年的研發經驗。

在金山,以首席架構師的身份主導了 WPS Office 2005 的架構設計和開發。在創立金山實驗室後,作爲技術總監主導分佈式存儲開發。後加入盛大創新院,推出了“盛大網盤”和“盛大雲”。2011 年,我成爲一名創業者,建立了七牛,專注企業級存儲服務。

在我目前的職業生涯中,前後大概做過十幾次的架構類的演講,但這些零星的演講,對於傳遞架構設計思維來說,遠遠不夠。

這個專欄,是我第一次完整、系統地分享自己的架構經驗和思考,我會將近 20 年的經驗毫無保留地分享給你,相信你一定能夠學有所得。

註釋:本文部分內容首發於由獨立媒體人 Gracia 創立和維護的技術人攻略訪談。

《許式偉的架構課》

專欄上線僅 1 周,已有超過 12,000 人加入學習。
限時 ¥992 天后恢復原價 ¥129戳此試讀或訂閱
20 年經驗沉澱,好評如潮,評價可以參考:

一頓飯錢,就能看到老許 20 年的經驗總結,獲得與頂尖架構師更近一步的機會,幾年後的你,會感謝自己今天的投資。

????戳此訂閱,跟着老許學架構。
更多專欄詳情,可以查看《七牛雲 CEO 許式偉:首次完整架構經驗分享》

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章