如何閱讀Java源碼

剛纔在論壇不經意間,看到有關源碼閱讀的帖子。回想自己前幾年,閱讀源碼那種興奮和成就感(1),不禁又有一種激動。
源碼閱讀,我覺得最核心有三點:技術基礎+強烈的求知慾+耐心。

說到技術基礎,我打個比方吧,如果你從來沒有學過Java,或是任何一門編程語言如C++,一開始去啃《Core Java》,你是很難從中吸收到營養的,特別是《深入Java虛擬機》這類書,別人覺得好,未必適合現在的你。
雖然Tomcat的源碼很漂亮,但我絕不建議你一開始就讀它。我文中會專門談到這個,暫時不展開。

強烈的求知慾,我認爲是閱讀源碼的最核心驅動力。我見到絕大多數程序員,對學習的態度,基本上就是這幾個層次(很偏激哦):
1、只關注項目本身,不懂就baidu一下。
2、除了做好項目,還會閱讀和項目有關的技術書籍,看wikipedia。
3、除了閱讀和項目相關的書外,還會閱讀IT行業的書,比如學Java時,還會去了解函數語言,如LISP。
4、找一些開源項目看看,大量試用第三方框架,還會寫寫demo。
5、閱讀基礎框架、J2EE規範、Debug服務器內核。

大多數程序都是第1種,到第5種不光需要濃厚的興趣,還需要勇氣:我能讀懂嗎?其實,你能夠讀懂的。

耐心,真的很重要。因爲你極少看到閱讀源碼的指導性文章或書籍,也沒有人要求或建議你讀。你讀的過程中經常會卡住,而一卡主可能就陷進了迷宮。這時,你需要做的,可能是暫時中斷一下,再從外圍看看它:如API結構、框架的設計圖。

我就說說如何讀Java源碼,以及我曾經的閱讀感悟。

Java源碼初接觸
如果你進行過一年左右的開發,喜歡用eclipse的debug功能。好了,你現在就有閱讀源碼的技術基礎。
我建議從JDK源碼開始讀起,這個直接和eclipse集成,不需要任何配置。

可以從JDK的工具包開始,也就是我們學的《數據結構和算法》Java版,如List接口和ArrayList、LinkedList實現,HashMap和TreeMap等。這些數據結構裏也涉及到排序等算法,一舉兩得。
面試時,考官總喜歡問ArrayList和Vector的區別,你花10分鐘讀讀源碼,估計一輩子都忘不了。

然後是core包,也就是String、StringBuffer等。
如果你有一定的Java IO基礎,那麼不妨讀讀FileReader等類。我建議大家看看《Java In A Nutshell》,裏面有整個Java IO的架構圖。Java IO類庫,如果不理解其各接口和繼承關係,則閱讀始終是一頭霧水。
Java IO 包,我認爲是對繼承和接口運用得最優雅的案例。如果你將來做架構師,你一定會經常和它打交道,如項目中部署和配置相關的核心類開發。www.58action.com

讀這些源碼時,只需要讀懂一些核心類即可,如和ArrayList類似的二三十個類,對於每一個類,也不一定要每個方法都讀懂。像String有些方法已經到虛擬機層了(native方法),如hashCode方法。

當然,如果有興趣,可以對照看看JRockit的源碼,同一套API,兩種實現,很有意思的。
如果你再想鑽的話,不妨看看針對虛擬機的那套代碼,如System ClassLoader的原理,它不在JDK包裏,JDK是基於它的。JDK的源碼Zip包只有10來M,它像是有50來M,Sun公司有下載的,不過很隱祕。我曾經爲自己找到、讀過它很興奮了一陣。

Java Web開發源碼
在閱讀Tomcat等源碼前,一定要有一定的積累。我的切實體會,也可以說是比較好的階梯是:
1、寫過一些Servlet和JSP代碼。注意,不是用什麼Struts,它是很難接觸到Servlet精髓的。用好Struts只是皮毛。
2、看過《Servlet和JSP核心編程》
3、看過Sun公司的Servlet規範
4、看過http協議的rfc,debug過http的數據包
如果有以上基礎,我也不建議你開始讀Tomcat源碼。www.5tuijian.com我建議你在閱讀Tomcat源碼前,讀過Struts源碼,Struts源碼比 WebWork要簡單得多。這個框架是可以100%讀懂的,至少WebWork我沒有100%讀懂。我曾經因爲讀懂了Struts源碼,自己寫過一個 Web框架。

當然,在讀Struts框架前,最好看過它的MailReader等demo,非常非常不錯的。
如果你做過一些Struts項目,那麼讀它時就更得心應手了。
在讀Struts前,建議看看mvnforum的源碼,它部分實現了Struts的功能,雖然這個BBS做得不敢恭維。

如果你讀過Struts,再開始考慮Tomcat源碼閱讀吧。
不過,我還是不建議直接讀它,先讀讀onJava網站上的系列文章《How Tomcat Works》吧,它纔是Tomcat的最最簡易版。它告訴你HttpServletRequest如何在容器內部實現的,Tomcat如何通過 Socket來接受外面的請求,你的Servlet代碼如何被Tomcat容器調用的(回調)。
學習JSP,一定要研讀容器將JSP編譯後的Servlet源碼。
爲什麼我總是稱呼Tomcat爲容器,而不是服務器?這個疑問留給大家吧。

如果你一定要讀Tomcat,那麼就讀Jetty吧。至少它是嵌入式,可以直接在eclispe裏面設置斷點debug。雖然Tomcat也有嵌入式版本。

Java數據庫源碼閱讀
我建議,先讀讀Sun的JDBC規範。
我想你一定寫過JDBC的代碼,那麼這時候可以開始閱讀源碼了。
如果瞭解JDBC規範(接口),那麼它的實現,JDBC Driver就一定要開始瞭解,我的建議是,讀讀mysql的jdbc驅動,因爲它開源、設計優雅。在讀mysql的JDBC驅動源碼時,建議看看 mysql的內幕,官方正好有本書,《Mysql Internals》,我五年前讀過一部分。比如你可以知道mysql的JDBC驅動,如何通過socket數據包(connect、query),給這 個C++開發的mysql服務器交互的。

通過上面的閱讀,你可以知道,你的業務代碼、JDBC規範、JDBC驅動、以及數據庫,它們是如何一起協作的。
如果你瞭解這些內幕,那麼你再學習Hibernate、iBatis等持久化框架時,就會得心應手的。

讀過JDBC驅動,那麼下一步一定要讀讀數據庫了。而正好有一個強大的數據庫是用Java開發的,Hsqldb。它是嵌入式數據庫,比如用在桌面客戶端軟件裏,如Mail Client。


Java通訊及客戶端軟件
我強烈推薦即時通訊軟件wildfire和Spark。你可以把wildfire理解成MSN服務器,Spark理解成MSN客戶端。它們是通過XMPP協議通訊的。
我曾經在一個項目中,定製過Spark,當然也包括服務端的一些改動。所以它們的源碼我都讀過。
我之所以推薦它們。是因爲:
1、XMPP夠輕量級,好理解
2、學習Socket通訊實現,特別是C/S架構設計
3、模塊化設計。它們都是基於module的,你既可以瞭解模塊化架構,還可以瞭解模塊化的技術支撐:Java虛擬機的ClassLoader的應用場景。
4、Event Driven架構。雖然GUI都是Event驅動的,但Spark的設計尤其優雅

這麼說吧,讀它們的源碼,你會爲做一名程序員而自豪,因爲無論是他們的架構設計還是代碼,都太漂亮了。

Java企業級應用
當然了,就是Hibernate、Spring這類框架。
在讀Spring源碼前,一定要先看看Rod Johnson寫的那邊《J2EE Design and Development》,它是Spring的設計思路。注意,不是中文版,中文版完全被糟蹋了。
在讀Hibernate源碼前,一定要讀讀Gavin King寫的那本《Hibernate in Action》,同時,應該再讀讀Martin Fowler寫的《企業應用架構模式》,它專門談到持久化框架的設計思路。當你覺得這兩本書讀透了,再去看它們源碼吧。
而且,在讀源碼前,你會發現它們用到很多第三方Jar包,二三十個,你最好把那些Jar包先一個個搞明白。

說到企業應用,一定會涉及到工作流。我當年讀過jBPM的源碼,網上有介紹jBPM內核的文章(銀狐)。我感覺它的內核也就兩千行,不要害怕。我曾經閱讀jBPM源碼的博客。
當然了,讀工作流源碼,前提是一定要對其理論模型有深入的瞭解,以及寫過一些demo、或做過一些項目。

我上面介紹的這些,是我自己讀過的,也適合一般人閱讀。
我也讀過一些非Java源碼,感覺不錯,也推薦給大家:
dojo源碼 它的架構設計得很優雅,仿Java的import和extends。但實際應用起來一塌糊塗。我們當年基於這個開發了自己的框架,不過我不是主力。

Flex源碼 Flex 08年底剛剛開源後,我就用它做過一箇中型項目,應該說是國內的技術先行者。當時市面沒有有深度的書,也沒有開源項目。我純粹是看Flex的Help文檔和源碼,把項目搞定的。兩三年過去了,現在覺得系統設計得蠻優雅的。

好了,先介紹到這裏。
上面說到的這些Java源碼,我都是4年前、甚至更早讀過的。技術變化這麼快,像互聯網的高速發展,催生很多高性能、分佈式數據庫,如hadoop。我一看,發現自己已經落伍了。

這幾年,想必已經出現了很多優秀的框架,大家不妨分享出來。


源地址:http://www.hulian.top/zixun/post/4771.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章