代碼質量隨想錄(三)名字好,誤會少

  寫完前兩篇之後,有點小倦怠,因爲一方面要整理讀書筆記,一方面還要結合自己的思路加以重新表述,頗費周張。不過前兩日看到有小朋友過來讚我的文章,說對實際代碼有所幫助,還是滿欣慰的,本系列隨想錄的目的之一,就是要營造一個努力改良代碼質量的思維環境。

  要想讓標識符的名稱更易理解,就應該多考慮考慮此名稱是否會被誤讀。

  先看兩個很容易誤讀的例子。

  1. Object[] results = Database.getAllObjects().filter("year <= 2011");

  到底是要選出year小於等於2011的那部分對象,還是選出year大於2011的那部分呢?filter到底是排除(exclude),還是遴選(select)呢?我自己在日常編碼中也愛用filter,多半由於習慣。現在自己思量,是得改正了。 再看

  1. public String clip(String text,int length); //裁掉文本的末尾  

  clip方法有歧義:到底是去掉文本後的length個字符,還是從頭開始截取最大length個字符呢?比如clip("Java",2);到底是"va"還是"Ja"?如果是前者應該叫removeLast,如果是後者則應叫truncate。而且length也有毛病,到底以什麼爲單位?字節?字符?還是詞語?如果是字符,應該是truncate(String text,int maxCharCount)。

  歸納起來說,以下幾種情形應格外注重選取避免誤解的名稱。

1.以常量表示包含端點的上限或下限時,應分別用MAX與MIN做前綴。

  例如CART_TOO_BIT_LIMIT=10到底是說購物車中最多放10件商品還是11件?抑或是9件?改爲MAX_ITEMS_IN_CART = 10則很清楚:最多10件。

2.在表達包含左右端點的區間時,應用first及last。

  1. public void printIntegerInRange(int start,int stop){...} 
  2. ... 
  3. printIntegerInRange(2,6);

  到底打印[2,3,4,5]還是[2,3,4,5,6]?如果是後者,應該是printIntegerInRange(int first,int last)。

3.在表達包含左端點而不含右端點的區間時,應當使用begin與end。

  英文中沒有哪個常用詞的字面意思能表示“區段內最後一個值的緊下一個值”這個意思,所以使用end只是約定成俗而已,並不精確。例如public void printEventsInRange(String begin,String end),可以使用如下參數來調用:printEventsInRange("OCT 16 00:00", "OCT 17 00:00"),這樣的話,一般人都能理解右端點("OCT 17 00:00")不含在範圍內。如果用public void printEventsInRange(String first,String last),則是printEventsInRange("OCT 16 00:00", "OCT 16 23:59")。

4.使用判斷詞來消除boolean變量的歧義。

  爲boolean變量起名時一定注意是否有歧義:

  1. bool readPassword = true;

  到底是當前需要讀取密碼,還是密碼已經被讀取過了?前者應是needPassword,後者應是userIsAuthenticated。

  使用is、has、can、should等詞彙來讓boolean變量與方法的意圖更加清晰,尤其是在那些不需要申明方法或函數返回類型的編程語言中。例如:spaceLeft()到底是返回剩下的空間大小,還是返回是否有剩餘空間?根據是簡單獲取還是複雜計算,前者應命名爲getLeftSpaceInPixel()或calcLeftSpacePx(),分別指示輕量級(get)和重量級(calculate或compute)的兩種獲取辦法;而後者則應是hasSpaceLeft(),只說有沒有剩餘空間,不談具體的量。

5.避免在boolean命名中使用否定形式。

  例如:

  1. bool disableSSL = false;

  不如下面這種命名方式清晰:

  1. bool useSSL = true;

6.不要同約定成俗的命名方式相違逆。

  例如getXXX()格式的方法一般有兩個隱含意義:1.該操作爲輕量級。2.該操作返回所在類的某個成員。

  如下統計算數平均數的方法名稱即爲不宜:

  1. public class SampleCollector { 
  2.   public void add(double sample) { ... } 
  3.  
  4.   public double getMean() { 
  5.     ... // 疊加所有采樣值並返回“總和/樣本數” 
  6.   } 
  7. ... 

  getMean()並非輕量級操作,且不返回本類某個成員。不如叫它computeMean()更好,compute會引人聯想該操作是不是稍爲複雜一些,耗時一些。如果非要用getMean做名稱的話,那麼mean應被納入緩存機制。例如:

  1. private boolean meanCached;//計算完樣本後置爲true,樣本改動時置爲false 
  2. ... 
  3.  
  4. public double getMean() { 
  5.   if(!meanCached){ 
  6.     ... // 疊加所有采樣值 
  7.     mean=sampleSum/sampleCount; 
  8.     meanCached=true
  9.   } 
  10.   return mean; 
  11. }

  1. void ShrinkList(list<Node>& list, int max_size) { 
  2.   while (list.size() > max_size) { 
  3.     FreeNode(list.back()); 
  4.     list.pop_back(); 
  5.   } 
  6. }

  size()操作的時間複雜度爲O(1)應是大多數人的共識,可是恰恰list的size()是時間複雜度爲O(n)的操作,這導致整個函數的複雜度變爲O(n2)。按理說size()應該叫爲countSize() 或countElements(),以體現其重量級運算的特質來,不過,爲了和其餘容器類相符合,還是叫成size了。所幸新版C++規範強制要求size操作的時間複雜度爲O(1)了(ARC書的作者這麼說的,我未查證。大家幫忙在C++11規範中查證此事。原有規範只是“建議”它應具有常數時間複雜度,並未強制)。

  小翔以爲,如果某個抽象接口定義了一個貌似輕量級的簡單操作,如Collection的size(),則子類對象在實現時應該儘量降低時間複雜度。實在不能時甚至可以考慮拋出異常或對客戶提出警告。根本的解決辦法還是學習C++規範那樣,給出一個建議的時間複雜度來。

7.在多個候選名稱中取捨時應該仔細質詢其可能帶來的歧義。

  例如有兩份相似的服務器配置參數文件:

  1. config_id: 100 
  2. description: "increase font size to 14pt" 
  3. traffic_fraction: 5% 
  4. ...

  1. config_id: 101 
  2. description: "increase font size to 13pt" 
  3. [其餘參數與前一份相同]

  我們現在想通過某個機制複用整套參數,例如這樣:

  1. config_id: 101 
  2. 想要複用的配置文件id: 100 
  3. [其餘參數與前一份相同]

  那麼,這個“想要複用的配置文件id”,應該怎麼起名呢?備選關鍵詞有:template、reuse、copy和inherit。

  template很模糊:“template: 100”到底是說自己是一份名叫“100”模板,還是說使用一個名叫“100”的模板作爲其基礎參數?況且模板這個概念太過抽象,給人感覺需要以具體內容填充它。

  “reuse: 100”到底是說這份參數最多可以使用100次,還是說複用名爲“100”的那份配置文件中的參數?

  “copy: 100”是第100份拷貝嗎?還是說拷貝自編號爲“100”的那套配置?後者不如叫copy_config_from更好。

  “inherit: 100”,inherit這個詞,大多數程序員很熟悉,且與日常生活的“財產繼承”概念可相比擬,所以引起的誤解相對較少。可以擴充爲inherit_config_from來更精確地闡明這個意思。

  綜上,copy_config_from或inherit_config_from應爲最終中選名稱。

  總之,好的標識符名稱可以儘量消除代碼閱讀者的誤解,提高代碼可讀性與可維護性,亦能促進業務交流。所以應當仔細考究,儘量選取免於誤會的名稱,尤其是遇到“filter、length和limit”這些模棱兩可的詞語時。此外,區間與上下限含不含端點、boolean類型的標識符會不會引起誤解、方法名稱所隱含的意義是否符合常識,這些問題也應該在起名時反覆考量。

  用了兩篇文章纔講完給標識符起名的事情,可見其的確關乎代碼質量的提升。下一篇我們談談代碼的排版問題。

愛飛翔 2012年6月4日

本文使用Creative Commons BY-NC-ND 3.0協議(創作共用 自由轉載-保持署名-非商業使用-禁止衍生)發佈。

本文網址:http://agilemobidev.com/eastarlee/code-quality/think_in_code_quality_3_good_name_zh_cn/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章