記憶能顯著的提升大計算量代碼的效率. 而且是一種可重用的方案.
本文闡述了在Java中使用這一模式的方法,並提供了一個可以提供上述功能的"記憶類":
Foo foo = (Foo) Memoizer.memoize(new FooImpl());
這裏,Foo是一個接口,它含有的方法是需要記憶的.FooImpl是Foo的一個實現.foo是Foo的一個引用.方法與FooImpl基本相同,區別在於Foo返回的值,會被緩存起來.單個記憶類的優點在於爲任何類添加記憶功能是很簡單的:定義一個包含需要記憶的方法的接口,然後調用memoize來實現一個實例.
爲了理解記憶類是怎麼實現的,我們將分幾步來解釋.首先,我解釋一下爲何緩存能夠在需要它的類中實現.然後,我測試一下如何爲一個特定的類添加緩存包裝器.最後,我解釋一下如何才能使得一個緩存包裝器能夠通用於任意的類.
爲大計算量的程序添加緩存
作爲一個大計算量程序的例子,我們考慮PiBinaryDigitsCalculator這個例子-計算二進制數據pi.僅有的public方法calculateBinaryDigit帶有一個參數:整數n,代表需要精確到的位數.例如,1000000,將會返回小數點後的一百萬位,通過byte值返回-每位爲0或者1.(算法可以參考: http://www.cecm.sfu.ca/~pborwein/PAPERS/P123.pdf)
public class PiBinaryDigitsCalculator { /** * Returns the coefficient of 2^n in the binary * expansion of pi. * @param n the binary digit of pi to calculate. * @throws ValidityCheckFailedException if the validity * check fails, this means the implementation is buggy * or n is too large for sufficient precision to be * retained. */ public byte calculateBinaryDigit(final int n) { return runBBPAlgorithm(n); } private byte runBBPAlgorithm(final int n) { // Lengthy routine goes here ... } } |
最簡單直接的方法來緩存返回值可以通過修改這個類來實現:添加一個Map來保存之前計算得到的值,如下:
import java.util.HashMap; public class PiBinaryDigitsCalculator { private HashMap cache = new HashMap(); public synchronized byte calculateBinaryDigit( final int n) { final Integer N = new Integer(n); Byte B = (Byte) cache.get(N); if (B == null) { byte b = runBBPAlgorithm(n); cache.put(N, new Byte(b)); return b; } else { return B.bytevalue(); } } private byte runBBPAlgorithm(final int n) { // Lengthy routine goes here ... } } |
calculateBinaryDigit方法首先會檢查HashMap裏面是否緩存了這個關鍵字-參數n,如果找到了,就直接返回這個值.否則,就會進行這個冗長的計算,並將結果保存到緩存裏面.在添加進HashMap的時候,在原始類型和對象之間還要進行小小的轉換.
儘管這個方法是可行的,但是有幾個缺點.首先,進行緩存的代碼和正常的算法代碼不是顯著分開的.一個類,不僅負責進行計算,也要負責進行維護緩存數據.這樣,要進行一些測試就會顯得很困難.比如,不能寫一個測試程序來測試這個算法持續地返回相同的值,因爲,從第二次開始,結果都是直接從cache中獲得了.
其次,當緩存代碼不再需要,移除它會變得困難,因爲它和算法塊地代碼是緊密結合在一起的.所以,要想知道緩存是否帶來了很高的效率提升也是很困難的,因爲不能寫一個測試程序是和緩存數據分開的.當你改進了你的算法,緩存有可能失效-但是這個時候你並不知道.
第三,緩存代碼不能被重用.儘管代碼遵從了一個普通的模式,但是都是在一個類- PiBinaryDigitsCalculator裏面.
前面兩個問題都可以通過構造一個緩存包裝器來解決.
緩存包裝器
通過使用Decorator模式,要分開計算代碼和緩存代碼是很容易的.首先,定義一個接口,裏面定義基本的方法.
public interface BinaryDigitsCalculator { public byte calculateBinaryDigit(final int n); } |
然後定義兩個實現,分別負責兩個任務:
public class PiBinaryDigitsCalculator implements BinaryDigitsCalculator { public byte calculateBinaryDigit(final int n) { return runBBPAlgorithm(n); } private byte runBBPAlgorithm(final int n) { // Lengthy routine goes here ... } } import java.util.HashMap; public class CachingBinaryDigitsCalculator implements BinaryDigitsCalculator { private BinaryDigitsCalculator binaryDigitsCalculator; private HashMap cache = new HashMap(); public CachingBinaryDigitsCalculator( BinaryDigitsCalculator calculator) { this.binaryDigitsCalculator = calculator; } public synchronized byte calculateBinaryDigit(int n) { final Integer N = new Integer(n); Byte B = (Byte) cache.get(N); if (B == null) { byte b = binaryDigitsCalculator.calculateBinaryDigit(n); cache.put(N, new Byte(b)); return b; } else { return B.bytevalue(); } } } |
這是很之前的實現PiBinaryDigitsCalculator的一種簡單的refactored版本. CachingBinaryDigitsCalculator包裝了BinaryDigitsCalculator句柄,並增加了緩存,供calculateBinaryDigit的方法調用. 這種方法提高了代碼的可讀性與可維護性. 用戶不能直接使用BinaryDigitsCalculator接口來實現算法,所以,如果需要關閉緩存塊,將是很容易實現的.
還有,合適的測試程序很容易寫出來.比如,我們寫一個假的BinaryDigitsCalculator實現,每次calculateBinaryDigit被調用,賦予相同的參數,返回不同的值. 這樣,我們就能測試緩存是否工作了,因爲如果每次都返回相同的值,則證明緩存是正常工作了. 這種測試在之前那種簡單的實現是不可能的.
關於翻譯作者
chris,熱衷於java遊戲引擎技術,jvm技術,活躍於jxta社區.可以點擊: http://www.matrix.org.cn/user_view.asp?username=chris查看他的個人信息 |
ezerg 編程小語