【您還有心跳嗎？超時機制分析】

問題描述

在C/S模式中，有時我們會長時間保持一個連接，以避免頻繁地建立連接，但同時，一般會有一個超時時間，在這個時間內沒發起任何請求的連接會被斷開，以減少負載，節約資源。並且該機制一般都是在服務端實現，因爲client強制關閉或意外斷開連接，server端在此刻是感知不到的，如果放到client端實現，在上述情況下，該超時機制就失效了。本來這問題很普通，不太值得一提，但最近在項目中看到了該機制的一種糟糕的實現，故在此深入分析一下。

問題分析及解決方案

服務端一般會保持很多個連接，所以，一般是創建一個定時器，定時檢查所有連接中哪些連接超時了。此外我們要做的是，當收到客戶端發來的數據時，怎麼去刷新該連接的超時信息？

最近看到一種實現方式是這樣做的:

public class Connection {
private long lastTime;
public void refresh() {
lastTime = System.currentTimeMillis();
}
public long getLastTime() {
return lastTime;
}
//......
}

複製代碼

在每次收到客戶端發來的數據時，調用refresh方法。

然後在定時器裏，用當前時間跟每個連接的getLastTime()作比較，來判定超時:

public class TimeoutTask extends TimerTask{
public void run() {
long now = System.currentTimeMillis();
for(Connection c: connections){
if(now - c.getLastTime()> TIMEOUT_THRESHOLD)
;//timeout, do something
}
}
}

複製代碼

看到這，可能不少讀者已經看出問題來了，那就是內存可見性問題，調用refresh方法的線程跟執行定時器的線程肯定不是一個線程，那run方法中讀到的lastTime就可能是舊值，即可能將活躍的連接判定超時，然後被幹掉。

有讀者此時可能想到了這樣一個方法，將lastTime加個volatile修飾，是的，這樣確實解決了問題，不過，作爲服務端，很多時候對性能是有要求的，下面來看下在我電腦上測出的一組數據，測試代碼如下，供參考

public class PerformanceTest {
private static long i;
private volatile static long vt;
private static final int TEST_SIZE = 10000000;
public static void main(String[] args) {
long time = System.nanoTime();
for (int n = 0; n < TEST_SIZE; n++)
vt = System.currentTimeMillis();
System.out.println(-time + (time = System.nanoTime()));
for (int n = 0; n < TEST_SIZE; n++)
i = System.currentTimeMillis();
System.out.println(-time + (time = System.nanoTime()));
for (int n = 0; n < TEST_SIZE; n++)
synchronized (PerformanceTest.class) {
}
System.out.println(-time + (time = System.nanoTime()));
for (int n = 0; n < TEST_SIZE; n++)
vt++;
System.out.println(-time + (time = System.nanoTime()));
for (int n = 0; n < TEST_SIZE; n++)
vt = i;
System.out.println(-time + (time = System.nanoTime()));
for (int n = 0; n < TEST_SIZE; n++)
i = vt;
System.out.println(-time + (time = System.nanoTime()));
for (int n = 0; n < TEST_SIZE; n++)
i++;
System.out.println(-time + (time = System.nanoTime()));
for (int n = 0; n < TEST_SIZE; n++)
i = n;
System.out.println(-time + (time = System.nanoTime()));
}
}

複製代碼

測試一千萬次，結果是（耗時單位：納秒，包含循環本身的時間）：
238932949    volatile寫+取系統時間
144317590    普通寫+取系統時間
135596135    空的同步塊（synchronized）
80042382       volatile變量自增
15875140       volatile寫
6548994       volatile讀
2722555       普通自增
2949571       普通讀寫

從上面的數據看來，volatile寫+取系統時間的耗時是很高的，取系統時間的耗時也比較高，跟一次無競爭的同步差不多了，接下來分析下如何優化該超時時機。

首先：同步問題是肯定得考慮的，因爲有跨線程的數據操作；另外，取系統時間的操作比較耗時，能否不在每次刷新時都取時間？因爲刷新調用在高負載的情況下很頻繁。如果不在刷新時取時間，那又該怎麼去判定超時？

我想到的辦法是，在refresh方法裏，僅設置一個volatile的boolean變量reset（這應該是成本最小的了吧，因爲要處理同步問題，要麼同步塊，要麼volatile，而volatile讀在此處是沒什麼意義的），對時間的掌控交給定時器來做，併爲每個連接維護一個計數器，每次加一，如果reset被設置爲true了，則計數器歸零，並將reset設爲false（因爲計數器只由定時器維護，所以不需要做同步處理，從上面的測試數據來看，普通變量的操作，時間成本是很低的），如果計數器超過某個值，則判定超時。下面給出具體的代碼：

public class Connection {
int count = 0;
volatile boolean reset = false;
public void refresh() {
if (reset == false)
reset = true;
}
}
public class TimeoutTask extends TimerTask {
public void run() {
for (Connection c : connections) {
if (c.reset) {
c.reset = false;
c.count = 0;
} else if (++c.count >= TIMEOUT_COUNT)
;// timeout, do something
}
}
}

複製代碼

代碼中的TIMEOUT_COUNT 等於超時時間除以定時器的週期，週期大小既影響定時器的執行頻率，也會影響實際超時時間的波動範圍（這個波動，第一個方案也存在，也不太可能避免，並且也不需要多麼精確）。

代碼很簡潔，下面來分析一下。

reset加上了volatile，所以保證了多線程操作的可見性，雖然有兩個線程都對變量有寫操作，但無論這兩個線程怎麼穿插執行，都不會影響其邏輯含義。

再說下refresh方法，爲什麼我在賦值語句上多加了個條件？這不是多了一次volatile讀操作嗎？我是這麼考慮的，高負載下，refresh會被頻繁調用，意味着reset長時間爲true，那麼加上條件後，就不會執行寫操作了，只有一次讀操作，從上面的測試數據來看，volatile變量的讀操作的性能是顯著優於寫操作的。只不過在reset爲false的時候，多了一次讀操作，但此情況在定時器的一個週期內最多隻會發一次，而且對高負載情況下的優化顯然更有意義，所以我認爲加上條件還是值得的。

最後提及一下，我有點完美主義，自認爲上面的方案在我當前掌握的知識下，已經很漂亮了，如果你發現還有可優化的地方，或更好的方案，希望能分享。
————————————-
補充一下：一般情況下，也可用特定的心跳包來刷新，而不是每次收到消息都刷新，這樣一來，刷新頻率就很低了，也就沒必要太在乎性能開銷。

原創文章，轉載請註明：轉載自併發編程網 – ifeve.com

【您還有心跳嗎？超時機制分析】

[軟件工具百科] 互聯網資源歷史快照歸檔站點與數字圖書館

網易面試：SpringBoot如何開啓虛擬線程？

杭州的 IT 崩盤了麼？

程序員常見的文本查看工具

VS2022 解決方案打不開 .NET Framework 4.0 、 4.5 等老項目

Vue3 運行可以，build 打包發佈報錯，app.config.globalProperties 用法坑

既然測試也要求寫代碼，那乾脆讓開發兼任測試不就好了嗎？

ITSM落地經驗之建設藍圖規劃

PDF 補丁丁 1.0.2 版更新

奇怪！應用的日誌呢？？

【十分鐘搞清字符集和字符編碼】

【對學Oracle數據庫初學者的開場篇】

【譯】編寫高性能JavaScript

【HTML 5的革新：結構之美】

【面試】Spring問答Top 25

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

【您還有心跳嗎？超時機制分析 】

【您還有心跳嗎？超時機制分析】