PHP中的數據庫連接持久化 https://www.php.net/manual/zh/features.persistent-connections.php

數據庫的優化是我們做web開發的重中之重,甚至很多情況下其實我們是在面向數據庫編程。當然,用戶的一切操作、行爲都是以數據的形式保存下來的。在這其中,數據庫的連接創建過程有沒有什麼可以優化的內容呢?答案當然是有的,Java等語言中有連接池的設定,而PHP在普通開發中並沒有連接池這種東西,在牽涉到多線程的情況下往往纔會使用連接池的技術,所以PHP每次運行都會創建新的連接,那麼這種情況下,我們如何來優化數據連接呢?

什麼是數據庫連接持久化

我們先來看下數據庫連接持久化的定義。

持久的數據庫連接是指在腳本結束運行時不關閉的連接。當收到一個持久連接的請求時。PHP 將檢查是否已經存在一個(前面已經開啓的)相同的持久連接。如果存在,將直接使用這個連接;如果不存在,則建立一個新的連接。所謂“相同”的連接是指用相同的用戶名和密碼到相同主機的連接。

對 web 服務器的工作和分佈負載沒有完全理解的讀者可能會錯誤地理解持久連接的作用。特別的,持久連接不會在相同的連接上提供建立“用戶會話”的能力,也不提供有效建立事務的能力。實際上,從嚴格意義上來講,持久連接不會提供任何非持久連接無法提供的特殊功能。

這就是PHP中的連接持久化,不過它也指出了,持久連接不會提供任何非持久連接無法提供的特殊功能。這就很讓人疑惑了,不是說好了這個方案可以帶來性能的提升嗎?

連接持久化有什麼用?

沒錯,從上述定義中指出的特殊功能來看,持久化連接確實沒有帶來新的或者更高級的功能,但是它最大的用處正是提升了效率,也就是性能會帶來提升。

當Web Server創建到SQL服務器的連接耗費(Overhead)較高(如耗時較久,消耗臨時內存較多)時,持久連接將更加高效。

也就是說連接耗費高的時候,創建數據庫連接的成本開銷也會越大,時間當然也越長。使用持久化連接之後,使得每個子進程在其生命週期中只做一次連接操作,而非每次在處理一個頁面時都要向SQL 服務器提出連接請求。這也就是說,每個子進程將對服務器建立各自獨立的持久連接。

例如,如果有 20 個不同的子進程運行某腳本建立了持久的 SQL 服務器持久連接,那麼實際上向該 SQL 服務器建立了 20 個不同的持久連接,每個進程佔有一個。

效率對比

話不多說,我們直接通過代碼來對比。首先,我們定義好一個統計函數,用來返回當前的毫秒時間。另外,我們還要準備好數據的連接參數。

function getmicrotime()
{
    list($usec, $sec) = explode(" ", microtime());
    return ((float) $usec + (float) $sec);
}

$db = [
    'server' => 'localhost:3306',
    'user' => 'root',
    'password' => '',
    'database' => 'blog_test',
];

接下來,我們先使用普通的 mysqli 進行測試。

$startTime = getmicrotime();
for ($i = 0; $i < 1000; $i++) {
    $mysqli = new mysqli($db["server"], $db["user"], $db["password"], $db["database"]); //持久連接
    $mysqli->close();
}
echo bcsub(getmicrotime(), $startTime, 10), PHP_EOL;
// 6.5814000000

在 1000 次的循環創建數據庫的連接過程中,我們消耗了6秒多的時間。接下來我們使用持久化連接的方式進行這 1000 次的數據庫連接創建。只需要在 mysqli 的 $host 參數前加上一個 p: 即可。

$startTime = getmicrotime();
for ($i = 0; $i < 1000; $i++) {
    $mysqli = new mysqli('p:' . $db["server"], $db["user"], $db["password"], $db["database"]); //持久連接
    $mysqli->close();
}
echo bcsub(getmicrotime(), $startTime, 10), PHP_EOL;
// 0.0965000000

從 mysqli 的連接上來看,效率提升非常明顯。當然,PDO 方式的數據庫連接也提供了建立持久連接的屬性。

$startTime = getmicrotime();
for ($i = 0; $i < 1000; $i++) {
    $pdo = new PDO("mysql:dbname={$db['database']};host={$db['server']}", $db['user'], $db['password']);
}
echo bcsub(getmicrotime(), $startTime, 10), PHP_EOL;
// 6.6171000000

$startTime = getmicrotime();
for ($i = 0; $i < 1000; $i++) {
    $pdo = new PDO("mysql:dbname={$db['database']};host={$db['server']}", $db['user'], $db['password'], [PDO::ATTR_PERSISTENT => true]); //持久連接
}
echo bcsub(getmicrotime(), $startTime, 10), PHP_EOL;
// 0.0398000000

PDO 方式連接時,需要給一個 PDO::ATTR_PERSISTENT 參數並設置爲 true 。這樣就讓 PDO 建立的連接也成爲了持久化的連接。

注意

既然數據庫的持久化連接這麼強大,爲什麼不默認就是這種持久化的連接形式,而需要我們手動增加參數來實現呢?PHP 的開發者們當然還是有顧慮的。

如果持久連接的子進程數目超過了設定的數據庫連接數限制,系統將會產生一些問題。如果數據庫的同時連接數限制爲 16,而在繁忙會話的情況下,有 17 個線程試圖連接,那麼有一個線程將無法連接。如果這個時候,在腳本中出現了使得連接無法關閉的錯誤(例如無限循環),則該數據庫的 16 個連接將迅速地受到影響。

同時,表鎖和事務也有需要注意的地方。

在持久連接中使用數據表鎖時,如果腳本不管什麼原因無法釋放該數據表鎖,其隨後使用相同連接的腳本將會被持久的阻塞,使得需要重新啓動 httpd 服務或者數據庫服務

在使用事務處理時,如果腳本在事務阻塞產生前結束,則該阻塞也會影響到使用相同連接的下一個腳本

所以,在使用表鎖及事務的情況下,最好還是不要使用持久化的數據庫連接。不過好在持久連接和普通連接是可以在任何時候互換的,我們定義兩種連接形式,在不同的情況下使用不同的連接即可解決類似的問題。

總結

事物總有兩面性,持久連接一方面帶來了效率的提升,但另一方面也可能帶來一些業務邏輯上的問題,而且這種問題如果在不瞭解持久連接的機制的情況下會非常難排查。因此,在日常開發中我們一定要在瞭解相關功能特性的情況下再選擇適合的方式來完成所需要的功能開發。

測試代碼:

https://github.com/zhangyue0503/dev-blog/blob/master/php/202004/source/PHP%E4%B8%AD%E7%9A%84%E6%95%B0%E6%8D%AE%E5%BA%93%E8%BF%9E%E6%8E%A5%E6%8C%81%E4%B9%85%E5%8C%96.php

參考文檔:

https://www.php.net/manual/zh/features.persistent-connections.php

各自媒體平臺均可搜索【硬核項目經理】

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章