看梁總的題目,實現高速隊列,百思不得其解。
後來看了答案,算是比葫蘆畫瓢實現了一個。
其實最重要的兩點:
1。實現一個原子加加,用來得到一個唯一下標。
2.用一個永遠不會使用的值當標記,驗證該下標對應的位置是否有值。
代碼如下:
// 臨界鎖,線程安全
// 必須要有一個不會用的空值,
template <class T_Key>
class CQQueue_Lockfree
{
public:
CQQueue_Lockfree()
{
m_lMaxQueueSize = -1;
m_tpQueue = NULL;
m_lBegPos = 0;
m_lEndPos = 0;
};
~CQQueue_Lockfree()
{
if(m_tpQueue)
delete m_tpQueue;
};
var_4 InitQueue(var_4 lMaxQueueSize, T_Key null)
{
m_lMaxQueueSize = lMaxQueueSize;
m_tpQueue = new T_Key[m_lMaxQueueSize];
if(m_tpQueue == NULL)
return -1;
m_lBegPos = 0;
m_lEndPos = 0;
m_null = null;
for( var_4 i = 0; i < lMaxQueueSize; i++ )
{
m_tpQueue[i] = null;
}
return 0;
};
void ResetQueue()
{
m_lBegPos = 0;
m_lEndPos = 0;
};
void ClearQueue()
{
if(m_tpQueue)
{
delete m_tpQueue;
m_tpQueue = NULL;
}
m_lMaxQueueSize = -1;
m_lBegPos = 0;
m_lEndPos = 0;
};
void PushData(T_Key tKey)
{
register var_u8 cnt =1;
var_u8 pos = fetch_and_add(&m_lEndPos, cnt)%m_lMaxQueueSize;
while( m_null != m_tpQueue[pos] )
cp_sleep(1);
m_tpQueue[pos] = tKey;
};
T_Key PopData()
{
register var_u8 cnt =1;
var_u8 pos = fetch_and_add(&m_lBegPos, cnt)%m_lMaxQueueSize;
T_Key*p = m_tpQueue+pos;
while( m_null == *p )
cp_sleep(1);
T_Key ret = *p;
*p = m_null;
return ret;
};
private:
var_4 m_lMaxQueueSize;
T_Key* m_tpQueue;
T_Key m_null;
var_u4 m_lBegPos;
var_u4 m_lEndPos;
};
上面是我的代碼,梁總的實現更高效,
首先,他認爲隊列足夠長,並且取得足夠快,所以在push時,根本不檢查隊頭壓隊尾的情況。
在pop時,只檢查隊頭-隊尾的長度,小於一個閾值就不再取,由於只用於高速隊列,會一直有數據被push,所以不會發生閾值以內的數據被延時。
經過測試,這種方式比用鎖少了40%。
10億次放入和讀取,10線程花費200秒。
不過樑總測試說8核1.5GHz花了88秒,但在我24核
vendor_id : GenuineIntel
cpu family : 6
model : 45
model name : Intel(R) Xeon(R) CPU E5-2630 0 @ 2.30GHz
stepping : 7
cpu MHz : 2300.469
cache size : 15360 KB
的機器上,也只跑了200秒,真是奇怪。