實現一個lockfree 的隊列

看梁總的題目,實現高速隊列,百思不得其解。

後來看了答案,算是比葫蘆畫瓢實現了一個。

其實最重要的兩點:

1。實現一個原子加加,用來得到一個唯一下標。

2.用一個永遠不會使用的值當標記,驗證該下標對應的位置是否有值。

代碼如下:

 

// 臨界鎖,線程安全
// 必須要有一個不會用的空值,
template <class T_Key>
class CQQueue_Lockfree
{
public:
	CQQueue_Lockfree()
	{
		m_lMaxQueueSize = -1;
		m_tpQueue = NULL;

		m_lBegPos = 0;
		m_lEndPos = 0;
	};

	~CQQueue_Lockfree()
	{
		if(m_tpQueue)
			delete m_tpQueue;
	};

	var_4 InitQueue(var_4 lMaxQueueSize, T_Key null)
	{
		m_lMaxQueueSize = lMaxQueueSize;
		m_tpQueue = new T_Key[m_lMaxQueueSize];
		if(m_tpQueue == NULL)
			return -1;
		m_lBegPos = 0;
		m_lEndPos = 0;
		m_null = null;

		for( var_4 i = 0; i < lMaxQueueSize; i++ )
		{
			m_tpQueue[i] = null;
		}
		
		return 0;
	};

	void ResetQueue()
	{
		m_lBegPos = 0;
		m_lEndPos = 0;	
	};

	void ClearQueue()
	{
		if(m_tpQueue)
		{
			delete m_tpQueue;
			m_tpQueue = NULL;
		}

		m_lMaxQueueSize = -1;
		m_lBegPos = 0;
		m_lEndPos = 0;
	};

	void PushData(T_Key tKey)
	{
		register var_u8 cnt =1;
		var_u8 pos = fetch_and_add(&m_lEndPos, cnt)%m_lMaxQueueSize;

		while( m_null != m_tpQueue[pos] )
			cp_sleep(1);

		m_tpQueue[pos] = tKey;
	};

	T_Key PopData()
	{
		register var_u8 cnt =1;
		var_u8 pos = fetch_and_add(&m_lBegPos, cnt)%m_lMaxQueueSize;

		T_Key*p = m_tpQueue+pos;
		while( m_null == *p )
			cp_sleep(1);

		T_Key ret = *p;
		*p = m_null;
		
		return ret;
	};
private:
	var_4 m_lMaxQueueSize;
	T_Key* m_tpQueue;
	T_Key m_null;

	var_u4 m_lBegPos;
	var_u4 m_lEndPos;
};

 

上面是我的代碼,梁總的實現更高效,

首先,他認爲隊列足夠長,並且取得足夠快,所以在push時,根本不檢查隊頭壓隊尾的情況。

在pop時,只檢查隊頭-隊尾的長度,小於一個閾值就不再取,由於只用於高速隊列,會一直有數據被push,所以不會發生閾值以內的數據被延時。

 

經過測試,這種方式比用鎖少了40%。

10億次放入和讀取,10線程花費200秒。

不過樑總測試說8核1.5GHz花了88秒,但在我24核

vendor_id       : GenuineIntel
cpu family      : 6
model           : 45
model name      : Intel(R) Xeon(R) CPU E5-2630 0 @ 2.30GHz
stepping        : 7
cpu MHz         : 2300.469
cache size      : 15360 KB

的機器上,也只跑了200秒,真是奇怪。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章