巧用CPU緩存優化代碼: 數組VS鏈表

原創

2020-02-26 02:53

一個常見的編程問題： 遍歷同樣大小的數組和鏈表，哪個比較快？ 如果按照大學教科書上的算法分析方法，你會得出結論，這2者一樣快，因爲時間複雜度都是 O(n)。但是在實踐中，這2者卻有極大的差異。通過下面的分析你會發現，其實數組比鏈表要快很多。

首先介紹一個概念：memory hierarchy （存儲層次結構），電腦中存在多種不同的存儲器，如下表

CPU寄存器 – immediate access (0-1個CPU時鐘週期)
CPU L1緩存 – fast access (3個CPU時鐘週期)
CPU L2 緩存 – slightly slower access (10個CPU時鐘週期)
內存(RAM) – slow access (100個CPU時鐘週期)
硬盤(file system)– very slow (10,000,000個CPU時鐘週期)

（數據來自 http://www.answers.com/topic/locality-of-reference）

各級別的存儲器速度差異非常大，CPU寄存器速度是內存速度的100倍！這就是爲什麼CPU產商發明了CPU緩存。而這個CPU緩存，就是數組和鏈表的區別的關鍵所在。

CPU緩存會把一片連續的內存空間讀入，因爲數組結構是連續的內存地址，所以數組全部或者部分元素被連續存在CPU緩存裏面，平均讀取每個元素的時間只要3個CPU時鐘週期。而鏈表的節點是分散在堆空間裏面的，這時候CPU緩存幫不上忙，只能是去讀取內存，平均讀取時間需要100個CPU時鐘週期。這樣算下來，數組訪問的速度比鏈表快33倍！ （這裏只是介紹概念，具體的數字因CPU而異）

因此，程序中儘量使用連續的數據結構，這樣可以充分發揮CPU緩存的威力。這種對緩存友好的算法稱爲 Cache-oblivious algorithm，有興趣可以參考相關資料

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

巧用CPU緩存優化代碼: 數組VS鏈表

Kafka存儲機制

【轉】[C#] WebAPI 防止併發調用二（冥等性）

HTTP URL 詳解

Ext開發代碼片段蒐集

ExtJSweb應用程序開發指南的一個例子分享-ComboBox的擴展

巧用CPU緩存優化代碼: 數組VS鏈表

Hibernate的緩存機制介紹

TreePanel的各項屬性

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結