Cache Blocking

原創

2020-06-20 23:28

背景

提高緩存命中率的一個重要技巧是Blocking，數據塊將逐塊計算，使得存儲器訪問是一個具有高內存局部性的小鄰域。

通過在緩存中使用/重用這些數據，我們減少了進入內存的需求（減少內存帶寬壓力）。

Blocking避免了應用程序中的內存帶寬瓶頸，可以在1-D，2-D或3-D空間數據結構上執行Blocking。

在代碼的角度，Blocking通常會涉及到循環拆分和交換。

實現

1-D Blocking

原始代碼

for (body1 = 0; body1 < NBODIES; body1 ++) {
   for (body2=0; body2 < NBODIES; body2++) {
     OUT[body1] += compute(body1, body2);
   }
}

假設NBODIES很大，body2就不會在緩存中重用，受到內存帶寬的限制。

修改代碼

for (body2 = 0; body2 < NBODIES; body2 += BLOCK) {
   for (body1=0; body1 < NBODIES; body1 ++) {
      for (body22=0; body22 < BLOCK; body22 ++) {
         OUT[body1] += compute(body1, body2 + body22);
      }
   }
}

在這個修改過的代碼中，數據（body22）被保留並在緩存中得到重用，從而產生更好的性能。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Indexing with Glimpse

Glimpse, a simple but effective indexing package, can help you find partic

2020-07-07 04:44:16

2.2處理機的調度

1.調度處理機調度是對處理機進行分配；從進程就緒隊列中按照一定的調度算法對進程進行處理機分配，以實現併發執行；處理機調度是多到程序操作系統的基礎，是操作系統設計的核心問題；調度的層次 1)作業調度，高級調度，內存與輔

坚持学习的你

2020-07-03 17:49:18

2.3進程的同步概念和經典同步互斥問題

1.進程同步的概念在多道程序程序環境下，進程併發執行時，不同進程之間存在不同相互制約的關係；引入進程同步，協調了進程之間的相互制約關係； 1）臨界資源一次只允許一個進程使用的資源，即臨界資源，例：共享變量、共享數據結構、

坚持学习的你

2020-07-03 17:49:18

2.1進程和線程的概念

1進程與線程 1.1.1進程的概念爲社麼引入進程？引入進程的概念，更好地描述和控制程序的併發執行，實現了操作系統的併發性和共享性；引入進程實體，進程的定義：進程是進程實體的運行過程，是系統進行資源分配和調度的一個獨立單

坚持学习的你

2020-07-03 17:49:18

Operating System 作業-02

文章目錄4.3、在統一進程的多線程之間，下列哪些程序狀態部分會被共享?4.5、第三章討論了Google的chrome瀏覽器,以及在單獨進程中打開每個新網站的做法。如果chrome設計成在單獨線程中打開每個新網頁，那麼會有什麼樣的好

2020-07-03 02:46:33

MIT JOS # RoundRobin Scheduling#

MIT JOS # RoundRobin Scheduling# 　下面是MIT JOS裏 round-robin調度策略的實現．在 kern/sched.c裏面下面的截圖來自<<Modern Operating system

2020-06-28 10:12:31

The File System in JOS

The File System in JOS 單獨開一貼扯一扯JOS裏的文件系統也是方便以後更新或引用．集中火力看幾個和文件系統有關係的頭文件． inc/fs.h fs/fsformat.h fs/fs.h fs/ser

2020-06-28 10:12:31

鳥叔的linux私房菜：第0章計算機概論學習筆記（Learning Notes for Basic Computer Theory）

本博客是針對《鳥叔的Linux私房菜基礎學習篇第四版》的第0章計算機概論的學習筆記。 1 電腦輔助人腦的好工具 11 計算機硬件的五大單元 12 一切設計的起點CPU的架構其它單元的設備運行流程電腦按用途分類電腦

2020-06-28 00:43:34

Configure the network of CentOS

CentOS系統安裝完成後，通常需要手工配置網卡信息才能上網需要做如下配置： 1：修改網卡eth0的配置信息 vi /etc/sysconfig/network-scripts/ifcfg-eth0 修改 NBOOT="no

2020-06-21 20:43:34

Gnome桌面安裝 - centos

全新以最小化包安裝了64位的CentOS 6.5系統，作爲本地的Web服務器使用，現記錄全過程第三步，安裝Gnome桌面爲什麼要安裝Gnome桌面，是因爲我想在系統裏部署虛擬機vmware，安裝N個win-xp系統在字

2020-06-21 20:04:10

理解解釋器中的JIT機制

原始代碼 long add4(long num) { return num + 4; } JIT代碼 0x48, 0x89, 0xf8, // mov %rdi, %rax 0x48, 0

2020-06-20 21:24:36

OS161 源代碼閱讀-1

/kern/arch/mips/mips/start.s 系統開始引導於此。22-25 爲了gdb的方便，留了20字節作爲stack frame27-57 由註釋得知，系統初始時，將一個引導字串放到a0中，並且將內核加載到0x

2020-06-13 01:54:38

C++/C程序內存佈局及函數棧結構

一：系統的程序佈局圖：二、詳解：程序空間：包括.txt代碼段，.data數據段, .bss段，堆段，棧段。程序的地址從低往高。堆空間增長方向從低地址往高地址增長。棧空間從高地址往低地址方向增長。從左往右方向爲

2020-06-07 14:18:01

Linux 簡述與基礎命令

目錄Linux1. Linux 簡介2. VMware 虛擬機a. 安裝虛擬機b. 備份與還原c. 基礎操作3. SecureCRT 遠程鏈接工具a. 基礎操作b. pwd 查詢所在路徑4. Linux 目錄結構5. 文件夾（目錄

2020-06-07 09:56:51

Linux 軟件安裝與項目部署

目錄I. 軟件安裝1. 常見的安裝方式a. 二進制發佈包b. RPM 安裝包c. YUM 在線安裝d. 源碼包e. Docker2. 上傳與下載工具3. JDK 安裝4. Tomcat 安裝5. Nginx 安裝6. MySQL

2020-06-07 09:56:51

24小時熱門文章

最新文章

最新評論文章