GPGPU-Sim学习(代码解读)-如何实现Bypass L1D cache

来填坑了

最近几年,国际上很多研究者开始关注GPGPU缓存调度的研究,其中bypass L1D cache便是其中的一个关注点,比如GPU上的CBWT(A类)算法,Doupled L1D(B类)算法和MRPB(A类),CPU上的PDP(A类)等。这篇博客的内容为如何在GPGPU-Sim上实现bypass L1D cache的缓存请求。

GPGPU-Sim版本:v3.2.2
关注文件:shader.cc
在shader.cc文件中,有两处关于bypass,分别是

  1. 1375行的bool ldst_unit::memory_cycle()函数
  2. 1795行的void ldst_unit::cycle()函数

在memory_cycle()函数内,即1388行之后bool bypassL1D = false;添加我们想要的代码,修改bypassL1D的值,即可实现bypass L1D cache缓存请求。

回答评论里的问题:
1、请问1388行之后用来判断是否bypass的程式码是什么意思阿~
答:举个例子,我想让ID=0核心的所有缓存指令全都bypass,那么实现代码如下:

bool bypassL1D = false; 
if(m_core->get_sid() == 0)
    inst.cache_op = CACHE_GLOBAL; 

2、另外请问memory_cycle()以及cycle()的差别
答:memory_cycle()为执行阶段的bypass,cycle()为写回阶段的bypass。
这就解释了bypass为何要inst.cache_op = CACHE_GLOBAL; 这样实现。下面的实现是错误的,

bool bypassL1D = false; 
if(m_core->get_sid() == 0)
    bypassL1D = true;

因为这样只能保证执行阶段将该指令bypass了,但在写回时仍将数据写回到了缓存中,会造成冲突。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章