GPGPU-Sim学习（代码解读）-如何实现Bypass L1D cache

原創

2018-08-22 11:07

来填坑了

最近几年，国际上很多研究者开始关注GPGPU缓存调度的研究，其中bypass L1D cache便是其中的一个关注点，比如GPU上的CBWT(A类)算法，Doupled L1D(B类)算法和MRPB(A类)，CPU上的PDP(A类)等。这篇博客的内容为如何在GPGPU-Sim上实现bypass L1D cache的缓存请求。

GPGPU-Sim版本：v3.2.2
关注文件：shader.cc
在shader.cc文件中，有两处关于bypass，分别是

1375行的bool ldst_unit::memory_cycle()函数
1795行的void ldst_unit::cycle()函数

在memory_cycle()函数内，即1388行之后bool bypassL1D = false;添加我们想要的代码，修改bypassL1D的值，即可实现bypass L1D cache缓存请求。

回答评论里的问题：
1、请问1388行之后用来判断是否bypass的程式码是什么意思阿~
答：举个例子，我想让ID=0核心的所有缓存指令全都bypass，那么实现代码如下：

bool bypassL1D = false; 
if(m_core->get_sid() == 0)
    inst.cache_op = CACHE_GLOBAL;

2、另外请问memory_cycle()以及cycle()的差别
答：memory_cycle()为执行阶段的bypass，cycle()为写回阶段的bypass。
这就解释了bypass为何要inst.cache_op = CACHE_GLOBAL; 这样实现。下面的实现是错误的，

bool bypassL1D = false; 
if(m_core->get_sid() == 0)
    bypassL1D = true;

因为这样只能保证执行阶段将该指令bypass了，但在写回时仍将数据写回到了缓存中，会造成冲突。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

GPGPU-Sim学习（代码解读）-如何实现Bypass L1D cache

GPGPU-Sim學習-如何禁用GPGPU-Sim內的L1 cache

GPGPU-Sim（番外）-GPGPU-Sim的模擬機制

libtorch 上線之路-學習篇

GPGPU-Sim學習（二）(補充)gpgpu-sim官網所給虛擬機與自己所搭建虛擬機的使用感受

亂七八糟-局域網內解決路由器無法支持ipv6問題……

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結