今天看rockdb的代码, 看到整个程序在分配内存和释放的内存的时候,并不是直接用的malloc 或者 new 等,而是使用cacheline_aligned_alloc,了解了一下相关原理,内存load到缓存的时候 ,是按照cacheline大小load到缓存的,所以进行分配内存的时候,尽量按照cacheline大小进行分配,这样访问一个结构体就是访问一个cacheline,这些细节可以使得程序可能更快吧。把代码贴上,以后分配内存直接用这个代码分配。
void *cacheline_aligned_alloc(size_t size) {
#if __GNUC__ < 5 && defined(__SANITIZE_ADDRESS__)
return malloc(size);
#elif ( _POSIX_C_SOURCE >= 200112L || _XOPEN_SOURCE >= 600 || defined(__APPLE__))
void *m;
errno = posix_memalign(&m, CACHE_LINE_SIZE, size);
return errno ? nullptr : m;
#else
return malloc(size);
#endif
}
void cacheline_aligned_free(void *memblock) {
free(memblock);
}