每日一面 - 为何我们经常使用 2 的 N 次方作为分片数量？

原創

2021-01-30 09:55

分片算法经常是计算一个值之后，对于分片个数取模，计算到底使用哪个分片。我们经常看到很多地方高性能的代码设计，都是将分片数量设置为 2 的 N 次方。例如 ForkJoinPool 的任务队列 WorkQueue 的大小，MyCat 的某些分片算法在计算分片的时候对于分片数量如果是 2 的 N 次方也有优化，那么为什么呢？

对于 2 的 N 次方取余，相当于对 2 的 N 次方减一取与运算， N 为正整数。为什么呢？通过下图就能很容易理解：

十进制中，对于 10 的 N 次方取余，直观来看就是：其实就是将最后 n 位取出，就是余数。对于二进制，是一样的：这个运算相当于，对于 n-1 取与：

这个是一个很经典的位运算运用，广泛用于各种高性能框架。例如在生成缓存队列槽位的时候，一般生成2的n次方个槽位，因为这样在选择槽位的时候，就可以用取与代替取余；java 中的 ForkJoinPool 的队列长度就是定为 2 的 N 次方；netty 中的缓存池的叶子节点都是 2 的 N 次方，当然这也是因为是平衡二叉查找树算法的实现。

我们来看下性能会好多少：

@Benchmark
@Warmup(iterations = 0)
@Measurement(iterations = 300)
public void mod2_n_1(Generator generator) {
    int result = 0;
    for (int j = 0; j < generator.divide.length; j++) {
        int l = generator.divide[j];
        result += Integer.MAX_VALUE % l;
    }
}

@Benchmark
@Warmup(iterations = 0)
@Measurement(iterations = 300)
public void mod2_n_2(Generator generator) {
    int result = 0;
    for (int j = 0; j < generator.divide.length; j++) {
        int l = generator.divide[j];
        result += Integer.MAX_VALUE & (l - 1);
    }
}

结果：

Benchmark                                    Mode  Cnt         Score           Error  Units
BitUtilTest.mod2_n_1                        thrpt  300  10632698.855 ±   5843378.697  ops/s
BitUtilTest.mod2_n_2                        thrpt  300  80339980.989 ±  21905820.262  ops/s

同时，我们从这里也可以引申出，判断一个数是否是2的 N 次方的方法，就是看这个数与这个数减一取与运算看是否是0，如果是，则是 2 的 N 次方， N为正整数。

每日一刷，轻松提升技术，斩获各种offer：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

每日一面 - 为何我们经常使用 2 的 N 次方作为分片数量？

前端使用 Konva 实现可视化设计器（13）- 折线 - 最优路径应用【思路篇】

Debian 系統初體驗

vue2數據雙向綁定Object.defineProperty

魔獸爭霸卡頓解決

BCS2024｜Baidu Comate：以研發提效爲驅動實現“安全左移”

Puppeteer實戰案例：自動化抓取社交媒體上的媒體資源

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結