TBB之parallel_reduce

原創

2020-07-04 21:19

循环做的是reduce(最终输出的是单一的数)，例如求和：

float SerialSumFoo( float a[], size_t n ) {
    float sum = 0;
    for( size_t i=0; i!=n; ++i )
        sum += Foo(a[i]);
    return sum;
}

你能使用模板类parallel_reduce并行这个循环：

float ParallelSumFoo( const float a[], size_t n ) {
    SumFoo sf(a);
    parallel_reduce( blocked_range<size_t>(0,n), sf );
    return sf.my_sum;
}

这个类SumFoo说明了reduce的细节，例如，如何对子集求和，如何把他们结合起来，这是类SumFoo的定义：

class SumFoo {
    float* my_a;
public:
    float my_sum;
    void operator()( const blocked_range<size_t>& r ) {
        float *a = my_a;
        float sum = my_sum;
        size_t end = r.end();
        for( size_t i=r.begin(); i!=end; ++i )
            sum += Foo(a[i]);
        my_sum = sum;
    }
    SumFoo( SumFoo& x, split ) : my_a(x.my_a), my_sum(0) {}
    void join( const SumFoo& y ) {my_sum+=y.my_sum;}
    SumFoo(float a[] ) :
        my_a(a), my_sum(0)
        {}
};

注意不同于ApplyFoo，首先，operator()不是一个const，这是因为它一定改变SumFoo::my_sum。第二，SumFoo有一个splitting构造函数和一个join方法一定被表示为parallel_reduce工作，splitting构造函数接受指向原始对象的引用和一个标识符split，这个标识符由TBB库定义，使用split区分splitting构造函数和拷贝构造函数。

当一个工作线程可用时，任务调度器决定让parallel_reduce调度splitting构造函数为工作线程创建一个子任务，当子任务完成时，parallel_reduce使用方法join累计子任务的结果，下图显示在一个工作线程可用的情况下split-join次序：

如果一个工作线程不可用，the second half of the iteration使用相同的body对象做的reduce，在the first half结束后the reduction of the second half才会开始。

因为相同的body可能被使用累加多个子范围，operator()不能过早抛弃累加值是重要的，下面的的代码是错误的定义SumFoo::operator()。

class SumFoo {
...
public:
    float my_sum;
    void operator()( const blocked_range<size_t>& r ) {
    ...
    float sum = 0; // WRONG – should be "sum = my_sum".
    ...
    for( ... )
        sum += Foo(a[i]);
    my_sum = sum;
    }
    ...
};

上面的代码是错误的，它只返回最后子域的部分和，而不是全部子域。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

TBB之parallel_reduce

10分钟搞定Mysql主从部署配置

如何使用 JS 判断用户是否处于活跃状态

「Pygors跨平台GUI」2：安装MinGW-w64、MSYS2还是WSL2

[转帖]

python列出centos7内存使用前50的进程信息

「Pygors跨平台GUI」1：Pygors跨平台GUI应用研究

一键自动化博客发布工具,用过的人都说好(掘金篇)

lightdb数据库超时相关控制参数

lightdb秒级增加列和删除列（not null带默认值）

Java ThreadPoolShutdown

C++中運算符重載

實現Linux免密鑰登陸

TBB之parallel_reduce

TBB之concurrent_vector

TBB之pipeline

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結