累加和高效并行版本的AAuto串行实现

累加和也叫前缀和,举个例子:

    原始数组:1 2 2 1 

    累加数组:1 3 5 6

按照累加和的这个原始定理,前一个和没算出来后一个是没法算的,想要并行看来行不通啦。实际上有办法解开这种纠缠,可参考这篇文章。 我只是把它用AAuto代码串行的实现了一下,你可以看到,可以同时做很多计算了,因为这些计算都是独立的了。上代码:

io.open()
var n=4
var N=2**n
var A={}
//初始化数组
for i=1;N
    A[ i ]=1
//由森林变成树
var s=1
for i=1;n{
    
for j=2*s;N;2*s
        A[j]+=A[j-s]
    s*=2
}
A[N+1]=A[N]
//再由树变回森林
A[N]=0
s=N/2
for i=1;n{
    
for j=2*s;N;2*s{
        
var tmp=A[j-s]
        A[j-s]=A[j]
        A[j]+=tmp
    }
    s/=2
}
//输出累加结果
for i=1;#A
    io.stdout.write(A[ i ],
' ')
io.print()
execute("pause")
io.close()


发布了128 篇原创文章 · 获赞 21 · 访问量 38万+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章