bitonic_sort using mpi in c

原創

2020-06-27 12:37

最近用mpi(消息傳遞接口，基於分佈式存儲機制的)實現了下bitonic_sort,理論上它的

時間複雜度只有O(lgn * lgn),但是需要用到n/2個比較器，，(從這裏可以發現，如果用串行實現，複雜度就是O(n*lgn*lgn))所以可擴展性非常的差，一般也就沒什麼實際意義，在目前的這種應用上。不過我還是根據自己對這個算法的理解，用mpi實現了一把，下面陳述之：
首先假設有n=2^d 個數待排序，如果n不是2的次方的話，也是ok的，不過某些個線程，

和某些次比較可能是空操作而已，因此爲了方便起見讓n=2^d，p爲線程數，每一個線程

保存2個整數，即p=n/2。線程編號id從0,...p-1
first = 1;next = 1;//這兩個變量與id號的關聯是關鍵
for(i=0;i<d;i++)//需要d躺歸併
{
    if(i>0)//第一躺方向剛好相反，因爲2組線程都是有序的
    {
       partner = id^first;
       first = first<<1 + 1;
       //讓編號爲id，partner的線程先交換各自其中一個數字，然後比較，再把比較

     //後的結果返回回來
    }
    next = first>>2 - first>>3;//取first右移2位後的最高位
    for(j=i-1;j>0;j--)//第i部的歸併的後續操作
    {
       partner = id^next;
       //id與partner進程通信比較返回操作
       next = next>>1;
    }
    //一個線程中2個數的排序，每次歸併的最後一次操作
    if(data[1]<data[0])
        swap(data,1,0);
}
這個就是此算法的主要框架，由於本人的這個實現用到了很多MPI_Send,MPI_Recv等通信

操作，所以當測試32個數排序時，時間都已經達到了0.5ms左右，可見通信時間佔了絕大

多數。然而當時我想，既然這個算法的擴展性不好，因此可以在每次線程中保留一份完

整的數據，這樣在比較過程中就可以省略掉數據的通信交換了，應該可以提速不少，只

是當每一個線程通過比較後，改變了原來2個數的位置後，需要把這個事實廣播給其他所

有線程，讓他們也改變相應的位置，始終保持所有線程的數據都同步，這個需要O(lgn)

的時間，因此如果廣播太頻繁的話，這個改變已經偏離了bitonic_sort的初衷，儘管如

此，時間肯定是會得到提升的。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

bitonic_sort using mpi in c

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

【2024-05-21】以茶會友

第一個makefile文件，這麼簡單，爲什麼也搞了那麼長時間！！

bitonic_sort using mpi in c

java解析xml文件的2種方法:sax,dom

愛因斯坦相對論介紹

虛擬linux掛載window中的文件

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結