Linux mpi 程序示例
基於MPICH的並行程序設計
下面用一個簡單的例子,給出在Linux平臺上開發MPI並行程序的一個基本框架,以便對基於MPICH的並行程序有一個感性認識。基於MPICH的並行程序可以用C或者Fortran開發,此處給出的例子是用C語言編寫的。
/*====================*
* mpi_hello.c - Demo program of MPICH. *
*====================*/
#include
#include “mpi.h”
int main(int argc, char **argv)
{
int myrank, nprocs, namelen;
char processor_name[MPI_MAX
_PROCESSOR_NAME];
MPI_Init(&argc, &argv);
MPI_Comm_size(MPI_COMM_
WORLD, &nprocs);
MPI_Comm_rank(MPI_COMM
_WORLD, &myrank);
MPI_Get_processor_name(processor_name, &namelen);
printf(“Hello World! I’m rank %d of %d on %s\n”, myrank,
nprocs, processor_name);
MPI_Finalize();
return 0;
}
爲了保證編譯的正確性,程序的首部必須包含MPI的頭文件mpi.h。該文件給出了MPI所有調用接口的說明,並對所有用到的常量進行了定義。MPI_MAX_PROCESSOR_NAME就是該文件中定義的一個常量,是某一MPI具體實現(此處即爲MPICH)中允許的主機名的最大長度。
在調用任何MPI函數之前,必須先調用MPI_Init()進行相應的初始化工作。當所有MPI函數調用都完成之後,還必須調用MPI_Finalize()進行相應的清理工作。命令行參數通過MPI_Init()函數傳遞給MPI,以便爲各個並行執行的程序建立起正確的運行環境。
接下去的幾個MPI函數用來獲得並行計算環境的一些基本信息。上面的示例程序只是簡單地輸出了這些信息,但通常情況下這些信息將被用來進行問題的自動分解,或者用於建立各並行機間的通信。MPI_Comm_size()函數可以得到參與並行計算的進程個數;MPI_Comm_rank()函數可以得到當前正在運行的進程的標識;而MPI_Get_processor_name()函數則能夠獲得當前進程所在主機的名稱。
基於MPI的並行程序可能有很多種編譯方法,大多數MPI實現都提供了一個易於使用的腳本來完成編譯,這些腳本能夠爲編譯器設置合適的參數,幫助編譯器找到MPI頭文件所在的目錄,並能夠連接上所需的庫文件,從而保證編譯過程的正確性。MPICH和LAM都提供了一個名爲mpicc的腳本來完成並行程序的編譯。例如,要編譯上述的示例程序,只需執行下面的命令即可:
$ mpicc -o mpi_hello mpi_hello.c
在並行環境中的多臺計算機上同時執行該程序,要將編譯好的程序複製到不同的機器上,並且可執行程序必須放 $ mpirun -np 6 mpi_hello
在MPICH中,mpirun是MPI程序的啓動腳本,它簡化了並行進程的啓動過程,儘可能屏蔽了底層的實現細節,從而爲用戶提供了一個通用的MPI並行機。在用mpirun命令執行並行程序時,參數-np指明瞭需要並行運行的進程個數。mpirun首先在本地結點上啓動一個進程,然後根據/usr/local/share/machines.LINUX文件中所列出的主機,爲每個主機啓動一個進程。若進程數比可用的並行節點數多,則多餘的進程將重新按照上述規則進行 Hello World! I′m rank 0 of 6 on node1
Hello World! I′m rank 1 of 6 on node2
Hello World! I′m rank 5 of 6 on node3
Hello World! I′m rank 3 of 6 on node1
Hello World! I′m rank 2 of 6 on node2
Hello World! I′m rank 4 of 6 on node3
基於PVM的並行程序設計
在用PVM進行並行程序設計時,程序員首先要將被求解的問題分解成獨立的程序,然後用C或者Fortran實現每個程序,最後再通過PVM提供的虛擬機在整個並行計算環境中運行。下面用一個簡單的例子,給出在Linux平臺上開發PVM並行程序的一個基本框架。
/*===================*
* pvm_hello.c - Demo
program of PVM.*
*==================*/
#include
#include “pvm3.h”
int main(int argc, char** argv)
{
int i, mytid, dtid, info, nhost, narch;
struct pvmhostinfo* hostp;
mytid = pvm_mytid();
dtid = pvm_tidtohost(mytid);
info = pvm_config(&nhost, &narch, &hostp);
for (i = 0; i < nhost && hostp[i].hi_tid != dtid; i++)
;
printf(“Hello World! My task id is t%x on %s with %d hosts.\n”,
mytid, hostp[i].hi_name, nhost);
pvm_exit();
return 0;
}
上述示例程序給出了啓動和終止一個PVM程序的基本步驟:首先在程序首部包含PVM的頭文件pvm.h。然後調用pvm_mytid()函數獲得當前運行進程的任務標識符,調用pvm_tidtohost()函數獲得與任務標識符對應的主機標識符。若想獲得當前進程所在虛擬機的相關信息(如主機總數和平臺種類等),則可以通過調用函數pvm_config()來實現。最後,當所有的PVM函數都執行完後,調用pvm_exit()函數來結束整個並行計算過程。
PVM沒有提供一個單獨的腳本來完成編譯過程,要編譯上述示例程序,需要手工執行以下命令:
$ gcc -o pvm_hello -I/usr/local/src/pvm3/include/ \
> -L/usr/local/src/pvm3/lib/LINUX/ pvm_hello.c -lpvm3
同MPICH一樣,用PVM編寫的程序要想能夠在多臺主機上並行運行,首先要將編譯好的可執行文件複製到不同的機器上。PVM要求用戶運行的可執行文件都應該位於Home目錄下的pvm3/bin/LINUX下。例如,要想在node1上以gary賬戶啓動上述示例程序,同時要求node2和node3能夠並行執行該程序,則應先將可執行文件pvm_hello複製到node1、node2和node3機器上的/home/gary/pvm3/bin/LINUX目錄下,然後在node1上執行如下命令:
$ cd ~/pvm3/bin/LINUX
$ pvm
pvm> add node2 node3
pvm> spawn -6 -> pvm_hello
pvm> halt
PVM專門提供了一個Shell來對並行執行的任務進行管理和調度。上述程序中add命令用來添加一個新的並行節點機;spawn命令用來啓動一個並行程序,參數“-6”指明瞭並行執行的進程個數,參數“->”指示將輸出信息顯示在屏幕上;halt命令則用來終止整個並行計算虛擬機。
上述示例程序的一次執行結果如下所示:
[1:t40002] Hello World! My task id is t40002 on node1 with 3 hosts.
[1:t40002] EOF
[1:t40003] Hello World! My task id is t40003 on node1 with 3 hosts.
[1:t40003] EOF
[1:tc0002] Hello World! My task id is tc0002 on node3 with 3 hosts.
[1:t80001] Hello World! My task id is t80001 on node2 with 3 hosts.
[1:t80001] EOF
[1:tc0001] Hello World! My task id is tc0001 on node3 with 3 hosts.
[1:tc0001] EOF
[1:tc0002] EOF
[1:t80002] Hello World! My task id is t80002 on node2 with 3 hosts.
[1:t80002] EOF
[1] finished
並行計算使用多臺計算機或者具有多個處理器的計算機來求解問題,從而爲求解大規模複雜問題提供了可能。作爲一個優秀的操作系統,Linux特別適合用來組建並行計算平臺。
下面用一個簡單的例子,給出在Linux平臺上開發MPI並行程序的一個基本框架,以便對基於MPICH的並行程序有一個感性認識。基於MPICH的並行程序可以用C或者Fortran開發,此處給出的例子是用C語言編寫的。
/*====================*
* mpi_hello.c - Demo program of MPICH. *
*====================*/
#include
#include “mpi.h”
int main(int argc, char **argv)
{
int myrank, nprocs, namelen;
char processor_name[MPI_MAX
_PROCESSOR_NAME];
MPI_Init(&argc, &argv);
MPI_Comm_size(MPI_COMM_
WORLD, &nprocs);
MPI_Comm_rank(MPI_COMM
_WORLD, &myrank);
MPI_Get_processor_name(processor_name, &namelen);
printf(“Hello World! I’m rank %d of %d on %s\n”, myrank,
nprocs, processor_name);
MPI_Finalize();
return 0;
}
爲了保證編譯的正確性,程序的首部必須包含MPI的頭文件mpi.h。該文件給出了MPI所有調用接口的說明,並對所有用到的常量進行了定義。MPI_MAX_PROCESSOR_NAME就是該文件中定義的一個常量,是某一MPI具體實現(此處即爲MPICH)中允許的主機名的最大長度。
在調用任何MPI函數之前,必須先調用MPI_Init()進行相應的初始化工作。當所有MPI函數調用都完成之後,還必須調用MPI_Finalize()進行相應的清理工作。命令行參數通過MPI_Init()函數傳遞給MPI,以便爲各個並行執行的程序建立起正確的運行環境。
接下去的幾個MPI函數用來獲得並行計算環境的一些基本信息。上面的示例程序只是簡單地輸出了這些信息,但通常情況下這些信息將被用來進行問題的自動分解,或者用於建立各並行機間的通信。MPI_Comm_size()函數可以得到參與並行計算的進程個數;MPI_Comm_rank()函數可以得到當前正在運行的進程的標識;而MPI_Get_processor_name()函數則能夠獲得當前進程所在主機的名稱。
基於MPI的並行程序可能有很多種編譯方法,大多數MPI實現都提供了一個易於使用的腳本來完成編譯,這些腳本能夠爲編譯器設置合適的參數,幫助編譯器找到MPI頭文件所在的目錄,並能夠連接上所需的庫文件,從而保證編譯過程的正確性。MPICH和LAM都提供了一個名爲mpicc的腳本來完成並行程序的編譯。例如,要編譯上述的示例程序,只需執行下面的命令即可:
$ mpicc -o mpi_hello mpi_hello.c
在並行環境中的多臺計算機上同時執行該程序,要將編譯好的程序複製到不同的機器上,並且可執行程序必須放 $ mpirun -np 6 mpi_hello
在MPICH中,mpirun是MPI程序的啓動腳本,它簡化了並行進程的啓動過程,儘可能屏蔽了底層的實現細節,從而爲用戶提供了一個通用的MPI並行機。在用mpirun命令執行並行程序時,參數-np指明瞭需要並行運行的進程個數。mpirun首先在本地結點上啓動一個進程,然後根據/usr/local/share/machines.LINUX文件中所列出的主機,爲每個主機啓動一個進程。若進程數比可用的並行節點數多,則多餘的進程將重新按照上述規則進行 Hello World! I′m rank 0 of 6 on node1
Hello World! I′m rank 1 of 6 on node2
Hello World! I′m rank 5 of 6 on node3
Hello World! I′m rank 3 of 6 on node1
Hello World! I′m rank 2 of 6 on node2
Hello World! I′m rank 4 of 6 on node3
基於PVM的並行程序設計
在用PVM進行並行程序設計時,程序員首先要將被求解的問題分解成獨立的程序,然後用C或者Fortran實現每個程序,最後再通過PVM提供的虛擬機在整個並行計算環境中運行。下面用一個簡單的例子,給出在Linux平臺上開發PVM並行程序的一個基本框架。
/*===================*
* pvm_hello.c - Demo
program of PVM.*
*==================*/
#include
#include “pvm3.h”
int main(int argc, char** argv)
{
int i, mytid, dtid, info, nhost, narch;
struct pvmhostinfo* hostp;
mytid = pvm_mytid();
dtid = pvm_tidtohost(mytid);
info = pvm_config(&nhost, &narch, &hostp);
for (i = 0; i < nhost && hostp[i].hi_tid != dtid; i++)
;
printf(“Hello World! My task id is t%x on %s with %d hosts.\n”,
mytid, hostp[i].hi_name, nhost);
pvm_exit();
return 0;
}
上述示例程序給出了啓動和終止一個PVM程序的基本步驟:首先在程序首部包含PVM的頭文件pvm.h。然後調用pvm_mytid()函數獲得當前運行進程的任務標識符,調用pvm_tidtohost()函數獲得與任務標識符對應的主機標識符。若想獲得當前進程所在虛擬機的相關信息(如主機總數和平臺種類等),則可以通過調用函數pvm_config()來實現。最後,當所有的PVM函數都執行完後,調用pvm_exit()函數來結束整個並行計算過程。
PVM沒有提供一個單獨的腳本來完成編譯過程,要編譯上述示例程序,需要手工執行以下命令:
$ gcc -o pvm_hello -I/usr/local/src/pvm3/include/ \
> -L/usr/local/src/pvm3/lib/LINUX/ pvm_hello.c -lpvm3
同MPICH一樣,用PVM編寫的程序要想能夠在多臺主機上並行運行,首先要將編譯好的可執行文件複製到不同的機器上。PVM要求用戶運行的可執行文件都應該位於Home目錄下的pvm3/bin/LINUX下。例如,要想在node1上以gary賬戶啓動上述示例程序,同時要求node2和node3能夠並行執行該程序,則應先將可執行文件pvm_hello複製到node1、node2和node3機器上的/home/gary/pvm3/bin/LINUX目錄下,然後在node1上執行如下命令:
$ cd ~/pvm3/bin/LINUX
$ pvm
pvm> add node2 node3
pvm> spawn -6 -> pvm_hello
pvm> halt
PVM專門提供了一個Shell來對並行執行的任務進行管理和調度。上述程序中add命令用來添加一個新的並行節點機;spawn命令用來啓動一個並行程序,參數“-6”指明瞭並行執行的進程個數,參數“->”指示將輸出信息顯示在屏幕上;halt命令則用來終止整個並行計算虛擬機。
上述示例程序的一次執行結果如下所示:
[1:t40002] Hello World! My task id is t40002 on node1 with 3 hosts.
[1:t40002] EOF
[1:t40003] Hello World! My task id is t40003 on node1 with 3 hosts.
[1:t40003] EOF
[1:tc0002] Hello World! My task id is tc0002 on node3 with 3 hosts.
[1:t80001] Hello World! My task id is t80001 on node2 with 3 hosts.
[1:t80001] EOF
[1:tc0001] Hello World! My task id is tc0001 on node3 with 3 hosts.
[1:tc0001] EOF
[1:tc0002] EOF
[1:t80002] Hello World! My task id is t80002 on node2 with 3 hosts.
[1:t80002] EOF
[1] finished
並行計算使用多臺計算機或者具有多個處理器的計算機來求解問題,從而爲求解大規模複雜問題提供了可能。作爲一個優秀的操作系統,Linux特別適合用來組建並行計算平臺。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.