Linux mpi 程序示例

基於MPICH的並行程序設計
  
  
  下面用一個簡單的例子,給出在Linux平臺上開發MPI並行程序的一個基本框架,以便對基於MPICH的並行程序有一個感性認識。基於MPICH的並行程序可以用C或者Fortran開發,此處給出的例子是用C語言編寫的。
  
  /*====================*
  * mpi_hello.c - Demo program of MPICH. *
  *====================*/
  
  #include
  #include “mpi.h”
  
  int main(int argc, char **argv)
  {
  int myrank, nprocs, namelen;
  char processor_name[MPI_MAX
  _PROCESSOR_NAME];
  
  MPI_Init(&argc, &argv);
  MPI_Comm_size(MPI_COMM_
  WORLD, &nprocs);
  MPI_Comm_rank(MPI_COMM
  _WORLD, &myrank);
  MPI_Get_processor_name(processor_name, &namelen);
  
  printf(“Hello World! I’m rank %d of %d on %s\n”, myrank,
  nprocs, processor_name);
  
  MPI_Finalize();
  return 0;
  }
  
  
  
  爲了保證編譯的正確性,程序的首部必須包含MPI的頭文件mpi.h。該文件給出了MPI所有調用接口的說明,並對所有用到的常量進行了定義。MPI_MAX_PROCESSOR_NAME就是該文件中定義的一個常量,是某一MPI具體實現(此處即爲MPICH)中允許的主機名的最大長度。
  
  在調用任何MPI函數之前,必須先調用MPI_Init()進行相應的初始化工作。當所有MPI函數調用都完成之後,還必須調用MPI_Finalize()進行相應的清理工作。命令行參數通過MPI_Init()函數傳遞給MPI,以便爲各個並行執行的程序建立起正確的運行環境。
  
  接下去的幾個MPI函數用來獲得並行計算環境的一些基本信息。上面的示例程序只是簡單地輸出了這些信息,但通常情況下這些信息將被用來進行問題的自動分解,或者用於建立各並行機間的通信。MPI_Comm_size()函數可以得到參與並行計算的進程個數;MPI_Comm_rank()函數可以得到當前正在運行的進程的標識;而MPI_Get_processor_name()函數則能夠獲得當前進程所在主機的名稱。
  
  基於MPI的並行程序可能有很多種編譯方法,大多數MPI實現都提供了一個易於使用的腳本來完成編譯,這些腳本能夠爲編譯器設置合適的參數,幫助編譯器找到MPI頭文件所在的目錄,並能夠連接上所需的庫文件,從而保證編譯過程的正確性。MPICH和LAM都提供了一個名爲mpicc的腳本來完成並行程序的編譯。例如,要編譯上述的示例程序,只需執行下面的命令即可:
  
  $ mpicc -o mpi_hello mpi_hello.c
  
  
  
  在並行環境中的多臺計算機上同時執行該程序,要將編譯好的程序複製到不同的機器上,並且可執行程序必須放 $ mpirun -np 6 mpi_hello
  
  
  
  在MPICH中,mpirun是MPI程序的啓動腳本,它簡化了並行進程的啓動過程,儘可能屏蔽了底層的實現細節,從而爲用戶提供了一個通用的MPI並行機。在用mpirun命令執行並行程序時,參數-np指明瞭需要並行運行的進程個數。mpirun首先在本地結點上啓動一個進程,然後根據/usr/local/share/machines.LINUX文件中所列出的主機,爲每個主機啓動一個進程。若進程數比可用的並行節點數多,則多餘的進程將重新按照上述規則進行 Hello World! I′m rank 0 of 6 on node1
  Hello World! I′m rank 1 of 6 on node2
  Hello World! I′m rank 5 of 6 on node3
  Hello World! I′m rank 3 of 6 on node1
  Hello World! I′m rank 2 of 6 on node2
  Hello World! I′m rank 4 of 6 on node3
  
  
  
  
  基於PVM的並行程序設計
  
  
  在用PVM進行並行程序設計時,程序員首先要將被求解的問題分解成獨立的程序,然後用C或者Fortran實現每個程序,最後再通過PVM提供的虛擬機在整個並行計算環境中運行。下面用一個簡單的例子,給出在Linux平臺上開發PVM並行程序的一個基本框架。
  
  /*===================*
  * pvm_hello.c - Demo
  program of PVM.*
  *==================*/
  
  #include
  #include “pvm3.h”
  
  int main(int argc, char** argv)
  {
  int i, mytid, dtid, info, nhost, narch;
  struct pvmhostinfo* hostp;
  
  mytid = pvm_mytid();
  dtid = pvm_tidtohost(mytid);
  info = pvm_config(&nhost, &narch, &hostp);
  
  for (i = 0; i < nhost && hostp[i].hi_tid != dtid; i++)
  ;
  printf(“Hello World! My task id is t%x on %s with %d hosts.\n”,
  mytid, hostp[i].hi_name, nhost);
  
  pvm_exit();
  return 0;
  }
  
  
  
  上述示例程序給出了啓動和終止一個PVM程序的基本步驟:首先在程序首部包含PVM的頭文件pvm.h。然後調用pvm_mytid()函數獲得當前運行進程的任務標識符,調用pvm_tidtohost()函數獲得與任務標識符對應的主機標識符。若想獲得當前進程所在虛擬機的相關信息(如主機總數和平臺種類等),則可以通過調用函數pvm_config()來實現。最後,當所有的PVM函數都執行完後,調用pvm_exit()函數來結束整個並行計算過程。
  
  PVM沒有提供一個單獨的腳本來完成編譯過程,要編譯上述示例程序,需要手工執行以下命令:
  
  $ gcc -o pvm_hello -I/usr/local/src/pvm3/include/ \
  > -L/usr/local/src/pvm3/lib/LINUX/ pvm_hello.c -lpvm3
  
  
  
  同MPICH一樣,用PVM編寫的程序要想能夠在多臺主機上並行運行,首先要將編譯好的可執行文件複製到不同的機器上。PVM要求用戶運行的可執行文件都應該位於Home目錄下的pvm3/bin/LINUX下。例如,要想在node1上以gary賬戶啓動上述示例程序,同時要求node2和node3能夠並行執行該程序,則應先將可執行文件pvm_hello複製到node1、node2和node3機器上的/home/gary/pvm3/bin/LINUX目錄下,然後在node1上執行如下命令:
  
  $ cd ~/pvm3/bin/LINUX
  $ pvm
  pvm> add node2 node3
  pvm> spawn -6 -> pvm_hello
  pvm> halt
  
  
  
  PVM專門提供了一個Shell來對並行執行的任務進行管理和調度。上述程序中add命令用來添加一個新的並行節點機;spawn命令用來啓動一個並行程序,參數“-6”指明瞭並行執行的進程個數,參數“->”指示將輸出信息顯示在屏幕上;halt命令則用來終止整個並行計算虛擬機。
  
  上述示例程序的一次執行結果如下所示:
  
  [1:t40002] Hello World! My task id is t40002 on node1 with 3 hosts.
  [1:t40002] EOF
  [1:t40003] Hello World! My task id is t40003 on node1 with 3 hosts.
  [1:t40003] EOF
  [1:tc0002] Hello World! My task id is tc0002 on node3 with 3 hosts.
  [1:t80001] Hello World! My task id is t80001 on node2 with 3 hosts.
  [1:t80001] EOF
  [1:tc0001] Hello World! My task id is tc0001 on node3 with 3 hosts.
  [1:tc0001] EOF
  [1:tc0002] EOF
  [1:t80002] Hello World! My task id is t80002 on node2 with 3 hosts.
  [1:t80002] EOF
  [1] finished
  
  
  
  並行計算使用多臺計算機或者具有多個處理器的計算機來求解問題,從而爲求解大規模複雜問題提供了可能。作爲一個優秀的操作系統,Linux特別適合用來組建並行計算平臺。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章