MPI環境配置(二)
在雲服務器上搭建MPI分佈式集羣環境,採用NFS統一數據,這一次配置時遇到了幾個問題,記錄一下
詳細MPI集羣環境配置
NFS環境搭建,注意,NFS不需要ssh免密登錄,不相關
本次遇到的問題
1、免密登錄,需要能免密登錄本機
有兩臺機器,node1和node2
那麼不僅需要node1能夠免密登錄node2 和 node2能夠免密登錄node1,還需要node1能夠免密登錄node1 和 node2能夠免密登錄node2
2、這一次使用的用戶名都是wj,但是依然出現了錯誤:
Host key verification failed
一直以爲是hosts
文件配置出錯或者是ssh
免密登錄沒有配置好,最後發現是在執行程序時,使用的命令有問題
錯誤命令:
sudo mpiexec -n 4 -f /home/wj/nfs/mpi_config_file ./cpi
正確命令:
mpiexec -n 4 -f /home/wj/nfs/mpi_config_file ./cpi
區別就是,使用sudo
後,執行程序的用戶變爲root
,而在配置免密登錄時,配置的是用戶wj
的免密登錄
正確執行命令爲:
nfs
服務端配置在wj
機器上,如上,能較快得到運算結果
但是在nfs
客戶端機器ecs-sn3-medium-2-linux-20200212212636
上卻很久都得不到運算結果,通過將執行程序和mpi_cinfig_file移出nfs對應目錄,依舊如此,證明與nfs文件系統無關。在該機器上單機運行正常。
考慮是不同公司的雲服務器,可能對特定任務有限制?這種情況屬特例,自行搭建的本地集羣一般不會有這種問題。