MPI單節點啓動問題

只想在一臺機子上實驗MPI,配置了MPI環境。然後

mpdboot -n 1

出現各種錯誤,例如:failed to connect to mpd on host1。

折騰如下:

1.google一下說是防火牆,然後關閉防火牆,不行。

2.想了一下應該是ssh問題,然後ssh 自己

   ssh host1   (host1是我修改的/etc/hosts中的名字,和mpd.hosts中的名字)

  居然讓我輸入密碼。

3.查了一下,原來/etc/hosts只是一個局部的DNS作用,機子的真正名字在/etc/sysconfig/network,HOSTNAME字段。那是不是名字的問題呢。

4.修改了/etc/sysconfig/network中的HOSTNAME爲host1,reboot。居然沒有IP了,eth0啓動不了了。原來是/etc/hosts中的問題,把第一行的localhost改成host1,reboot,然後就又有IP。可是問題還沒解決。

5.既然是ssh問題,那是不是和解密加密有關。然後ssh-keygen -t rsa 生成以下公鑰祕鑰,然後cat id_rsa_pub >>authorized_keys.然後再

ssh host1

居然直接通了。

然後mpdboot -n 1和mpdtrace 成功。


總結:單節點也要配置無密碼ssh訪問,不然會失敗。其實只要生成以下祕鑰公鑰,就行了。也就是:

用戶主目錄下:(cd ~)

ssh-keygen -t rsa

cd .ssh

cat id_rsa_pub >>authorized_keys

另外,關於mpd.hosts 和.mpd.conf問題:

1.如果mpi環境是在普通用戶下,兩個文件都放在用戶主目錄下。

2.如果mpi環境是在root用戶下,那麼mpd.hosts放在/root下,而.mpd.conf應該改成mpd.conf,就是名字前面的點去掉,然後放到/root/mpi/etc目錄下。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章