高性能计算

mpi no_port 错误

2010年3月26日 阅读(533)

provide the output with -d (debug) parameter as well? With

this parameter you can see the command to start the remote MPDs. You could try

the mpd startup and look if the port is written to stdout.

(1)
no_port 错误

zzm@zzm-desktop:/home/zzm$ mpdboot -n 2 -f /home/zzm/
mpd.hosts

mpdboot_zzm-desktop (handle_
mpd_output 420):
from
mpd
on zzm-desktop,
invalid
port
info:


no_port

导致此错误的原因有很多个,下面是我发现的几个:

   * .
mpd.conf文件的存取权限不正确,请确保其权限是600。

   * 客户机上面的环境与主机上面的不一样,比如目录不一样,或者目录中的内容有差别,请对照"9. 成功运行的关键点"这一节进行排错。

   * 客户机上面缺少.
mpd.conf。 请参考"5. 添加
mpd配置文件"这一节,在每台客户机上面都添加一个配置文件,并确保权限都是600,文件中的secret word都一样。

实际的原因是:两个机子是异构的结点,一个32位x86处理器,一个x64处理器,而使用的mpich2不支持这样的结构。

解决方法:改换mpich1(这个传说可以支持32与64位机的互联,但未经本人测试)

使用openmpi替代mpich,这个可以(已经试验验证)

(2) failed to handshake 错误

zzm@zzm-desktop:~$ mpdboot -n 2 -f
mpd.hosts

mpdboot_zzm-desktop (handle_
mpd_output 407): failed to handshake with
mpd
on 192.168.1.248; recvd output={}

导致此错误的原因有很多个,下面是我发现的几个:

   * 该错误是由于SSH不能达到本文中所说的"在列表中的每台机器上面都可以不用输入密码地SSH到列表中的所有机器上面,包括本机(localhost)"而导致的。如果你做不到这点,请参考"7.3"节所述进行排错。

   * 不要将客户机上面的.
mpd.conf文件的内容写成"secretwork=nicegiving",要写成 "secretword=nicegiving"

You Might Also Like