高性能计算

折腾intel集群工具包

2008年11月11日 阅读(251)

人世间最大的痛苦,莫过于,当折腾了漫长的岁月,到头来发现原来是一场空,于是你会想早知如此,我就不会那么折腾了,可是事实是我们过去在折腾着,而在未来也将折腾下去.。。。

不过不是向题目所写的那样,我们在折腾别人,实际上一直被折腾的都是我们自己

可是我还是得继续折腾下去。。。

intel集群工具包在ubuntu8.04下的安装配置

关于具体的安装过程intel的文档ICT_Release_Notes_3.0.1.pdf里有安装说明,不过这个是英文版的,为了方便,也为了以后不再这么折腾,索性还是把我今天是怎么的折腾的记录一下吧。。。

intel这个说明文档的顺序安排很诡异,直接导致我理解偏差,比如它先给你说要安装配置好ssh,然后告诉你一堆步骤,还给你个自动化配置的诱惑建议,纯粹是诱惑啊。。。

其实这个步骤只是后面toolkit安装的一个插曲,它把它提出来进行了详细的介绍,容易导致把这个步骤认为是跟后面的过程独立的

安装过程是这样的:

1.创建一个文件machines.LINUX,实际上这个文件是那个安装脚本sshconnectivity.exp的输入文件,同时intel的工具包安装程序要用它来进行配置集群节点

文件格式是这样的:一行一个hostname,对于第一个默认是集群的管理节点

在这里,因为我只有一个节点,所以我的machines.LINUX只有一行,如下

duanple-desktop

对于hostname,不是随便起的,这个你只要在shell里敲hostname这个命令,就可以看到了

同时注意检查/etc/ssh_known_host和~/.ssh/ssh_known_host,注意保证文件内容和machines.LINUX一致,不一致请注意copy就好了

 

2.建立工作区域

实际上就是为解压文件提供一个存放目录,这个要求不严格,让intel说的太复杂了

 

3.4.获取注册码

这个当初你在intel官网下这个软件的时候,它会把许可文件发到你填的那个邮箱,自己下载下来

放到固定目录:比如<installation path>/licenses

注意不要修改文件名,然后需要将这个作为环境变量添加,比如installation path在/opt/intel

For Bourne* Shell or Korn* Shell the
syntax for setting the INTEL_LICENSE_FILE environment
variable might be:  
export INTEL_LICENSE_FILE=/opt/intel/licenses

 

5.将l_ict_<version>.<release>.tar.gz放到你的工作区

6.

tar -xvzf l_ict_<version>.<release>.tar.gz

 cd l_ict_<version>.<release>

./sshconnectivity.exp machines.LINUX

实际上就是开始配置ssh了,也表明折腾正式开始:

其实不怕折腾,关键是我们可以面对问题,分析输出,找到原因,不断折腾

首先,说找不到usr/bin/except,

which except,果然没有,看来还得安装下,nnd,我linux网络还没配好,还是先配网络吧,索性用bridge模式,直接盗个ip先上网,上去了。。。还得设置source list,无奈再次跑到

http://wiki.ubuntu.org.cn/%E5%BF%AB%E9%80%9F%E8%AE%BE%E7%BD%AE%E6%8C%87%E5%8D%97

把上交的源设好

上海市 上海交通大学 更新服务器(推荐教育网和网通用户使用。)

deb http://ftp.sjtu.edu.cn/ubuntu/ dapper main multiverse restricted universe
deb http://ftp.sjtu.edu.cn/ubuntu/ dapper-backports main multiverse restricted universe
deb http://ftp.sjtu.edu.cn/ubuntu/ dapper-proposed main multiverse restricted universe
deb http://ftp.sjtu.edu.cn/ubuntu/ dapper-security main multiverse restricted universe
deb http://ftp.sjtu.edu.cn/ubuntu/ dapper-updates main multiverse restricted universe
deb http://ftp.sjtu.edu.cn/ubuntu-cn/ dapper main multiverse restricted universe
sudo cp /etc/apt/sources.list /etc/apt/sources.list_backup

sudo gedit /etc/apt/sources.list

sudo的时候,它不让了,提示:sudo: timestamp too far in the future: Apr 18 04:56:03 2007

ok,sudo -k恢复下时间设置就好了

一切就绪,打开源管理器,发现上交的源里找不到except。。。

这时想起把系统安装iso文件,设成源,用ubuntu的源管理器就可以了,里面有个按钮cd-rom。。。

终于装上except了。。。

好吧,我可以试试这个命令:./sshconnectivity.exp machines.LINUX 了

直接出错

1.
Error – The first node "127.0.0.1 duanple-desktop" in file "machines.LINUX" does can’t read "env(HOSTNAME)": no such variable
    while executing
"send_error "not match the \$HOSTNAME environment variable value \"$env(HOSTNAME)\".\n""
    invoked from within
"if {$cmd_line_error_detected == 0} {
    # Disable the logging of information
    log_user 0

    # Prompt the user for a cluster password
    set clu…"
    (file "./sshconnectivity.exp" line 134)

原因:no such variable HOSTNAME
2.env
查看果然没有。。。
3. echo $INTEL_LICENSE_FILE
我看看这个有没。奥,不错,有了,没白设。
4.export HOSTNAME=duanple-desktop
没有我就设呗,靠,谁怕谁。。。
5.# ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa):
Created directory ‘/root/.ssh’.
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /root/.ssh/id_rsa.
Your public key has been saved in /root/.ssh/id_rsa.pub.
The key fingerprint is:
4d:10:f9:ee:81:d5:de:4e:e5:8b:4f:7b:85:72:1b:70 root@duanple-desktop
# cat ~/.ssh/*.pub >> ~/.ssh/authorized_keys
# chmod go-rwx ~/.ssh/authorized_keys
# cat ~/.ssh/*.pub >> ~/.ssh/authorized_keys.exp6.root
# chmod go-w ~/../root
chmod: cannot access `/home/duanple/../root’: No such file or directory
# ssh duanple-desktop
tnnd,,,还不行。。。。。。
6. sudo mkdir ~/../root
cannot access `/home/duanple/../root’: No such file or directory。好,满足你!!!
7. sudo ./sshconnectivity.exp machines.LINUX
我就不信,你它nnd这么折腾我*****
8.
*******************************************************************************
Node count = 1
Secure shell connectivity was established on all nodes.
See the log output listing "/tmp/sshconnectivity.root.log" for details.
Version number: $Revision: 1.14 $
Version date: $Date: 2007/04/28 03:31:14 $
*******************************************************************************
。。。oh,ya。。。好了

 

7.其实,真正的安装现在才开始,

当我满怀希望的,./install.sh时,我发现,原来这才是世界的真实

生命不息,折腾不止。。。。。。

请看:

duanple@duanple-desktop:~/l_ict_p_3.0.1.008$ sudo ./install.sh

./install.sh: 6: declare: not found

./install.sh: 7: [[: not found

./install.sh: 8: declare: not found

./install.sh: 9: declare: not found

./install.sh: 11: declare: not found

./install.sh: 12: declare: not found

./install.sh: 13: declare: not found

./install.sh: 14: Syntax error: "(" unexpected

so…………

You Might Also Like