并行计算PC机群的构建Word格式.docx
- 文档编号:21500436
- 上传时间:2023-01-30
- 格式:DOCX
- 页数:30
- 大小:4MB
并行计算PC机群的构建Word格式.docx
《并行计算PC机群的构建Word格式.docx》由会员分享,可在线阅读,更多相关《并行计算PC机群的构建Word格式.docx(30页珍藏版)》请在冰豆网上搜索。
1G(2´
512M)Rambus
硬盘:
80GBIDE
主板:
ASUSP4TSocket423
网卡:
3com905–TX(两个)
显卡、显示器、键盘、鼠标、光驱、软驱:
略
(2)计算节点配置:
PentiumⅣ1.5G(512KB全速二级缓存)
512MB(2´
256M)Rambus
40GBIDE
3com905–TX
另外,交换设备由2个3com3c16980和1个3com3c16985的交换机通过一个matrixmodule堆叠而成,并安装了一个千兆光纤模块,以备服务接点连接内部机群的网卡升级为千兆网卡。
据此配置清单,从市场上采购硬件并连接成功后便可以开始机群软件环境的配置。
2PC机群软件环境的配置
如《并行算法实践》第2.2节(软件的选择与安装)本节将主要讲述如何在Linux环境下构建并行计算PC机群的软件环境。
2.1OS的选择与安装
Linux是目前构建高性能计算机群的一个最佳的选择。
在众多的Linux发行版本中,还要考虑的是系统管理工具的友好性,这一点Redhat与Suse的工作是成功的;
同时系统功能的可裁剪性也是很重要的,如Debian系统在这一点上做的就非常出色。
在此笔者建议对Linux系统有比较深入认识的读者可选用Debian作为系统平台,因为Debian能够根据用户的需要最精确的选择安装、更新相应的软件包,避免过多的冗余服务占用系统资源,最大限度的满足用户对性能的要求;
若是Linux系统的入门者则选用Redhat或Suse较为合适,因为这些发行版本提供了较为友好的用户安装、使用界面,并且配备了图形化的系统管理工具,避免了众多的命令行操作。
在所创建的示例机群中使用的是Redhat9.0版本(内核2.4.28)。
介绍Linux系统具体安装的书籍有很多,这里就不再敷述。
安装过程中请选择“定制”,并在“选择软件包组”时在默认的基础上选中【服务器】|【网络服务器】
(telnet-server、rsh-server)、【服务器】|【服务器配置工具】
(NFS等服务器配置工具)、【开发】|【开发工具】
(gcc等基本开发工具)、【系统】|【管理工具】
(图形化的系统管理工具)等软件包组。
操作系统安装完毕后,我们假设具有如下信息:
服务节点主机名为“node0”,IP地址为“192.168.0.100”;
计算节点相应的主机名为“node[1..63]”,IP地址为“192.168.0.[1..63]”。
2.2单一登录(SingleSignOn)的构建
用户可以从机群系统的任何一个节点登录,而且在整个作业执行过程中只需登录一次,不必为将作业指派到机群中的其它节点而重新登录。
这里我们采用《并行算法实践》中所介绍的第二种方法“构建用户管理脚本”来维护系统中用户信息的一致性,使用户不再重复输入密码即可登录到机群中的另一个节点上。
这包括以下步骤:
1.以root用户登录到节点node0,修改文件/etc/hosts、/etc/host.equiv,在其中写入机群所有节点的名称和IP。
图1
图2
图3
图4
2.修改系统的服务设置,通过服务设置工具启动如下系统服务:
nfs、rexec、rsh、rlogin。
其中后面三个服务是与RemoteShell相关的,负责在远程节点启动进程。
图5
图6
3.经过上述设置后需以普通用户身份测试RSH是否配置成功,运行命令如图7所示。
对于root用户需要经过图8所示的配置才可以不重新输入密码即可以通过RSH登录远程节点。
图7
图8
4.通过图9所示的脚本即可以完成创建全局统一的用户信息。
该脚本首先在本节点新增用户,然后通过RSH将用户配置文件/etc/passwd复制到机群中所有其余的节点。
图9中建立了全局用户cluster。
图9
2.3单一文件系统(SingleFileSystem)的构建
NFS是一种Unix/Linux之间通过网络共享文件的标准方式。
使用NFS,就能够透明的安装和访问网络上远程主机的文件系统,将其安装(mount)在本地的文件系统中,类似于Windows下的映射驱动器。
在示例机群中,节点node0是服务器,把目录/home和/cluster进行共享;
节点node1到node63是客户端,把服务器的/home和cluster安装到自己的文件系统当中。
下面分别进行讨论:
1.首先在节点node0上建立目录/cluster,然后将该目录授权给用户cluster。
图10
2.可以通过如图11所示的服务器设置工具配置共享目录,也可以通过图12-13所示的直接修改/etc/exports文件改变目录的共享。
图13表示将目录/home和/cluster以可读可写的方式共享给192.168.0.0/24范围(IP从192.168.0.1到192.168.0.254)内的所有机器。
图11
图12
图13
3.运行命令exportfs–a完成目录的共享。
图14
4.客户端节点同样需要首先建立/cluster目录,然后修改分区配置文件/etc/fstab,在其中加入对/home和/cluster的映射。
图15
图16
5.运行命令mount–a完成目录的共享。
图17
6.通过图18中的脚本可以将该分区配置文件拷贝到机群中所有其他节点。
图18
2.4并行编程环境(ParallelProgrammingEnvironment)的构建
MPI(MessagePassingInterface):
消息传递接口MPI目前是最流行的分布存储并行编程环境。
MPICH是由美国的Argonne国家实验室开发的基于MPI标准的一套开放源码的软件包,目前最新的版本是1.2.4。
从链接http:
//www-unix.mcs.anl.gov/mpi/mpich/可以获得更多关于MPICH的资料以及下载该软件包。
其具体配置步骤如下:
1.首先需要结压缩安装文件包并通过configure脚本完成初始配置。
其中-prefix指定/cluster/mpich为安装目录;
--with-device指明所使用的通信系统类型为TCP/IP通信系统;
--with-arch指明所使用的操作系统为Linux。
图19
图20
2.完成初始配置之后即可以使用make、makeinstall完成mpich的安装。
图21
图22
3.修改mpich的节点配置文件/cluster/mpich/shar/machines.LINUX,指明该机群所包含的节点。
图23
图24
4.在安装目录的example子目录下可以找到其所提供的示例源程序,通过编译运行cpi程序可以测试该MPI编程环境是否建立成功。
图25
2.5单一作业管理系统(SingleJobManagementSystem)的构建
PBS是由NAS(NationalAcademyofSciences)开发的面向批作业调度以及系统资源管理的软件包。
它主要用于管理使用UNIX或Linux的同构或异构的机群系统。
这里主要介绍OpenPBS的安装及简单使用。
1.首先需要解压缩安装文件包并通过configure脚本完成初始配置。
其中-prefix指定/pbs_home为安装目录;
--set-server-home指定OpenPBS的spool目录,其用于存放各守护进程的配置文件、log文件以及任务调度的临时数据。
--set-default-server指定该机群系统的作业服务守护进程(JobServer)所处的节点为node0。
图26
2.完成初始配置之后即可以使用make、makeinstall完成OpenPBS的安装。
图27
图28
3.通过修改服务器节点node0上的OpenPBS配置文件指明该并行运行环境中的节点名称。
图29
图30
4.通过修改客户节点上的配置文件来指明日志文件的记录格式以及服务器节点的名称。
图31
图32
5.完成基本配置后需要首先启动客户节点的OpenPBS守候进程。
图33
6.最后启动服务器节点上的三个守候进程。
其中对pbs_server的首次启动需要加上-tcreate参数。
启动完成后通过OpenPBS所提供的工具qmgr完成任务队列设置如图35所示。
图34
图35
7.首先转换成预先建立的机群用户cluster并通过OpenPBS的基本命令完成作业的提交以及状态查询。
从图37可以看出,该作业以提交并分配在节点node1上执行;
图38给出了这次执行输出文件的内容。
图36
图37
图38
8.图39、40测试了OpenPBS对并行作业的支持,包括作业提交以及状态的查询。
图39
图40
3结束语
至此,通过以上步骤即完成了一个PC机群系统的构建。
该系统通过OpenPBS完成作业的管理,通过mpich完成并行作业的执行。
该系统应能基本满足科研用户的一般需求,对于其余一些附加的功能用户可以采用相类似的方法逐步的完善系统。
例如可以通过建立更多的脚本完成系统的可控管理(关机、启动等);
通过安装HPF等其他的并行编程环境;
通过配置OpenPBS的队列实现更完善作业调度。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 并行 计算 PC 机群 构建