曙光集群用户使用手册样本.docx
- 文档编号:6394618
- 上传时间:2023-01-06
- 格式:DOCX
- 页数:16
- 大小:327.48KB
曙光集群用户使用手册样本.docx
《曙光集群用户使用手册样本.docx》由会员分享,可在线阅读,更多相关《曙光集群用户使用手册样本.docx(16页珍藏版)》请在冰豆网上搜索。
曙光集群用户使用手册样本
1.登录和文献传播
登录方式为ssh,与telnet功能类似,推荐登录工具为putty或者SecureShell
(,绿色版无需安装)
在地址栏输入本集群登录地址(node1相应局域网IP),点击“打开”,就会浮现登录窗口,输入顾客名、密码即可。
文献传播为sftp,与老式ftp类似,但其合同更安全可靠,推荐工具为filezilla。
(,绿色版无需安装)
输入登录地址222.222.21.29,输入顾客名和密码,端口填22(本软件支持ftp,端口为21),点击迅速连接,即可使用,操作办法与惯用ftp工具类似。
2.图形窗口支持
Linux推荐使用vnc。
vnc可以将顾客操作状态保持在服务器端,虽然断开连接也不会影响到正在进行操作、计算等。
登录到linux服务器中,在命令行运营vncserver。
第一次运营时需要输入VNC登陆用密码:
依照提示输入新vnc密码。
此密码与顾客登录密码无关,将在登录vnc时需要。
此处提示node1:
2即为vnc成功打开端口。
运营vncclient,输入登录服务器地址和端标语,点拟定,输入前面设立密码,即进入了图形窗口。
注意:
1、在第一次启动了vncserver之后,vnc连接始终可用,所有图形窗口保持在Linux服务器上。
因而,只在每次服务器重新启动后运营一次vncserver即可,由于顾客较多,请勿启动各种。
2、如果需要使用node2图形界面,可执行ssh-Xnode2。
3.作业提交
3.1.Fluent
3.1.1.图形方式运营
一方面通过VNC登陆到图形界面,如果没有Terminal话在桌面点击左键选取Xterm,输入如下命令即可运营:
此处myhosts为顾客指定host文献,内容如下所示:
node1
node1
node1
node1
node2
node2
node2
node2
-t8即指定8个核心参加计算,分别为node1上4个核心和node2上4个核心。
在图形界面下导入cas和data文献,修改和设立边界条件等并计算(和在windows下操作单机版Fluent相似,略):
注:
通过VNC使用图形界面方式运营fluent时,无需保持PC机与服务器连接,只要vncserver没有重新启动,即可随时连接到原有窗口。
3.1.2.命令行方式运营
建立script1文献:
script1内容如下:
(注:
其中fl5m1.cas为cas文献名,依照实际进行修改;solve/iterate25表达迭代25步,也可依照需要修改步数。
)
用命令行进行fluent计算:
此处myhosts为顾客指定host文献,内容如下所示:
node1
node1
node1
node1
node2
node2
node2
node2
-t8即指定8个核心参加计算,分别为node1上4个核心和node2上4个核心。
3.1.3.作业调度方式运营
注:
PBS只持Fluent命令行运营方式作业提交
1.编译脚本script1,内容如下(与上面脚本运营方式相似):
file/rcdfl5m1.cas.gz
solve/iterate25
/file/wcdfl5m1_final.dat
parallel/timer/usage
exit
yes
2.编辑pbs脚本fluent.pbs,内容如下:
#!
/bin/bash
#PBS-Njob1-8cpu
#PBS-lnodes=1:
ppn=8
#PBS-joe
INPUTFILE=script1
OUTPUTFILE=script1.log
cd$PBS_O_WORKDIR
#
#pib.daplindicateusingibprotocalandtheudaplway.t8indicatesusing
#8processors
#
NP=`cat$PBS_NODEFILE|wc-l`
date
fluent3d-t$NP-cnf=$PBS_NODEFILE-g-i$INPUT>&$OUTPUT
date
exit0
提交作业:
qsubfluent.pbs
用qstat-a和pbsnodes-a以及top命令查看作业与否正常排队运营。
注:
红色字体某些需要依照实际状况改动,黑色字体为固定格式内容。
3.1.4.获取计算成果
1.如果用图形界面方式运营fluent,可以在菜单中选取选取保存dat文献到当前工作目录或其她某个目录下,然后用ftp软件将dat文献下载到终端pc机上,即可进行后解决。
2.如果用命令行方式运营fluent,dat文献自动保存到当前目录,文献名由script1文献内容决定(例如“file/wcdfl5m1_final.dat”则表达dat文献为fl5m1_final.dat),用软件将dat文献下载到终端pc机上,即可进行后解决。
3.2.Ansys作业
3.2.1.图形方式运营
通过vnc登录后来,运营launcher121,即可进入ansys界面,选取有关模块点击run即可。
3.2.2.命令行方式运营
在命令行方式下,不能进行交互图形操作,所有命令需要通过命令流来实现。
假设写好命令流文献为input.inp,运营方式如下:
单节点:
ansys121-np16-iinput.inp>&output.log&
多节点运营:
ansys121-dis-machinesnode1:
16:
node2:
16-iinput.inp>&output.log&
3.2.3.作业调度方式运营
编写一种pbs脚本ansys.pbs如下所示:
#!
/bin/bash
#PBS-joe
###################whatyoujustneedandcouldeditarebetweenthetwolines######################
#PBS-Nmy_ansys_test
#PBS-lnodes=1:
ppn=16
INPUTFILE=wing.inp
OUTPUTFILE=wing.log
###############################################theend##############################################
cd$PBS_O_WORKDIR
np=1
forNODEin`cat$PBS_NODEFILE`;do
host=$NODE
if[!
-z$lasthost];then
if[$host=$lasthost];then
np=`expr$np+1`
else
if[-z$mList];then
mList=$lasthost:
$np
else
mList=$mList:
$lasthost:
$np
fi
np=1
fi
fi
lasthost=$host
done
if[-z$mList];then
mList=$lasthost:
$np
else
mList=$mList:
$lasthost:
$np
fi
ansys121-dis-machines$mList-i$INPUTFILE-o$OUTPUTFILE
写完后来提交方式与fluent相似,qsubansys.pbs即可。
3.3.CFX作业
3.3.1.图形方式运营
在图形窗口中运营cfx5即可。
3.3.2.命令行方式运营
CFX支持PVM和MPI两种方式并行,普通MPI性能更好某些,建议采用。
同步尚有Local和Distributed两种运营模式,单机上建议采用Local模式,而跨节点时只能采用Distributed模式。
cfx5solve命令可直接进入求解模式。
cfx5solve-defBenchmark.def-par-dist'node1*8'
在本机上用8个核心并行
cfx5solve-defBenchmark.def-par-dist'node1*8,node2*8'
采用2个节点各8个核心进行分布式并行计算
3.3.3.作业调度方式运营
[test@node34cfxbm]$catpbs_cfx.ib
#!
/bin/bash
#PBS-NCFX_8cpu
#PBS-lnodes=1:
ppn=8
INPUTFILE=Benchmark.def
OUTPUTFILE=Benchmark.log
##############################################################
##########Youdon'tneedtomodifythelinesbelow##########
##############################################################
PeHostfile2MachineFile()
{
cat$1|whilereadline;do
#echo$line
host=`echo$line`
#addherecodetomapregularhostnamesintoATMhostnames
if[-z$mList];then
mList=$host"*1"
else
mList=$mList,$host"*1"
fi
echo$mList
done
}
CFX_PBS_NODEFILE="/tmp/cfx_`whoami`_$PBS_JOBID"
PeHostfile2MachineFile$PBS_NODEFILE|sed"s#bnode#node#g">$CFX_PBS_NODEFILE
NPROCS=`wc-l$PBS_NODEFILE`
cd$PBS_O_WORKDIR
cfx5solve-def$INPUTFILE-par-dist`tail-n1$CFX_PBS_NODEFILE`
写完脚本就可以按如下方式提交作业:
[test@node34cfxbm]$qsubcfx.pbs
3.4.ABAQUS作业
3.4.1.图形方式运营
在图形窗口中运营abaquscae即可。
3.4.2.命令行方式运营
单节点运营:
abaqus-jBeamloading.inpcpus=8
跨节点运营:
一方面需要添加指定运营节点。
在工作目录进行如下操作:
echo"mp_host_list=[[\‘node1\’,8],[\‘node2\’,8]]">abaqus_v6.env
表达分别从node1、node2调用8个core来进行计算。
设立好了环境变量后来,通过abaqus-jBeamloading.inpcpus=16int来运营。
3.4.3.作业调度方式运营
[test@node34cfxbm]$catpbs_cfx.ib
#!
/bin/bash
#PBS-Nabaqus_job
#PBS-lnodes=2:
ppn=8
#PBS-joe
####changeyourinputfileandjobnamehere####
INPUTFILE=studyQA_std.inp
JOB=`echo$INPUTFILE|cut-d"."-f1`
cd${PBS_O_WORKDIR}
source/public/software/Abaqus-6.9/abaqus.sh
cpus=$(wc-l$PBS_NODEFILE|awk'{print$1}')
mp_host_list="["
fornin$(sort-u$PBS_NODEFILE)
do
mp_host_list="${mp_host_list}['$n',$(grep-c$n$PBS_NODEFILE)],"
done
mp_host_list=$(echo${mp_host_list}|sed-e"s/,$/]/")
echo"mp_host_list=${mp_host_list}">abaqus_v6.env
STARTTIME=`date`
####themainexecutecommand
abaqusjob=${JOB}cpus=${cpus}mp_mode=mpistandard_parallel=allinteractive
ENDTIME=`date`
echo"thejobstartat:
${STARTTIME}"
echo"thejobendat:
${ENDTIME}"
3.5.Web提交
使用IE打开:
8080,并使用相应顾客名和密码登陆,点击作业调度-作业提交
集群名称为唯一选项Cluster_node。
。
。
,队列选取必要是顾客相应允许队列,工作途径为输入文献所在目录,普通为顾客home目录下具有模型文献某一子目录,如test顾客目录下fluent目录中存储了fluent输入文献fluent.jou、fluent.dat、fluent.cas,则工作途径为/cae01/home/test/fluent。
选取命令行提交方式,将前面写好pbs脚本放入输入框中,点击提交,即可将作业提交到相应队列。
4.惯用pbs命令
4.1.qsub命令—提交作业
命令格式:
qsub[-adate_time][-cinterval][-Cdirective_prefix]
[-epath][-I][-jjoin][-kkeep][-lresource_list][-mmail_options]
[-Muser_list][-Nname][-opath][-ppriority][-qdestination][-rc]
[-Spath_list][-uuser_list][-vvariable_list][-V]
[-Wadditional_attributes][-z]
[script]
参数阐明:
由于所采用选项普通放在pbs脚本中提交,因此详细见PBS脚本选项。
例:
#qsubaaa.pbs
提交某作业,系统将产生一种作业号
4.2.qstat命令—查询作业
命令格式:
qatat[-f][-a][-i][-n][-s][-R][-Q][-q][-B][-u]
参数阐明:
-fjobid列出指定作业信息
-a列出系统所有作业
-i列出不在运营作业
-n列出分派给此作业结点
-s列出队列管理员与scheduler所提供建议
-R列出磁盘预留信息
-Q操作符是destinationid,指明祈求是队列状态
-q列出队列状态,并以alternative形式显示
-auuserid列出指定顾客所有作业
-B列出PBSServer信息
-r列出所有正在运营作业
-Qfqueue列出指定队列信息
-u若操作符为作业号,则列出其状态。
若操作符为destinationid,则列出运营在其上属于user_list中顾客作业状态。
例:
#qstat-f211
查询作业号为211作业详细信息。
4.3.qdel命令—删除作业
命令格式:
qdel[-W间隔时间]作业号
命令行参数:
例:
#qdel-W15211
15秒后删除作业号为211作业
setserverdefault_queue=batch"
4.4.PBS脚本文献
PBS脚本文献由脚本选项和运营脚本两某些构成。
(1)PBS作业脚本选项(若无-C选项,则每项前面加‘#PBS’)
-adate_time:
date_time格式为:
[[[[CC]YY]MM]DD]hhmm[.SS]
表达通过date_time时间后作业才可以运营。
-cinterval:
定义作业检查点间隔,如果机器不支持检查点,则忽视此选项。
-Cdirective_prefix:
在脚本文献中以directive_prefix开头行解释为qsub命
令选项。
(若无此选项,则默以为’#PBS’)
-epath:
将原则错误信息重定向到path
-I:
以交互方式运营
-jjoin:
将原则输出信息与原则错误信息合并到一种文献join中去。
-kkeep:
定义在执行结点上保存原则输出和原则错误信息中哪个文献。
keep为o表达保存前者,e表达后者,oe或eo表达两者都保存,
n表达皆不保存。
若忽视此选项,两者都不保存。
-lresource_list:
定义资源列表。
如下为几种惯用资源种类。
cput=N:
祈求N秒CPU时间;N也可以是hh:
mm:
ss形式。
mem=N[K|M|G][B|W]:
祈求N{kilo|mega|giga}{bytes|words}大小内存。
odes=N:
ppn=M:
祈求N个结点,每个结点M个解决器。
-mmail_options:
mail_option为a:
作业abort时给顾客发信;为b:
作业开始运营发信;为e:
作业结束运营时发信。
若无此选项,默以为a。
-Muser_list:
定义关于此作业mail发给哪些顾客。
-Nname:
作业名,限15个字符,首字符为字母,无空格。
-opath:
重定向原则输出到path。
-ppriority:
任务优先级,整数,[-1024,1023],若无定义则为0.
-qdestination:
destination有三种形式:
queue,@server,queue@server。
-ry|n:
指明作业与否可运营,y为可运营,n为不可运营。
-Sshell:
指明执行运营脚本所用shell,须包括全途径。
-uuser_list:
定义作业将在运营结点上以哪个顾客名来运营。
-vvariable_list:
定义export到本作业环境变量扩展列表。
-V:
表白qsub命令所有环境变量都export到此作业。
-Wadditional_attributes:
作业其他属性。
-z:
指明qsub命令提交作业后,不在终端显示作业号。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 曙光 集群 用户 使用手册 样本