TSM日常维护手册.docx
- 文档编号:24846827
- 上传时间:2023-06-02
- 格式:DOCX
- 页数:17
- 大小:137.07KB
TSM日常维护手册.docx
《TSM日常维护手册.docx》由会员分享,可在线阅读,更多相关《TSM日常维护手册.docx(17页珍藏版)》请在冰豆网上搜索。
TSM日常维护手册
xx
TSM数据备份项目
日常维护手册
xxxxxx科技有限公司
目录
前言
本文档是TSM巡检操作手册,常见问题的处理和日常维护。
TSM巡检操作手册
1.1查看TSM服务器
查看TSM服务器和ADIC带库的连接状态,如下图为正常:
主要为其它设备可以看到ADIC的SNC,介质变换器,磁带驱动器都有设备显示。
1.2查看TSMmanageconsole
在"开始"菜单--〉"程序"--〉"TivoliStorageManager"中选择运行"ManagementConsole":
可以看到带库和驱动器的信息。
1.3在TSM服务器上登录到管理界面
在cmd的窗口里进入到TSM的安装目录baclient下
运行dsmadmc,输入口令/密码admin/admin进入管理员界面
1.4在TSMclient端检查
检查lanfree的进程,使用命令:
#ps–ef|grepdsmsta
如果进程没有启动,需要启动这个进程,方法:
IBM服务器的路径/usr/tivoli/tsm/StorageAgent/bin
#nohup./dsmsta&
HP服务器的路径/opt/tivoli/tsm/StorageAgent/bin
#nohup./dsmsta&
TSM常见问题的处理
在解决问题的过程中,需要具体问题具体分析,首先需要检查各种错误日志,定位问题,然后参考以下解决问题的办法,同时也可直接联系800技术支持热线,寻求专业的技术支持。
1.5TSMServer的故障处理
1.5.1所有的备份和恢复操作都无法进行
问题描述
TSMServer启动正常,但所有的备份和恢复操作都无法进行。
问题处理建议
检查TSM本身的数据库是否已满?
>querydatabase
1.5.2如何获得TSM错误描述
问题描述
在TSM的日志中发现有类似ANR7800I的错误信息,如何得到该错误号的详细描述。
问题处理建议
使用TSM的文档查找错误描述,或直接使用命令查找:
>help7800
1.5.3系统出现无法读写磁带或磁盘的故障
问题描述
在日常备份过程中或TSM日志中出现无法读写磁带或磁盘的故障。
问题处理建议
检查磁带库是否正常?
TSM>qlibrary;查看是否Online状态;
检查驱动器是否正常?
TSM>qdrive;查看是否Online状态;
检查磁带是否正常?
TSM>qlibvolume;查看磁带状态;看是否是读写状态。
TSM>qvolf=d;查看磁带状态;看是否是读写状态。
检查Path是否正常?
TSM>qpath;看online是否为yes?
检查详细的TSM活动日志
TSM>QUERYACTLOGBEGINTIME=NOW-30ENDTIME=NOW
检查操作系统下关于设备的日志。
在操作系统下检查设备状态;
AIX:
lsdev–Cctape
1.5.4处理带库故障后TSM工作不正常。
问题描述
当带库出现故障后,如更换driver后,TSM工作不正常。
问题处理建议
按照配置步骤重新检查path,drive的定义、状态
检查磁带机的s/n号。
1.5.5atapeinlibrarydoesnotdisplayinqlibv
问题描述
atapeinlibrarydoesnotdisplayinqlibv。
问题处理建议
checkinlibvlibnamesearch=yescheckl=bstatus=scr
1.5.6reclaimprocessnotrun
问题描述
reclaimprocessnotrun,checkstgpoolreclaimthreashold,thevaluewas100
问题处理建议
modifythreasholdlessthan100
1.5.7howtodeletearchivelogfilesafterbackup
问题描述
howtodeletearchivelogfilesafterbackup
问题处理建议
usingrmandeleteinputalloption
1.5.8windowsdevicemanager,foundadrivemarkasyellow
问题描述
Inwindowsdevicemanager,foundadrivemarkasyellow,somanyoperationsisnotsuccessful.
问题处理建议
重起TSM服务器?
重新安装librarydriver?
重起TapeLibrary?
1.6TSMClient的故障处理
1.6.1TSMClient无法连接TSMServer
问题描述
TSMClient无法连接TSMServer。
问题处理建议
检查服务器配置文件,并检查服务器是否绑定配置文件中规定的端口?
查看服务器的状态(QueryStatus)确保设置好了"Availability:
Enabled";
检查客户端配置文件中端口号和IP地址是否与服务器端一致;
检查节点是否被服务器端锁定(LOCK);
系统管理员检查网络状况和服务器的内存利用状况,如果内存不够用了,则新的连接肯定无法建立。
1.6.2TSMClient备份大文件时经常不成功
问题描述
TSMClient在备份大文件时经常报如下错误,但备份小文件没有问题:
2006-03-1311:
50:
37ANS1005E在套接字=636处TCP/IP读取错误,错误号=10035,原因:
无法立即完成一个非阻挡性套接字操作。
2006-03-1311:
50:
37ANS1809W会话丢失;正在初始化会话的再打开过程。
2006-03-1311:
50:
53ANS1811STSM会话无法重建。
问题处理建议
检查服务器端dsmserv.opt中有一项IDLETimeout、Commtimeout设置,调大后进行测试。
(注:
要求TSMServer和storageagent端设置一致)。
1.6.3ANS1312Eerrorindsmerror.log
问题描述
ANS1312Eerrorindsmerror.log
问题处理建议
deleteoldpathre-define
1.6.4whenbackupdata,error:
mediacannotmount
问题描述
whenbackupdata,error:
mediacannotmount
问题处理建议
re-definedrivepath,auditlibrary
1.6.5ANR8779EUnabletoopendrivemt0.3.0.3,errornumber=170
问题描述
OnWindows,actlog,ANR8779EUnabletoopendrivemt0.3.0.3,errornumber=170.
问题处理建议
检查library状态。
检查path,发现pathoffline,无法online。
在操作系统下删除设备,重新识别?
重新定义path。
日常维护
1.7启动和停止TSM服务器
启动TSM服务器
系统中,TSMServer作为一项系统服务已设置为在系统启动时自动启动。
停止TSM服务器
停止TSM服务器操作步骤为:
1.运行dsmadmc,输入口令/密码admin/admin进入管理员界面
2.禁止服务器接收新的客户端访问TSM>disablesessions
3.查看当前客户端与服务器的连接TSM>querysession
4.等待客户端结束备份或直接中断连接TSM>cancelsessionXX(all)
5.查看服务器进程TSM>queryprocess
6.等待服务器进程结束或直接中断进程TSM>cancelprocess
qmount检查是否有磁带被使用。
qrequest检查是否有需要人工干预的操作。
7.停止服务器TSM>halt
1.8进入管理员界面
字符界面访问
在TSM服务器上运行dsmadmc,输入管理员ID,密码。
1.9进入TSMclient文件备份/恢复界面
字符界面访问
在TSM客户端运行dsmc输入密码。
GUI界面访问
在TSM客户端运行dsmj,点击backup/restore按钮既可。
要求有图形支持。
1.10管理数据库和日志
查看tsm数据库和日志使用率
查看数据库使用率,使用命令为TSM>querydb,查看PctUtil项是否接近100。
查看日志使用率,使用命令为TSM>querylog,查看PclUtil项是否接近100。
扩充数据库和日志容量
如PctUtil接近100,则必须扩充容量,扩数据库为:
TSM>definedbvolumedsmdb02.dsmformatsize=XXwait=yes
TSM>extenddbXX
扩日志容量为:
TSM>definelogvolumelog03formatsize=XXwait=yes
TSM>extendlogXX(XX为大小,例如200代表200MB.)
扩充之后,用querydb和qlog查看扩充后PctUtil的值。
1.11管理磁带库
由于TSM对磁带库以独占方式访问,所以,在TSMServer运行的时候,不要用任何其他命令或方式对磁带库进行操作,以免冲突。
1.11.1查看带库中磁带驱动器状态:
在磁带驱动器状态正常情况下,TSM才能正常的备份数据。
TSM>querydrive查看磁带驱动器状态,其中OnLine列应皆为Yes,表明磁带驱动器可以使用。
若TSM启动后观察到OnLine项不为Yes,检查磁带库是否已上电,或者请求IBM支持。
1.11.2磁带的分配:
磁带的分配是自动的,系统中有2个存储池,某个池需要磁带时,系统就会从当前的空闲磁带目录中分配磁带给它。
1盘供TSM备份自身数据库。
由于已在设定存储池(stgpool)时指定MaxScratch,所以其余带子可以需要时自动加入。
向磁带库中增加新的供TSM使用的磁带
1.在磁带库I/O槽中放入新磁带。
2.labellibvolumeLIBRARY(这里是使用qlibrary查看到的磁带库名称)A000XXX(这里是使用qlibvol查看到的磁带的名称)overwrite=yescheckin=scratch
参考labellibvolume3584libsearch=yeslabelsource=barcheckin=scratchoverwrite=yes
3.tsm:
TSM>qactlog
4.tsm:
TSM>TSM>reply2
5.将磁带从带库中取出
TSM>checkoutlibvlibnamea00047
1.11.3检查活动日志,有可能要求作出回应,
TSM>qrequest
TSM>reply1label=a00047
1.11.4查看磁带上的备份内容:
在TSM字符管理界面下运行:
TSM>qcontentTAPE_LABEL
其中TAPE_LABEL为备份使用的磁带标签,可用qvol或qlibvolume看到。
所看到的文件名格式为
所以也可以通过这里知道要恢复的备份的时间戳。
1.11.5从磁带库中取出已使用的磁带放到异地保存:
TSM>checkoutlibvolumeLIBRARY(这里是使用qlibrary查看到的磁带库名称)TAPE_LABELremove=yes
然后从磁带库前面的I/O窗口中取出退出的磁带妥善保存。
这时用qvol命令可以看到这盘磁带的信息,但用qlibvolume看不到。
1.11.6将取出的磁带重新放入磁带库中:
将欲放回的磁带放入前面的I/O窗口中,注意条码一边向内。
TSM>checkinlibvolumeLIBRARY(这里是使用qlibrary查看到的磁带库名称)search=bulkstatus=private
1.11.7向磁带库中增加新的供TSM使用的磁带:
将欲放回的磁带放入磁带库前面的I/O窗口中,注意条码一边向内。
TSM>labellibvolumeLIBRARY(这里是使用qlibrary查看到的磁带库名称)search=bulklabelsource=barcodecheckin=scratch
1.11.8将新磁带添加到storagepool中(可选)
TSM>definevolumePOOL_NAMETAPE_LABEL
1.11.9重复利用磁带库中的磁带
1.自动重复利用
当以前的备份随时间流逝而过期,磁带上相应的空间会腾空,但由于磁带属于流设备,只要后面还有数据存在,前面的空闲空间就不可使用。
缺省状态下,当一盘磁带上这样的可回收空间达到90%时,TSM会自动将这盘磁带上的全部数据转移到同一存储池的另一盘有足够可用空间的磁带上,使这盘磁带可以被重复利用。
这种方式不需要人工干预。
2.快速重复利用
如果用qcontent命令查看某盘磁带上的备份内容后,认为这些备份数据都可以删除了,我们就能快速清空这盘磁带,使它可以被重复利用。
TSM>deletevolTAPE_LABELdiscarddata=yes
TSM>definevolumePOOL_NAMETAPE_LABEL
1.12管理磁带库存储池
查看数据存储池利用率:
例如vobpool:
TSM>querystgpoolvobpoolformat=detail
PctUtil的值表示其利用率。
1.13管理客户端节点
1.13.1删除一个客户端节点
删除一个客户端节点,只需在服务器上将节点删除,但必须要有足够权限。
1.除该节点在服务器端的数据,使用命令:
TSM>deletefilespaceNODENAME*wait=yes
2.节点定义,使用命令TSM>removenodeNodename
1.13.2修改节点密码
使用命令:
TSM>updatenodeNodenameNewPasswd
1.14定时备份维护
1.14.1TSMClien/TDP节点定时备份守候进程
1.后台启动定时器:
#cd/usr/tivoli/tsm/client/ba/bin
#nohupdsmcschedule-se=***-password=***2>/dev/null&
2.以在/etc/inittab中加入如下行使其自动启动。
Tsm:
:
once:
/usr/bin/dsmcschedule-se=***-password=***>/dev/null2>&1#TSMScheduler
1.14.2客户端停止定时备份
(1)ps-ef|grepdsmc|grepschedule得到所有dsmcschedule进程号。
(2)kill-9将其中止。
1.14.3查看定时备份日志
dsmsched.log,该文件存在运行dsmcschedule命令的目录。
1.15建立策略域(PolicyDomain)
策略域定义备份保存的版本及版本保存的时间,是TSM存储管理的核心。
1.NDARD策略域COPY为一个新的策略域。
3.修改BackupCopyGroup属性,指定StoragePool、对象存在时保留版本数(Verexist)、对象删除后保留版本数(Verdeleted)、额外版保留天数(Retextra)、最后版本保留天数(Retonly)。
4.检验,激活上述配置。
1.16监控TSMServer运行情况
使用querystatus命令查看server当前状态。
使用queryactlog命令查看近期内服务器和客户端的活动。
可以设定具体的查看时间段。
使用queryvolhisttype=dbbackup查看TSM服务器数据库备份情况。
使用queryevent命令查看客户定时器状态,成功、失败或将来状态。
使用queryeventtype=admin命令查看TSM服务器定时器状态,成功、失败或将来状态。
查看/usr/Tivoli/tsm/server/bin/dsmerror.log和dsierror.log中的出错信息。
查看客户端的/usr/Tivoli/tsm/client/ba/bin/dsmsched.log中定时备份的信息。
可以使用dsmadmc-consolemode命令开一个窗口,窗口中会记录服务器和客户端的活动情况。
使用querycontentA00047(这里是使用qvol查看到磁带卷名称)查看磁带中的备份内容。
IBM客户支持服务流程
IBM电话支持流程提供5x8小时及7x24小时(仅限"严重程度一"的问题)远程电话支持。
工作时间内(每周一至五,上午8:
30到下午17:
00),对于客户报告的技术问题,工程师将在收到客户电话后两小时内予以响应。
非工作时间内,对客户报告的"严重程度一"的技术问题,工程师将在收到客户电话后两小时内予以响应。
IBM软件产品售后问题申请与解决流程主要包括三个阶段:
客户技术支持流程图
第一阶段:
向客户问题协调员提供一下信息:
您的基本信息,包括姓名、公司名称和联系电话
贵公司客户号
客户号:
IBM客户问题协调员将对您的信息进行登记,并转接给相应的IBM软件技术支持工程师。
第二阶段:
向IBM软件技术支持工程师提供:
产品相关信息,包括产品版本号、补丁级别、操作系统及版本号、产品相关配置信息;
其他相关信息,如网络配置信息,数据库信息和应用系统信息等;
错误描述,如发生频率、引起错误的相关操作、重现错误的步骤、错误现象、错误日志信息等。
我们的工程师将协助您分析问题的原因,采取相应解决措施。
第三阶段:
当您的技术问题需要更多资源协同解决时,该问题申请将自动进入本阶段。
由IBM首层技术工程师协调IBM全球技术资源,并向客户提交最终解决方案。
常用TSM命令
qvol:
查询存储池中的卷
qnode:
查询结点
qlibrary:
查询带库
qdrive:
查询驱动器
qlibvol:
查询带库中的卷
qstgpool:
查询存储池
qdevclass:
查询设备类
qsess:
查询会话
qmount:
查询驱动器加载磁带情况
qconxxx:
查询xxx卷中的内容
qact:
查看活动日志
qstatus:
查看服务器信息
qprocess:
查看活动进程
f=d
regnodenodenamepassword:
注册结点
definelibrary….:
定义带库
definedrive:
定义驱动器
definepath:
定义路径
definestgpool:
定义存储池
definedevclass:
定义设备类
labelvol:
标号磁带
checkin:
检入磁带
checkout:
检出磁带
helpxxx:
获取相应命令的使用帮助
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- TSM 日常 维护 手册