OPVSuite 维护一本通V10.docx
- 文档编号:24349763
- 上传时间:2023-05-26
- 格式:DOCX
- 页数:12
- 大小:202.11KB
OPVSuite 维护一本通V10.docx
《OPVSuite 维护一本通V10.docx》由会员分享,可在线阅读,更多相关《OPVSuite 维护一本通V10.docx(12页珍藏版)》请在冰豆网上搜索。
OPVSuite维护一本通V10
一、虚机篇
1.1虚拟机测试常见问题
1.1.1虚机操作过程中出现Error定位方法
虚机在操作过程中出现错误状态时,一般进入虚机概览页鼠标移动至黄色叹号位置查看显示错误信息可简单分析原因,分为以下情况:
情况1:
存储池空间不足--进入存储池概览页查看存储池空间使用情况
情况2:
网络资源不足--查看虚机使用的vlan网络,进入网络页面,选择vlan网络关联的vdhcp范围是否存在可用IP
情况3:
通过页面无法分析具体原因的情况:
比如“虚机在创建时发生警告”、“重配置虚机发生不能更换镜像的错误”、“添加网络失败”、“此实例在数据库中但未在集群中”“虚机在启动时发生警告”等等
针对情况3出现的一些无法通过页面分析原因的问题,整理如下方法及排除错误步骤:
NO.1OZSC相关日志查看(只有一台主机启动该服务):
1、使用opzooncloud-test-services|grepozsc或者pingsite命令查看ozsc服务所在主机
2、ssh登录该集群服务节点
3、使用命令cat/var/log/messages|grep“d.ozsc”|grepERR>d.ozsc日志
4、页面上可以将虚拟机的uuid复制出来(vm的uuid可通过url地址得到)
5、使用vim命令打开d.ozsc日志输入虚拟机的uuid,查看具体虚拟机的错误日志
NO.2OZCC(集群服务)相关日志查看(每个集群启动一台):
1、使用opzooncloud-test-services|grepozcc命令查看集群服务所在主机
2、根据虚拟机所在集群,ssh登录该集群服务节点
3、使用命令cat/var/log/messages|grep“d.ozcc”|grepERR>d.ozcc日志
4、页面上可以将虚拟机的uuid复制出来
5、使用vim命令打开d.ozcc日志输入虚拟机的uuid,查看具体虚拟机的错误日志
NO.3Ozhost(主机服务)相关日志查看(每个主机均启动该服务):
1、ssh登录虚拟机所在主机节点
2、使用命令cat/var/log/messages|grep“d.ozhost”|grepERR>d.ozhost日志
3、页面上可以将虚拟机的uuid复制出来
4、使用vim命令打开d.ozhost日志输入虚拟机的uuid,查看具体虚拟机的错误日志
注意:
以上日志的查看仅限于当前时间点的查看,如果虚拟机错误或者创建时间的日志不在当前时间范围内,查看日志的命令为zcat/var/log/messages-20160424T1601.gz,其他均不变
OZHOST常见错误信息:
1.1.1.1磁盘空间不足出现error
NOspacedisk---代表主机空间不足,可以使用df-h查看主机/mnt/ozhost剩余空间
1.1.2创建的虚机一直处于开机中状态
分析原因:
可能由于镜像文件过大导致解压过程较慢,或者磁盘I/O较高影响镜像解压导致
排查步骤:
NO.1ssh登录环境中一台节点
NO.2使用命令psaux|grepgzip查看是否存在解压进程
如上图存在解压进程,继续等待即可
NO.3如果解压进程已不存在,需具体定位
1.1.3虚机HA迁移失败
HA的触发服务为ozhb(heartbeat),ozhb服务判断是否有需要进行HA的虚拟机。
HA动作是由ozsc完成的(共享存储)
HA失败的原因有很多,其中最有可能的是分布策略是出现问题,此问题包括HA目标节点cpu,ram不足,HA迁移节点没有FC等。
2、存储篇
2.1存储常见问题
2.1.1存储池添加/发现失败
存储池添加失败分析原因:
可能由于存储池IP地址不通、Iscsi存储池IP地址与对应的target号是否一致、iscsiadm登录失败、OZSE端数据处理异常
排查步骤:
NO.1PING要添加存储的IP地址
NO.2使用iscsiadm-mdiscovery-tst-p查看存储池IP对应的target号
NO.3使用iscsiadm-mnode-TLUN_NAME-pISCSI_IP-l验证是否正常登录
NO.4找到存储服务所在节点--pingozstoc
NO.5cat/var/log/messages|grep“d.ozstoc”|grepERR|grep“pool_uuid”查看具体日志信息,如果OZSE端数据处理异常会返回相应的result结果
存储池发现失败分析原因:
可能由于要发现存储池下不存在存储卷,该情况下会导致存储池发现失败
排查步骤:
NO.1找到存储服务所在节点--pingozstoc
NO.2cat/var/log/messages|grep“d.ozstoc”|grepERR|grep“pool_uuid”查看具体日志信息,如果OZSE端数据处理异常会返回相应的result结果
2.1.2存储卷添加/格式化/扩容失败
排查步骤:
NO.1找到存储服务所在节点--pingozstoc
NO.2cat/var/log/messages|grep“d.ozstoc”|grepERR|grep“lv_uuid”查看具体日志信息,如果OZSE端数据处理异常会返回相应的result结果
2.1.3备份文件添加失败
备份过程:
1、先确定要备份的存储卷挂载的虚机所在node
2、Ssh登录该node,在该node上执行backtool脚本,该脚本包括两部分:
一是检查远端nfs路径是否有效,二是执行mount远端目录到虚机所在主机
3、备份结束后,执行umount远端备份池,删除本地挂载目录
存储卷进行备份的服务:
ozbackup服务
NO.1确定失败的备份文件名称、备份文件失败的时间点、备份文件所属的备份池
NO.2ssh登录环境中任一台节点,通过pingozbackup找到备份服务所在节点
NO.3ssh登录该节点,使用cat/var/log/messages|grep“d.ozbackup”|grepERR>ERR.txt重定向到一个文件中,使用vim命令输入备份文件的uuid查看具体日志信息
举例:
2016-05-03T15:
59:
05.575962+08:
0024-b8-d2-ff-27-18ERR[__main__.4854]--[backup_tool.454]Savebackupfileinfoerror,err_msg:
[Errno2]Nosuchfileordirectory:
'backup20160503140831_1462255711'
结论:
在挂载目录下找不到备份文件,怀疑qemu-img执行没成功,未生成备份文件
2.1.4备份文件添加失败:
挂载失败
存储卷进行备份的服务:
ozbackup服务
NO.1确定失败的备份文件名称、备份文件失败的时间点、备份文件所属的备份池
NO.2ssh登录环境中任一台节点,通过pingozbackup找到备份服务所在节点
NO.3Mountfailed日志需要查执行backup_tool脚本的错误日志,ssh登录备份存储卷挂载的VM所属的节点去查询日志:
zcat/var/log/messages-20160425T1001.gz|grepbackup_tool>/root/backup_tool.txt
举例:
在VM所在node:
20.2.35.12
2016-05-03T17:
51:
30.463458+08:
0024-b8-d2-ff-27-18INFO[__main__.24059]--[backup_tool.155][_backup_error_callback]status:
AddFailed,failurevalue:
24-09-010:
Mountfailed
3、镜像篇
3.1镜像常见问题
3.1.1镜像上传一直卡在执行中,请等待页面
3.1.2镜像上传过程中未看到失败信息,但镜像列表未显示
镜像上传过程中先经过“执行中,请等待”阶段,接下来往ozdt上传数据,使用过程中经常出现未看到失败提示信息,最终镜像列表未显示出该镜像,常见如下几种情况:
情况1:
非.gz格式的image镜像上传到镜像列表(比如tar.gz格式)
情况2:
docker格式的镜像以非docker格式上传至镜像列表
其他情况上传失败等具体定位步骤:
NO.1找到Ozdt服务所属主机节点--pingozdt
NO.2使用cat/var/log/messages|grep“d.ozdt”查看ozdt日志搜索关于该镜像信息
四、网络篇
4.1网络常见问题
4.1.1查看web配置qos是否成功并准确下发
查看输入流量的qos策略
1ssh登录node,使用ovs-vsctllistinterface
0代表qos策略为禁用
否则的话就是对于的qos的平均带宽和突发大小的值
查看输出流量的qos策略
ssh登录node,使用ovs-vsctllistport,查看虚拟机对应的qos策略
使用ovs-vsctllistqos+上图所示的uuid
使用ovs-vsctllistqueue上图所示的queue的uuid,查看qos策略
使用ovs-vsctllistport-group,查看端口组
4.1.2web页面acl配置显示错误
1pingozvdsc,查看ozvdsc服务所在node
2cat/var/log/messages|grepdispatch查看错误日志
5、安装&升级篇
5.1安装&升级常见问题
5.1.1Node从pxe启动安装时获取到ip安装完成重启后的ip不一致
定位步骤:
NO.1确定安装的主机有几块物理网卡,以及网卡mac地址
NO.2找到dhcp服务所在的node,可直接连接.6地址,ssh20.2.34.6
NO.3进入gluster挂载的卷cd/mnt/glusterfs/distribute
NO.4找到dhcpd.leases文件,使用Vi编辑命令找到两个ip对应的mac地址是否相同
NO.5找出两个mac地址对应的物理网卡
5.1.2系统安装过程中一直卡在40%
定位步骤:
NO.1使用zookeeper-clientls/验证zookeeper集群是否可用
NO.2ssh登录环境中已安装完成的两台主机,使用ps-aux|grepzookeeper查看zookeeper进程--两台主机启动同一个zookeeper进程
NO.3一般卡在40%情况主要由于环境中启动2台种子节点
6、环境访问异常篇
6.1环境访问异常常见问题
6.1.1opv环境web页面无法访问(db、tomcat、api服务)
定位步骤:
NO.1检查master是否正常启动:
pingmaster
NO.2查看zookeeper集群所在主机:
cat/etc/hosts
NO.3使用命令验证zookeeper集群是否可访问:
zookeeper-clientls/
NO.4查看master相关日志查看信息tail-f/var/log/messages|grepozsd.master
6.1.2环境访问速度过慢
NO.1使用TOP命令查看主机负载:
top
NO.2查看主机负载占用较高的进程分析原因
NO.3查看node内存情况:
cat/proc/meminfo
五、常用命令详解
系统相关命令
1、底层登录口令:
root/Opzooncloud123
2、查看系统磁盘分区:
df-h
/dev/mapper/opzooncloud-root操作系统使用
/dev/mapper/opzooncloud-log系统日志
/dev/mapper/opzooncloud-mongodb数据库使用
/dev/mapper/opzooncloud-glusterfs_client_distribute.volGFS使用
/dev/mapper/opzooncloud-glusterfs_client_replicate1.volGFS使用
/dev/mapper/opzooncloud-glusterfs_client_replicate2.volGFS使用
/dev/mapper/opzooncloud-glusterfs_client_replicate3.volGFS使用
/dev/mapper/opzooncloud-images本地存储及从HDFS下载的image镜像
/dev/mapper/opzooncloud-upload上传镜像使用(传到HDFS前的中转站)
3、查看命令
a)pingservice【api、master、zookeeper、mongo、ozstoc、ozdt~】
b)ps-ef|grepservice/opzooncloud-test-service【ozsd、dns、kvm】
c)查看zookeeper主机:
cat/etc/hosts
d)查看日志:
cat/var/log/messages
e)查看网卡绑定模式:
cat/proc/net/bonding/bond0
f)查看系统配置:
cat/etc/opzooncloud/site.conf
g)查看系统版本:
cat/etc/opzooncloud/version.txt
h)主机系统服务:
/etc/opzooncloud/ozsd/服务名称status|stop|start|restart
4、test-service
位置:
/usr/lib/opzooncloud/test-service
7、Tcpdump
Tcpdumphosthostname/ip-ibond0
类型:
Host/net/port
方向:
Src/dst/dstorsrc/dstandsrc
协议:
Tcp/icmp/udp
参数-i:
指定网口
虚拟机相关命令
1、Virsh
查看虚机列表:
virshlist
查看虚机配置文件:
virshdumpxmlID
2、检查一个虚拟机是否可用
ping-q-i0.2-w1-c1192.188.60.11
存储相关命令
1、Iscsiadm
发现iscsi存储:
iscsiadm-mdiscovery-tst-pISCSI_IP
登录iscsi存储(挂载到本地):
iscsiadm-mnode-TLUN_NAME-pISCSI_IP–l
登出iscsi存储(从本地卸载):
iscsiadm-mnode-TLUN_NAME-pISCSI_IP–u
查看成功登陆后的iscsi盘:
ll/dev/disk/by-path
查看当前所连接的ISCSI:
iscsiadm-msession
退出所有session:
Iscsiadm–msession–u
查看iscsi发现记录:
iscsiadm-mnode
2、Multipath
查看multipath映射:
multipath-l
重新加载multipath:
multipath-r
输出multipath调试信息:
multipath-v3
查看dm映射:
ll/dev/mapper/
网络相关命令
1、brctl
查看桥和端口信息:
brctlshow
2、iptables
关闭iptables:
iptables-F
查看iptables详细信息:
iptables-vnL
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- OPVSuite 维护一本通V10 维护 V10