我的编程空间,编程开发者的网络收藏夹
学习永远不晚

LVM故障导致RHCS启动故障

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

LVM故障导致RHCS启动故障

1、故障提示

抓取资源管理日志发现提示如下错误

tail -f /var/log/cluster/rgmanager.log

May  6 18:21:24 yktdb1 rgmanager[17425]: State change: Local UP

May  6 18:21:24 yktdb1 rgmanager[17425]: Starting stopped service service:yktoracle

May  6 18:21:24 yktdb1 rgmanager[18533]: [lvm] HA LVM:  Improper setup detected

May  6 18:21:24 yktdb1 rgmanager[18555]: [lvm] * "volume_list" not specified in lvm.conf.

May  6 18:21:24 yktdb1 rgmanager[17425]: start on lvm "yktoracledb" returned 1 (generic error)

May  6 18:21:24 yktdb1 rgmanager[17425]: #68: Failed to start service:yktoracle; return value: 1

May  6 18:21:24 yktdb1 rgmanager[17425]: Stopping service service:yktoracle

May  6 18:21:25 yktdb1 rgmanager[18586]: [script] Executing /etc/init.d/dbora stop

May  6 18:21:25 yktdb1 rgmanager[18682]: [fs] stop: Could not match /dev/yktoracledb/oracledblv with a real device

May  6 18:21:25 yktdb1 rgmanager[18720]: [lvm] HA LVM:  Improper setup detected

May  6 18:21:25 yktdb1 rgmanager[18742]: [lvm] * "volume_list" not specified in lvm.conf.

May  6 18:21:25 yktdb1 rgmanager[18778]: [lvm] Deactivating yktoracledb/oracledblv

May  6 18:21:25 yktdb1 rgmanager[18800]: [lvm] Making resilient : lvchange -an yktoracledb/oracledblv

May  6 18:21:25 yktdb1 rgmanager[18825]: [lvm] Resilient command: lvchange -an yktoracledb/oracledblv --config devices{filter=["a|/dev/mapper/LUN-1800G|","a|/dev/mappe

May  6 18:21:26 yktdb1 rgmanager[17425]: Service service:yktoracle is recovering

May  6 18:21:26 yktdb1 rgmanager[17425]: #71: Relocating failed service service:yktoracle

May  6 18:21:26 yktdb1 rgmanager[17425]: Service service:yktoracle is stopped

May  6 18:21:35 yktdb1 rgmanager[17425]: State change: 192.168.10.2 UP

May  6 18:21:35 yktdb1 rgmanager[17425]: Starting stopped service service:yktoracle

May  6 18:21:36 yktdb1 rgmanager[18886]: [lvm] HA LVM:  Improper setup detected

May  6 18:21:36 yktdb1 rgmanager[18908]: [lvm] * "volume_list" not specified in lvm.conf.

May  6 18:21:36 yktdb1 rgmanager[17425]: start on lvm "yktoracledb" returned 1 (generic error)

May  6 18:21:36 yktdb1 rgmanager[17425]: #68: Failed to start service:yktoracle; return value: 1

May  6 18:21:36 yktdb1 rgmanager[17425]: Stopping service service:yktoracle

May  6 18:21:36 yktdb1 rgmanager[18939]: [script] Executing /etc/init.d/dbora stop

May  6 18:21:36 yktdb1 rgmanager[19035]: [fs] stop: Could not match /dev/yktoracledb/oracledblv with a real device

May  6 18:21:36 yktdb1 rgmanager[19073]: [lvm] HA LVM:  Improper setup detected

May  6 18:21:37 yktdb1 rgmanager[19095]: [lvm] * "volume_list" not specified in lvm.conf.

May  6 18:21:37 yktdb1 rgmanager[19131]: [lvm] Deactivating yktoracledb/oracledblv

May  6 18:21:37 yktdb1 rgmanager[19153]: [lvm] Making resilient : lvchange -an yktoracledb/oracledblv

May  6 18:21:37 yktdb1 rgmanager[19178]: [lvm] Resilient command: lvchange -an yktoracledb/oracledblv --config devices{filter=["a|/dev/mapper/LUN-1800G|","a|/dev/mappe

May  6 18:21:37 yktdb1 rgmanager[17425]: Service service:yktoracle is recovering

May  6 18:21:37 yktdb1 rgmanager[17425]: #71: Relocating failed service service:yktoracle

May  6 18:21:39 yktdb1 rgmanager[17425]: Service service:yktoracle is stopped

查看lvdiskplay  对应的oracledblv 状态提示 Not available

在/dev/yktoraclevg/下面竟然没有这个oracledblv

除非把clvmd停止后才这个在/dev/yktoarclevg/里就可以看了

查了好多资料都不知道怎么回事

查到一个service clvmd status 后发现 集群 vg和lv都是显示none

这一下让我找到了问题所在

直接用命令vgchange -cy yktoracledb 

在查看service clvmd status 

[root@yktdb1 ~]#   service clvmd status

clvmd (pid  7550) 正在运行...

Clustered Volume Groups: yktoracledb

Active clustered Logical Volumes: oracledblv ysbaklv test

[root@yktdb1 ~]# 

已经可以看见集群共享的vg和lv了

在查看集群状态正常了服务也启动了,然后对这个两个节点测试是否可以正常切换。

[root@yktdb1 ~]# clustat 

Cluster Status for ytkcluter @ Sun May  7 11:53:49 2017

Member Status: Quorate


 Member Name                                                 ID   Status

 ------ ----                                                 ---- ------

 192.168.10.1                                                    1 Online, Local, rgmanager

 192.168.10.2                                                    2 Online, rgmanager


 Service Name                                       Owner (Last)                                       State         

 ------- ----                                       ----- ------                                       -----         

 service:yktoracle                                  192.168.10.1                                       started   


免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

LVM故障导致RHCS启动故障

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

故障分析 | binlog flush 失败导致的 Crash

一、问题现象某项目上出现 MySQL Crash,相关 errorlog 日志如下,从日志可以看出是 binlog error 导致的问题,但是无法确认具体原因,网上大部分资料都说是由于空间已满导致,后来在系统日志(/var/log/message)中确实找到
故障分析 | binlog flush 失败导致的 Crash
2018-07-03

怎么分析pymysql非线程安全导致的故障

今天就跟大家聊聊有关怎么分析pymysql非线程安全导致的故障,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。mysqldb 这个python 驱动只支持到 python 2 .
2023-06-03

Windows 98启动与关闭故障解决

作者: 谢浩   Windows 98的界面友好、功能强大,但在使用中也常会出现各种各样的问 题,如系统不能正常启动或关闭。这有时是因为系统文件感染了病毒,我们可以 借助杀毒软件轻松解决。但更多却是因为系统设置不当或某些文件损坏引起
2023-05-23

因为路由所导致的故障及其解决问题

  路由(routing)是指分组从源到目的地时,决定端到端路径的网络范围的进程。路由工作在OSI参考模型第三层--网络层的数据包转发设备。路由器通过转发数据包来实现网络互连。今天小编要给大家分享一篇教程,那就是:因为路由所导致的故障及其解决问题。  一、故障发生  小编所在公司在全国每一个地方都有分公司的,网络主要就
因为路由所导致的故障及其解决问题
2024-04-18

Win10安装更新导致系统故障的解决方法

Win10预览版发布后,很多热爱Windows的用户就甘当微软小白鼠php,但是对于微软推送的更新,用户安装后就会出现系统无故崩溃的现象。以彼之道还施彼身。既然是更新惹的祸,就卸载更新了。通常我们可以在程序的更新管理中android卸载更新
2023-06-09

云服务器常见故障有哪些原因导致的

云服务器是一种虚拟服务器,可以让用户将数据存储在服务器上,并在需要的时候从服务器上提取数据。下面是常见的云服务器故障以及其可能原因:系统故障:云服务器是由许多服务器、存储设备和网络连接组成的集群系统。一旦云服务器出现故障,就会导致大量数据丢失和服务中断。这种故障可能发生在任何设备或系统上,如服务器、存储设备、网络连接或操作系统。配置错误:如果服务器配置错误,例如将一个数据库作为存储服务提供,这可能会导致数据...
2023-10-27

编程热搜

目录