我的编程空间,编程开发者的网络收藏夹
学习永远不晚

linux主机宕机排查问题方法

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

linux主机宕机排查问题方法

1 排查思路

1.1 查看宕机的时间记录和历史登陆还有重启时间

1)查看历史重启

last rebootlast -F |grep crash

2)查看历史异常登录用户

last

1.2 首先查看系统日志

linux下的/var/log/下的log日志,包括message,内核报错日志demsg等等,sa记录,是记录cpu,内存等运行的性能文件,记录着运行时的cpu的运行状态等。

1)利用sa文件查看宕机时CPU情况

sar -u -f /var/log/sa/sa27

2)利用sa文件查看宕机时内存情况

sar -r -f /var/log/sa/sa27

3)查看系统报错日志

tail -200 /var/log/messages |grep "Error"cat /var/log/dmesg|grep "Error"

4)查看系统内核崩溃日志

tail -200 /var/log/messages |grep "crash"

5)查看是否出现OOM,一般会出现kill杀死进程的情况

cat /var/log/messages|grep -i "kill"

6)查看宕机时间段的日志

cat /vat/log/messages|grep "Feb 11 15*"

1.4 查看内存使用

free -m,查看swap的使用和内存剩余情况和缓存。如果swap用了,且available也不够了,具体还要查看参数cat /proc/sys/vm/swappiness,如果设置为0,说明内存不够了。

free -m

1.5 查看io和文件系统使用

观察idle和iowait。磁盘读写时会用到缓存,一般为系统内存的40%,但是中间有一个缓冲时间120秒,将要用完这个缓存时,且会等待120秒,才会写入磁盘,在读写频繁的时候容易造成hang住的情况。

iostat

查看IO的读写速度,如果很慢说明磁盘性能出现瓶颈。

1.6 查看安全日志

安全日志为/var/log/secure,查看history记录,查看是否有人登陆主机并做了恶意动作,例如关机。

1.7 利用kdump和crash工具分析内核

检查服务器开启了kdump服务,并在/var/crash目录找到了当天生成的vmcore文件,使用crash工具分析vmcore文件。

Kdump 用于对内存镜像的转储,它不但可以转储内存镜像到本地硬盘,还可以将内存镜像通过NFS,SSH 等协议转储到不同机器的设备上。

Kdump 分为两个组件:Kexec 和Kdump。

Kexec 是一种内核的快速启动工具,可以使新的内核在正在运行的内核(生产内核)的上下文中启动,而不需要通过耗时的BIOS 检测,方便内核开发人员对内核进行调试。

Kdump 是一种有效的内存转储工具,启用 Kdump 后,生产内核将会保留一部分内存空间,用于在内核崩溃时通过 Kexec 快速启动到新的内核,这个过程不需要重启系统,因此可以转储崩溃的生产内核的内存镜像。

1.8 查看服务日志和监控软件

如果在能找到宕机时进程的占用情况,可以根据占用异常的服务查看其日志。

服务日志一般有数据库和web服务,中间件,框架等。

2 总结

 

来源地址:https://blog.csdn.net/ygq13572549874/article/details/129174989

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

linux主机宕机排查问题方法

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Linux主机系统时间同步问题排查

在Linux主机系统中,时间同步是一个重要的任务,因为它可以确保系统中的日志文件、证书和其他与时间相关的信息的准确性检查系统时间是否正确:使用date命令查看当前系统时间,确保它与实际时间相符。检查NTP服务状态:在Linux系统中,N
Linux主机系统时间同步问题排查
2024-09-27

linux异常关机问题如何排查

要排查Linux异常关机问题,可以按照以下步骤进行:1. 检查系统日志:查看/var/log目录下的日志文件,特别是syslog和kern.log文件,看是否有任何异常或错误信息。可以使用命令如下:```sudo tail -n 100 /
2023-08-31

阿里云服务器宕机问题解决方法

1.确认宕机原因当阿里云服务器出现宕机时,首先需要确认宕机的原因。可能的原因包括硬件故障、网络问题、操作系统错误等。通过查看服务器的日志和监控信息,可以帮助确定宕机原因。2.重启服务器如果宕机是由于临时的问题引起的,例如内存溢出或网络故障,可以尝试重启服务器来解决问题。在阿里云管理控制台上,找到对应的服务器实例,选择重
阿里云服务器宕机问题解决方法
2023-10-28

Navicat连接linux虚拟机上的MySQL可能遇到的问题及排查方法

Navicat连接Linux虚拟机上的MySQL时可能遇到的问题及排查方法包括:网络问题:检查端口是否开放、网络段是否匹配。连接信息不正确:核对用户名、密码、端口、主机名/IP地址。SSH错误:开启SSH服务、开放端口、检查认证。MySQL服务问题:启动服务、检查监听端口、授予权限。Navicat配置问题:匹配连接类型、检查证书和超时时间。其他问题:检查安全组限制、第三方防火墙、网络拥塞、操作系统兼容性。排查方法:检查网络连接和防火墙。核对连接信息。尝试命令行连接MySQL。重启MySQL服务和虚拟机。查
Navicat连接linux虚拟机上的MySQL可能遇到的问题及排查方法
2024-04-02

Linux SysOps SSH登录问题排查与解决方法

在解决Linux SysOps SSH登录问题时,可以采取以下排查和解决方法:1. 确认SSH服务是否正常运行:使用命令`sudo service ssh status`或`systemctl status sshd`来检查SSH服务的运行
2023-10-09

美国Linux主机兼容性问题

Linux在美国主机上的兼容性通常取决于硬件和软件的兼容性。大多数Linux发行版都提供对主流硬件的支持,包括处理器、内存、存储设备和网络接口等。然而,某些硬件可能需要特定的驱动程序才能在Linux上正常工作。另外,一些商业软件可能不支持
美国Linux主机兼容性问题
2024-08-08

Oracle锁表问题排查方法详解

Oracle锁表问题排查方法详解在使用Oracle数据库时,经常会遇到数据库表被锁住的情况,这会导致其他用户无法访问该表,从而影响系统的正常运行。本文将详细介绍Oracle锁表问题的排查方法,并提供具体的代码示例来帮助解决这一问题。一、
Oracle锁表问题排查方法详解
2024-03-10

mysql主库宕机的原因及解决方法是什么

主库宕机的原因可能包括硬件故障、网络故障、操作系统错误、数据库软件错误等。解决方法主要包括以下几个方面:备份恢复:如果有定期备份数据的策略,可以通过备份数据来恢复主库的数据。需要确保备份是最新的,并且备份数据的完整性和一致性。故障转移:可以
mysql主库宕机的原因及解决方法是什么
2024-04-09

linux修改主机名的方法

这篇文章主要介绍“linux修改主机名的方法”,在日常操作中,相信很多人在linux修改主机名的方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”linux修改主机名的方法”的疑惑有所帮助!接下来,请跟着小编
2023-06-13

云服务器主机网络连接问题解决方法

1.检查网络配置首先,确保你的云服务器主机的网络配置正确。检查以下几个方面:IP地址:确认你的云服务器主机是否有正确的IP地址。可以通过查看网络配置文件或者使用命令ifconfig或ipconfig来获取IP地址信息。子网掩码:检查子网掩码是否正确配置。确保子网掩码与你的网络环境相匹配。网关:确认网关设置正确。网关是连
2023-10-27

Win8.1无法关机问题解决方法

最近给心爱的本本ThinkPad T530安装了OSX 10.9 Mavericks。 运行了一天,新装了没几天的Win8.1居然无法关机了。 现象:每次点击关机,却并没有关机,只是关闭了屏幕,注销了用户而已。再点击鼠标,敲敲键盘,就又到了
2022-06-04

访问云主机的方法是什么

访问云主机的方法通常有以下几种:1. 远程桌面(Remote Desktop):如果你的云主机是基于Windows操作系统,你可以使用远程桌面协议(RDP)来访问云主机。你需要输入云主机的IP地址和管理员账户的用户名和密码。2. SSH(S
2023-08-18

Linux主机磁盘配额设置方法

在Linux系统中,磁盘配额是一种限制用户或组在文件系统上使用的磁盘空间和文件数量的方法。以下是设置Linux主机磁盘配额的详细步骤:准备工作确保你的文件系统支持磁盘配额。大多数现代文件系统(如ext4、XFS)都支持磁盘配额。启用磁
Linux主机磁盘配额设置方法
2024-09-27

编程热搜

目录