我的编程空间,编程开发者的网络收藏夹
学习永远不晚

怎么查找Linux死机的原因

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

怎么查找Linux死机的原因

本篇内容介绍了“怎么查找Linux死机的原因”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

Linux 内核虽然号称“不死族”,几乎不会崩溃或者死机,但是特殊情况下,还是有一定几率会宕机的。因为 Linux 广泛用于生产环境,所以每一次宕机都会引起相当大的损失。它 Uptime 达到上百天也许你习以为常,但是只要 Down 十几秒,就会立即急的满头大汗。真的很难以想象证交所宕机会怎么样,也许全国股民会闹翻天。所以我们需要一些小技巧来查找死机的原因,从而避免死机或者内核崩溃。

请注意:以下方法可能不适用于 Server,因为桌面环境和 Server 还是有很大区别的。

X Crash

事实上 Linux 内核很少出错,平常我们所遇到的“死机”都是 X 无响应造成的错觉。那 X 没响应了应该怎么处理呢?

通常套路是 Ctrl + Alt +F7 (F8) 切换到某个 tty,然后用 root 登陆,执行 top 查看吃资源最多的程序,然后使用 pkill/kill/killall 等命令杀死该程序。或使用组合键 Ctrl + Alt + Backspace重启 X (黑日白月注:这个快捷键组合在***的 Ubuntu 和 Fedora 中关闭)。

如果偶遇切换 tty 失败或者没响应,可以试着使用 SSH 登陆此电脑,然后再杀死程序。也许只是 X 不响应,而内核和 SSH daemon 仍然工作,故此可以实施此法。

arch 配置 SSH daemon

万一 X 不给力,各种方法试了无效,又没有办法通过 SSH 登陆到此 pc,那怎么办呢?别着急,我们还有***的 “reisub” 大法。不过在启用前先要激活内核 sysrq 功能 (via) 。系统启动时执行:echo "1" > /proc/sys/Kernel/sysrq 或者修改 /etc/sysctl.conf 文件,设置 Kernel.sysrq = 1。系统异常时依次按下 Alt+sysrq+{reisub} ,然后系统会自动重启。(有关 sysrq 请看:Linux 死机了怎么办?)

不建议长按 Power 按键强制关机,有可能损坏硬件或者丢失数据,甚至导致磁盘坏道!

X 崩溃而内核完好

常见的症状有:程序无响应,花屏,鼠标移动指针无动作,键盘输入没有识别等。但后台的音乐可以正常播放,或者键盘 Caps Lock/Num Lock/Scroll Lock 按键按后对应 LED 可以正常亮灭。遇到此种情况可以使用上述方法重启 X 或者电脑即可恢复正常。

Application Crash

这个比较常见,但是也是相当难解决的。因为 Linux 上的应用软件大部分都是开源的,所以可能没有超高的稳定性。也许由于库的缺少或者版本错误,或者代码的 Bug,都有可能导致程序出现异常。

一般遇到这种问题,建议检查配置文件是否正确,对配置文件的错误修改可能导致程序的运行失败。如果您确信配置文件没有错误但是程序仍然异常,可以尝试把配置文件删除(注意备份!),然后再次打开软件尝试。通常程序的配置文件在:

  • ~/.[APPNAME]

  • ~/.config/[APPNAME]

  • /etc/[APPNAME].conf

或者有可能是库的错误,您可以在终端输入程序名或者程序路径运行程序,根据终端的提示信息除错。由于导致程序崩溃的可能性多种多样,在此不能一一列举,所以建议您根据出错信息去 google 搜索并找到解决方案。

Kernel Panic

X 的问题还好办,可是如果 RPWT 碰到 Kernel Panic,那可真是上天无路入地无门,撞墙的心都有 :evil: 。

一般引起 Kernel Panic 的原因很多,但是都比较罕见。例如硬件问题 (irq confilct, bad block, high temperature),软件问题(错误的 mod,内核的 Bug),或者文件系统不支持(没有内建 ext4 支持却挂载 ext4 的 root 分区),硬件的变动(如添加/更换内存,不支持架构的cpu),错误的驱动。

Kernel Panic 的表现形式也是多种多样:启动失败,不正常的长时间 io 操作,键盘灯的不正常频闪,wireless 等指示灯错误闪烁,无响应(请区别 xorg crash 情况),彻底锁死,黑屏,reisub 大法不灵 等等。

一般情况下,秉承 KISS 原则的 Linux 内核,会尽力解决一切错误并正常运行,如果遇到极端情况发生 Panic,它会尽可能把所有相关信息显示在屏幕上——至于多少,别奢求,Kernel 已经尽力了。

因为 Kernel Panic 是一种很极端的情况,有的人可能自从使用 Linux 就没有遇到过。所以我们要收集所有相关的信息来解决问题。发生错误后的各种输出是最直接的最有效的( Dump 在 tty。请关闭 x)。因为 Kernel 已经崩溃,不一定能找到完整的 Log。您可以根据以下线索尝试:

  1. /var/log/messages —— rp 爆发的时候,也许会记录下很多相关信息。按照时间戳查找。

  2. 回溯操作 —— 回忆 Kernel Panic 之前所做的所有事,并回滚。(如安装了某个程序,可以在 /var/log/pacman.log 找到安装日志)

  3. Dump 信息 —— 屏幕输出信息是系统***的“遗言”,请使用数码相机或者笔纸记录。(tty only)

接下来就应该根据错误发生的可能原因进行排除。将内核启动参数化为最简形式,不应附加任何不必要参数,并 BIOS 中禁用掉所有无关硬件。相关日志文件:

  • /var/log/boot

  • /var/log/xorg 所有相关(仅参考)

  • /var/log/messages

如果可以,您应该记录下所有屏幕输出信息,并查看 /var/log/messages 。

可能遇到的问题,和解决方法:

  1. irq conflict (还好我没碰到),可以尝试从 bios 修改硬件irq,或者升级 bios,都不生效就换电脑或者禁用冲突硬件;

  2. bad balock,尝试修复坏道或者屏蔽坏道分区,建议更换磁盘;

  3. io error,同上,也有可能是没有内建文件系统支持的原因,重新编译内核或者找***版的内核安装;

  4. mod,删除可能导致错误的内核模块(如 vboxdrv),涉及到的命令有:

    • lsmod: 列出已载入的模块

    • modprobe: 载入模块( 黑日白月注:在这里和其他命令对应的为 insmod + depmod 比较好,modprobe 更类似于 XXXmod 系列命令的升级整合版本。)

    • rmmod: 移除内核中模块,效果等同于 modprobe -r

    • modinfo: 显示模块相关信息

  5. driver,a卡或者n卡驱动,也容易造成问题;

  6. 硬件本身的问题导致,建议检测硬件可用性和兼容性(例如 memtest+);

  7. 内核 bug,如果您有能力,建议使用 KDB (Kernel debugger) 排错,或者重新编译内核;

“怎么查找Linux死机的原因”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

怎么查找Linux死机的原因

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

怎么查找Linux死机的原因

本篇内容介绍了“怎么查找Linux死机的原因”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Linux 内核虽然号称“不死族”,几乎不会崩溃或
2023-06-16

怎么在电脑中查找关机错误原因

这篇文章主要介绍怎么在电脑中查找关机错误原因,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!查找方法/步骤:1.按下win+R调出运行窗口,输入eventvwr.msc命令后回车执行。2.出现对应的事件查看器界面后,大
2023-06-27

qt程序闪退怎么查找原因

当QT程序闪退时,可以通过以下几种方式来查找问题的原因:1. 查看程序的调试输出:在QT程序中,可以通过qDebug()函数输出调试信息。如果程序闪退,可以查看程序输出的调试信息,看是否有报错信息或异常信息,这些信息可能会提示程序闪退的原因
2023-09-22

linux怎么查看重启的原因

要查看Linux系统重启的原因,可以通过以下步骤进行操作:1. 打开终端窗口。2. 使用以下命令来查看最近的重启日志:```sudo cat /var/log/syslog | grep "system reboot"```3. 如果上述命
2023-08-31

电脑常见的死机原因及怎么解决

这篇文章主要介绍了电脑常见的死机原因及怎么解决的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇电脑常见的死机原因及怎么解决文章都会有所收获,下面我们一起来看看吧。启动过程中的死机1.开机后计算机系统无任何反应:电
2023-06-27

linux中产生死锁的原因是什么

这篇“linux中产生死锁的原因是什么”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“linux中产生死锁的原因是什么”文章吧
2023-06-29

电脑突然死机原因及怎么应对

本篇内容介绍了“电脑突然死机原因及怎么应对”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!运行过程中的死机:1.运行某些应用程序时出现的死机现
2023-06-27

win7假死机怎么办 win7系统假死机的原因以及解决方法

电脑安装Windows7系统使用过程中突然出现卡屏的情况,我们叫win7假死机状态。今天小编就为大家分享win7系统假死机解决方法,需要的朋友可以看看win7假死机解决办法:首先,最好不要安装各种所谓的win7精简、优化版本。只要硬件是初级
2023-06-13

Win10中2004蓝屏死机的原因是什么

小编给大家分享一下Win10中2004蓝屏死机的原因是什么,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!大家都知道,本月早些时候,联想发布了一个支持文档,通知其
2023-06-10

linux怎么查询内存溢出的原因

要查询Linux系统中内存溢出的原因,可以按照以下步骤进行:1. 使用`dmesg`命令查看系统日志,检查是否有与内存相关的错误信息。例如,可以运行`dmesg | grep -i memory`来查找与内存相关的日志。2. 运行`free
2023-10-10

Win7电脑自动关机怎么办?电脑死机原因汇总

关于电脑自动关机是怎么回事的问题,很多电脑用户都遇到过,我就有几个朋友问过我这样的我问题,对于一些喜欢玩 3D 游戏的玩家来说,假如玩 3D 游戏时频繁死机是一件很痛苦的事,呵呵,这里我把发生这类故障的罕见原因解决方法总结一下。 一、显卡本
2023-06-14

php中rename错误的原因怎么找

本篇内容主要讲解“php中rename错误的原因怎么找”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“php中rename错误的原因怎么找”吧!php rename错误原因的查找方法:1、新增一些
2023-06-20

windows电脑死机的原因及解决方法是什么

windows电脑死机的原因及解决方法是什么,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。 很多人在使用电脑过程中会遇到各种各样的问题。比如说,电脑死机、甚至连续死机
2023-06-14

预防windows电脑死机原因的24个技巧是怎样的

今天就跟大家聊聊有关预防windows电脑死机原因的24个技巧是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。死机是令操作者颇为烦恼的事情。死机时的表现多为“蓝屏”,无法启动系
2023-06-14

windows KB4540673补丁安装后蓝屏死机的原因是什么

这篇文章主要介绍了windows KB4540673补丁安装后蓝屏死机的原因是什么的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇windows KB4540673补丁安装后蓝屏死机的原因是什么文章都会有所收获,
2023-07-01

笔记本电脑出现蓝屏或死机的原因及怎么解决

本篇内容主要讲解“笔记本电脑出现蓝屏或死机的原因及怎么解决”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“笔记本电脑出现蓝屏或死机的原因及怎么解决”吧!一、启动时加载程序过多不要在启动时加载过多的
2023-06-27

java怎么排查cpu高的原因

要排查Java程序中CPU高的原因,可以按照以下步骤进行:1. 监视CPU使用率:使用操作系统的工具(如Windows任务管理器、Linux top命令)监视CPU的使用率,确认Java进程确实占用了较高的CPU资源。2. 确认Java进程
2023-09-09

oracle怎么查看锁表的原因

oracle锁表的原因是:当一个程序执行了对一个表的insert,并且还未commite时,另一个程序也对同一个表进行insert,则此时就会发生资源正忙的异常,也就是锁表。本教程操作系统:windows10系统、Oracle 19c版本、
2023-07-10

tomcat闪退的原因怎么排查

Tomcat闪退的原因可以通过以下步骤进行排查:检查日志文件:Tomcat的日志文件通常会记录错误和异常信息。可以查看catalina.out文件或logs/目录下的其他日志文件,查找是否有任何异常或错误信息。查看系统日志:检查操作系统的日
2023-10-22

编程热搜

目录