我的编程空间,编程开发者的网络收藏夹
学习永远不晚

.Net程序内存异常的原因及解决

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

.Net程序内存异常的原因及解决

一、概要

大概在今年三月份的时候突然被紧急调到另外一个项目组解决线上内存异常问题。经过两周的玩命奋战终于解决了这个问题这里把心路历程及思路分享给大家。希望可以帮助到各位或现在正遇到这样事情的小伙伴提供一些思路。

二、场景

当部门老大找到我的时候,给我描述了这样一段话。

“目前服务出现了提交内存异常的问题,目前分析出来可能是日志组件有大量的日志消息堆积把内存占满导致服务崩溃了。在国内某地区客户的服务器上15000台物联网设备不能正常工作这个问题非常紧急需要马上解决。”

问题描述至此,没有其他可用信息。这时候我先崩溃了...但是任务找到你不能说不行。万一解决了这种重大事故还能在部门老大面前秀一把。

三、思路

(1)分析

Part1,分析日志堆积原因

  • 拿到服务器地址去翻出日志文件,查看日志内容;内容基本上都是一些报错情况xxx对象为null,对象转换失败。
  • 日志组件的实现也比较糟糕Log对象在每个调用的类里都会重新new

解决方案:

  • 修复对象为null的问题并加上空值判断,大概的原因就是json值转换的时候传入的值是null那么就引起这两块的连锁反应。非常值得注意的一点是通常json对象转换的地方都会加入try块去捕获异常在程序里try的捕捉是会对.net程序造成性能影响的所以能用判断规避的尽量不要去触发try机制,程序性能被拖下去其他方面的处理就会变相的削减处理速度变慢那么数据堆积好像就解释的通了。
  • 将日志组件重构为单例且线程安全的实现,写入日志的数据结构体是class这里改成struct,考虑的因素是引用类型会存在引用问题再就是考虑的值类型和引用类型在内存中占用的大小是不一样的,而且值类型和引用类型在处理速度上值类型更快。

以为这样就结束了吗?不,当程序改好之后放在测试服务器上跑第二天早上测试部的小姐姐就找到我说异常报错情况是好了,但是内存泄漏还是没解决。

Part2,查找内存泄漏的根本原因

看来Part1的操作仅仅只是修复了一个小bug而已,并不是我所想的那么简单,在日志的查看中还发现log日志中出现“tcp服务拒绝连接XXX异常”。当我看到这些的时候心情糟糕透了....

1.一早我就用Profile把服务程序跑了一遍发现了

(1)有几个消息队列占用非常大,查阅代码之后发现服务端程序会和15000台物联网设备进行交互的所有数据都会先堆积到这个队列里如果这个队列满了(Queue上限被设定2w)会new新的Queue然后把溢出的部分转到新的Queue里,最可怕的是从队列里取数据的还是单线程处理。

(2)还会有很多磁盘I/O的操作会存储在应用服务器本机上例如socket通讯的报文和需要转发的内容等等都会进行写入操作。
(3)逐步调试的时候发现大部分的方法实现都是同步方法,而且框架版本居然是.net freamwork4。

解决方案:

(1)

【移除new新队列的机制、删除Main Queue的上限设置改为多线程处理Queue;一切数据堆积的本质就是数据处理不过来所以开辟再多的内存空间都是慢性死亡而已。】
【走访物联网硬件部门,询问物联网设备发送数据频率、设备数、单台设备发送单条数据的大小是多少KB;为什么需要了解?这些第一点在程序内记录日志然后统计成走势图能直接观察队列内部的变化开会的时候能给领导具有说服力的证据能看到数据量什么时候陡增、数据大小等;第二点因为这些报文数据需要存在应用服务器本地那么这时候就能计算出写入的数据量有没有超出普通硬盘的写入I/O瓶颈以及网络带宽的占用。】
【走访物联网硬件部门2,询问物联网设备socket传输数据时是否有走正常“tcp挥手”流程;为什么?因为socket tcp通讯中,是双工通道那么其中有一端突然断开,另一端会进入“wait”状态不会及时回收tcp连接资源,大家试想一下如果15000台设备高频短连接去操作那么服务端连接队列资源很有可能吃不消。这个时候就需要服务端主动断开“失效”连接及时回收资源“拆除双工通道”以及调整socket连接队列大小。】

(2)磁盘写入报文信息这块,就要用三寸不烂之舌说动项目经理把这块砍掉以节约CPU性能以及减少磁盘I/O,大伙试想一下每次socket通讯进行收发的时候都要去操作一下I/O那是多么恐怖的一件事情;最后沟通结果那个组的项目经理同意砍掉部分模块磁盘写入功能,那么问题来了剩下的怎么办如何将优势进一步扩大?这时候继续查阅项目代码,结果发现socket通讯中“收”、“发”都会操作一次。那么这时候需要做的是将报文积累到一定数量比如说积累1000条报文再一次性写入那么磁盘I/O的操作频率将成倍递减。

(3)最后一个问题,就是讲所有的方法修改为异步方法。这时候就能祭出Task、Async、Await了。但是基于的框架是.net freamwork4的,后来又去查阅MSDN的文档发现.net freamwork4远古框架中还是有这些特性的虽然用法稍微难受点但是还是能优化的。一定要记住一点,开发服务端要有“服务端”思维如果都是同步方法就会被同步阻塞处于“等待处理结果状态”这样的话服务端的并发量是上不去的。

这里虽然没怎么用上的一发大招,但是这里还是分享给大家“注释大法”;注释掉最有可能出问题的地方逐一排查一定能发现问题的所在就是非常的耗时那会我基本每天工作12小时,尤其是公司的远古项目通常“代码烂”、“设计基本没有”、“使用的.net框架版本低”等等,一堆恶心人的事情发生。

(2)工具

  • Visual Studio自带的Profile。【可以分析CPU、内存等占用情况;这款比较推荐】
  • VMMap【可以分析CPU、内存等占用情况】
  • ANTS Performance Profiler【这款工具比较强大能分析调用链路逐级告诉你内存占用的地方以及内存占用大小】
  • Window操作系统自带的资源监视器这个不用多说大家都会用。

Part3,总结

基于以上的修改,在测试服务器上稳定运行3周内存稳定在2.9G左右;

一定要记住:

  • “遇到任何棘手的事情不要抱怨。”
  • “一个优秀的软件工程招聘进来就是解决问题的,而不是制造问题;”
  • “对于任务的安排,高手永远都是说出解决问题的期限;到点交东西。而不是支支吾吾说不清楚、退缩。”
  • “遇到问题冷静思考,相信自己一定可以的;那怕失败去尝试一下也好。”
  • “没解决问题的时候不要说任何话,说什么都像是在找理由。闭上嘴巴去想办法。”

其实解决这个问题时期发生了很多有趣的故事,不过最终还是要解决难啃的问题证明自己,开发学习本身就是一个不断变强的过程“修技术,也修内心”当自己逐渐变强之后也不要鄙视技术不好的同事始终保持一颗学徒的心。

Part4,彩蛋

解决这个问题之后在同部门同事的眼里威望都会有提升(尤其是测试部门的小姐姐,因为她们不用费力的每天去看服务器了),最终解决项目的重大事故部门老大给了机会调到其他省的研发中心当项目经理薪资平移的基础上再上浮百分之十。可见掌握一手救急的技能有多么划算。

以上就是.Net程序内存异常的原因及解决的详细内容,更多关于.Net程序内存异常的资料请关注编程网其它相关文章!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

.Net程序内存异常的原因及解决

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

C++ 内存泄漏的常见原因及其解决方法

常见 c++++ 内存泄漏原因:1. 忘记释放指针;2. 双重释放;3. 循环引用;4. 静态变量;5. 全局对象。解决方法:1. 使用智能指针;2. 注意循环引用;3. 避免静态变量;4. 使用内存调试器;5. 定期释放内存。C++ 内存
C++ 内存泄漏的常见原因及其解决方法
2024-05-02

如何查找.NET程序内存不断上涨的原因

如何查找.NET程序内存不断上涨的原因,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。前段时间公司新写的自动升级服务端(Remoting)出现了内存不断飙升的情况,从最初的七
2023-06-17

java.lang.NullPointerException异常的几种原因及解决方案

本文主要介绍了java.lang.NullPointerException异常的几种原因及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2023-05-18

详解Java中NullPointerException异常的原因以及解决方法

NullPointerException是Java中常见的异常之一,通常是在运行时发生的。该异常表示程序试图访问一个空对象的属性或调用空对象的方法。造成NullPointerException异常的原因主要有以下几种:1. 对象引用为nul
2023-08-11

阿里云内网连接数据库异常的原因及解决方案

阿里云内网连接数据库异常是一个常见的问题,可能是由于网络问题、数据库连接问题、权限问题、系统错误等多种原因导致的。本文将详细解释这些问题的原因,并提供相应的解决方案。一、问题原因网络问题:阿里云内网连接数据库时,如果网络连接不稳定或者速度过慢,可能会导致连接异常。此外,网络防火墙可能会阻止数据库连接。数据库连接问
阿里云内网连接数据库异常的原因及解决方案
2023-12-15

Java中java.lang.ClassCastException异常原因以及解决方法详解

Java中的java.lang.ClassCastException异常发生在尝试将对象强制转换为不兼容类型时。原因包括类型转换错误、对象类型不匹配、向下转型失败和对象类型不兼容。解决方法包括识别异常点、检查类型安全、使用instanceof运算符、避免向下转型、处置空值、使用反射和检查泛型类型。避免强制转换,改用更安全的类型转换方法,例如instanceof运算符和反射。
Java中java.lang.ClassCastException异常原因以及解决方法详解
2024-04-02

PHP应用程序中的内存泄露:原因、检测和解决

php 内存泄露是指应用程序分配内存后未能释放,导致服务器可用内存减少和性能下降。原因包括循环引用、全局变量、静态变量和扩展。检测方法有 xdebug、valgrind 和 phpunit mock objects。解决步骤为:识别泄漏源、
PHP应用程序中的内存泄露:原因、检测和解决
2024-05-09

qt程序异常崩溃的原因有哪些

Qt程序异常崩溃的原因可能有以下几种:1. 内存错误:例如访问已释放内存、越界访问数组等。2. 线程问题:例如多个线程之间的竞争条件、死锁等。3. 异常处理不当:例如未处理的异常、异常被忽略等。4. 文件操作问题:例如打开不存在的文件、无法
2023-09-22

org.apache.ibatis.binding.BindingException异常报错原因以及详细解决方案

这篇文章主要给大家介绍了关于org.apache.ibatis.binding.BindingException异常报错原因以及详细解决方案的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
2023-02-16

APPLICATION FAILED TO START 异常报错原因及解决方案

文章目录 一、APPLICATION FAILED TO START 异常报错原因分析1. 异常报错描述: 二、端口号被占用(Port 8080 was already in use) 导致的 APPLICATION FAILE
2023-08-17

qt程序异常结束的原因有哪些

Qt程序异常结束的原因有以下几种:1. 代码错误:程序中存在逻辑错误、语法错误等导致程序异常终止的问题。2. 内存错误:程序中存在内存泄漏、野指针等内存管理错误导致程序崩溃。3. 异常信号:程序可能会收到一些未处理的信号,如SIGABRT、
2023-09-22

Android Force Close 出现的异常原因分析及解决方法

一、原因:forceclose,意为强行关闭,当前应用程序发生了冲突。NullPointExection(空指针),IndexOutOfBoundsException(下标越界),就连Android API使用的顺序错误也可能导致(比如se
2022-06-06

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录