我的编程空间,编程开发者的网络收藏夹
学习永远不晚

SIGPIPE(Signal 13, Code 0) 异常排查及处理

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

SIGPIPE(Signal 13, Code 0) 异常排查及处理

问题现象

最近一个版本 APP 更新之后,sentry 大量异常数据上报,影响用户的数量非常夸张 10w +,具体报错如下

排查过程

首先查看 SIGPIPE 的报错原因, 在官网搜索到了相关信息

大意是 Socket 连接关闭后,如果客户端仍在发送数据,这个时候就会产生 SIGPIPE 信号,如果信号没有被处理就会产生崩溃,这里截取了部分关键信息。

文档上说可以使用 signal(SIGPIPE, SIG_IGN) 全局忽略,确认客户端添加了该逻辑,但是异常还是上报到了 sentrysignal 这个函数是给信号关联一个 handler,收到这个信号的时候去执行。 SIG_IGN 是系统提供的忽略信号的处理方式,定义如下:

#define SIG_IGN         (void (*)(int))1

尝试手动触发 SIGPIPE, 运行后可以正常输出。

void signalHandler(int signal) {
    printf("bingo");
}
int main(int argc, char * argv[]) {
    signal(SIGPIPE, signalHandler);
    kill(getpid(), SIGPIPE);
}

多次添加 handler 继续尝试, 控制台输出 333, 也就是说只有最后添加的 handler 会执行到,比较容易理解一个信号只能关联一个 handler

void signalHandler(int signal) {
    printf("111");
}
void signalHandler2(int signal) {
    printf("222");
}
void signalHandler3(int signal) {
    printf("333");
}
int main(int argc, char * argv[]) {
    signal(SIGPIPE, signalHandler);
    signal(SIGPIPE, signalHandler2);
    signal(SIGPIPE, signalHandler3);
    kill(getpid(), SIGPIPE);
}

现状是 sentry 可以捕获并处理这个异常,所以此时怀疑是 sentry 把客户端的处理给覆盖了。

查看 sentry 里面的逻辑,sentry 使用了 sigaction 函数关联 handler,这个函数与 signal 函数一样,可以设置与信号 sig 关联的动作,而 oact 如果不是空指针的话,就用它来保存原先对该信号的动作的位置,act 则用于设置指定信号的动作。sentry 关联了自己的处理 handleSignal 并且会把之前的handler 存储到数组 g_previousSignalHandlers 里面。

int sigaction(int sig, const struct sigaction *act, struct sigaction *oact);
// sentry 关联的 action 为 handleSignal
sigaction(fatalSignals[i], &action, &g_previousSignalHandlers[i])

sentryhandleSignal 里面上报异常并且执行了了 sentrycrashcm_handleException,然后使用 raise 重新抛出这个信号。

static void handleSignal(int sigNum, siginfo_t *signalInfo, void *userContext)
{
    SentryCrashLOG_DEBUG("Trapped signal %d", sigNum);
    if (g_isEnabled) {
        // 这里省略上报逻辑
        sentrycrashcm_handleException();
    }
    SentryCrashLOG_DEBUG("Re-raising signal for regular handlers to catch.");
    // This is technically not allowed, but it works in OSX and iOS.
    raise(sigNum);
}

查看 handleException 简化后的调用栈:

void sentrycrashcm_handleException(**struct** SentryCrash_MonitorContext *context)
{
    sentrycrashcm_setActiveMonitors(SentryCrashMonitorTypeNone);
}
void sentrycrashcm_setActiveMonitors(SentryCrashMonitorType monitorTypes)
{
    // isEnabled = false
    setMonitorEnabled(monitor, isEnabled);
}
static inline void setMonitorEnabled(Monitor *monitor, bool isEnabled) {
    uninstallSignalHandler();
}
static void uninstallSignalHandler(void) {
    sigaction(fatalSignals[i], &g_previousSignalHandlers[i], **NULL**);
}

可以看到 handleException 这个函数最终会重新关联保存在 g_previousSignalHandlers里面的 handler,也就是客户端设置的 SIG_IGN 默认忽略。sentry 关联的函数 handleSignal 会在处理完会重新抛出信号,这个信号会触发 SIG_IGN,所以这里并不存在覆盖关系,sentry 不会影响到客户端默认忽略的逻辑。

综上客户端设置的 SIG_IGN 是会生效的,sentry 只是上报了异常,并没有崩溃产生。在 APP 里面手动触发 SIGPIPECharles 抓包可以看到 sentry 上报,APP 未出现崩溃。

原因与处理

和多个业务方确认这个版本并没有 socket 相关的改动,那为什么在这个版本之后突然有大量异常上报呢?

后面 diff 代码发现是改动了 sentry 的初始时机造成的。之前的逻辑是 sentry 初始化,客户端调用 signal 关联 SIG_IGN,这个时候 SIG_IGN 覆盖了 sentrysignalHandler,并且没有保存和恢复之前 handler 的逻辑,sentry 捕获不到信号不会上报,当前版本的改动使这个顺序颠倒了,导致了大量异常数据上报。后续尝试去定位具体的 socket 无果,重新修改了顺序 SIG_IGNsentry 初始化之后关联,之后的版本不再有异常数据上报。

以上就是SIGPIPE(Signal 13, Code 0) 异常排查及处理的详细内容,更多关于SIGPIPE异常排查的资料请关注编程网其它相关文章!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

SIGPIPE(Signal 13, Code 0) 异常排查及处理

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

SIGPIPE(Signal 13, Code 0) 异常排查及处理

这篇文章主要为大家介绍了SIGPIPE(Signal 13, Code 0) 异常排查原因解析及处理详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
2023-01-29

编程热搜

  • Android:VolumeShaper
    VolumeShaper(支持版本改一下,minsdkversion:26,android8.0(api26)进一步学习对声音的编辑,可以让音频的声音有变化的播放 VolumeShaper.Configuration的三个参数 durati
    Android:VolumeShaper
  • Android崩溃异常捕获方法
    开发中最让人头疼的是应用突然爆炸,然后跳回到桌面。而且我们常常不知道这种状况会何时出现,在应用调试阶段还好,还可以通过调试工具的日志查看错误出现在哪里。但平时使用的时候给你闹崩溃,那你就欲哭无泪了。 那么今天主要讲一下如何去捕捉系统出现的U
    Android崩溃异常捕获方法
  • android开发教程之获取power_profile.xml文件的方法(android运行时能耗值)
    系统的设置–>电池–>使用情况中,统计的能耗的使用情况也是以power_profile.xml的value作为基础参数的1、我的手机中power_profile.xml的内容: HTC t328w代码如下:
    android开发教程之获取power_profile.xml文件的方法(android运行时能耗值)
  • Android SQLite数据库基本操作方法
    程序的最主要的功能在于对数据进行操作,通过对数据进行操作来实现某个功能。而数据库就是很重要的一个方面的,Android中内置了小巧轻便,功能却很强的一个数据库–SQLite数据库。那么就来看一下在Android程序中怎么去操作SQLite数
    Android SQLite数据库基本操作方法
  • ubuntu21.04怎么创建桌面快捷图标?ubuntu软件放到桌面的技巧
    工作的时候为了方便直接打开编辑文件,一些常用的软件或者文件我们会放在桌面,但是在ubuntu20.04下直接直接拖拽文件到桌面根本没有效果,在进入桌面后发现软件列表中的软件只能收藏到面板,无法复制到桌面使用,不知道为什么会这样,似乎并不是很
    ubuntu21.04怎么创建桌面快捷图标?ubuntu软件放到桌面的技巧
  • android获取当前手机号示例程序
    代码如下: public String getLocalNumber() { TelephonyManager tManager =
    android获取当前手机号示例程序
  • Android音视频开发(三)TextureView
    简介 TextureView与SurfaceView类似,可用于显示视频或OpenGL场景。 与SurfaceView的区别 SurfaceView不能使用变换和缩放等操作,不能叠加(Overlay)两个SurfaceView。 Textu
    Android音视频开发(三)TextureView
  • android获取屏幕高度和宽度的实现方法
    本文实例讲述了android获取屏幕高度和宽度的实现方法。分享给大家供大家参考。具体分析如下: 我们需要获取Android手机或Pad的屏幕的物理尺寸,以便于界面的设计或是其他功能的实现。下面就介绍讲一讲如何获取屏幕的物理尺寸 下面的代码即
    android获取屏幕高度和宽度的实现方法
  • Android自定义popupwindow实例代码
    先来看看效果图:一、布局
  • Android第一次实验
    一、实验原理 1.1实验目标 编程实现用户名与密码的存储与调用。 1.2实验要求 设计用户登录界面、登录成功界面、用户注册界面,用户注册时,将其用户名、密码保存到SharedPreference中,登录时输入用户名、密码,读取SharedP
    Android第一次实验

目录