SQL Server数据库告警改进
考虑对生产环境所有SQL Server服务器开启数据库邮件功能,它是数据库自带的邮件发送功能,通过配置到邮件服务器的访问,及时接收SQL Server事件告警。
SQL Server警报是基于引擎的事件通知机制发送告警,当事件发生时出发告警通知。
现阶段,需要收集如下两类SQL Server事件告警:
Severity - 事件严重性级别13到25告警;
Error Number - 包括操作系统错误、IO错误、内存错误、AlwaysOn状态相关告警。
策略调整
我们考虑将这些需要监控的告警整合到应用程序日志,接入ELK日志分析系统。
我们了解到,在下列情况下,SQL Server 和 SQL Server 应用程序产生的错误/消息将发送到Windows 应用程序日志:
严重级别为 19 或更高的 sys.messages 错误
任何使用 WITH LOG 语法调用的 RAISERROR 语句
所有使用 sp_altermessage 修改或创建的 sys.messages 错误
所有使用 xp_logevent 记录的日志事件
引用自 https://docs.microsoft.com/en-us/sql/ssms/agent/create-an-alert-using-severity-level“Severity levels from 19 through 25 send a SQL Server message to the Microsoft Windows application log and trigger an alert. Events with severity levels less than 19 will trigger alerts only if you have used sp_altermessage, RAISERROR WITH LOG, or xp_logevent to force them to be written to the Windows application log. ”
针对上文提到、我们需要监控的Severity和Error Number告警,我们需要做如下变更调整:
Severity - 经过讨论,不记录严重级别19以下的用户级别的错误,19级别及以上的Fatal Error默认记录到应用程序日志,我们不用做任何更改。
Error Number - 需要监控的错误,根据附件的查询结果,部分错误号的is_event_logged字段为0,表示没有记录到应用程序日志。可以通过上面的sp_altermessage修改该字段为1达到记录到应用程序日志的目的。
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341