我的编程空间,编程开发者的网络收藏夹
学习永远不晚
位置:首页-资讯-运维

数据是自动化与智能化的基础

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

数据是自动化与智能化的基础

  传统的以人为中心的分析往往都是一点点的去采集数据的,而需要实现自动化或者智能化分析,这些数据采集必须能够自动的、高质量的进行,才能让整个分析过程能够顺利的自动化完成。

  ​周五下午的DTCC智能运维专场(专场19)因为临时原因,让我客串主持人,幸亏是线上会议,对主持人的形象要求不高,否则因为疫情原因两个月没去理发店的本尊真的很难上镜。

  说到智能运维或者说自动化运维,实际上主要依靠的还是数据智能和知识智能。而知识智能的分析基础还是数据,因此说数据无论对于自动化运维还是智能化运维来说,都是最为关键的。本周二DBAIOPS社区的培训是由我来介绍如何利用工具来运维自己的数据库系统,其中我强调了“知识自动化”的基础就是数据,一个知识自动化系统从数据采集开始就已经充满了专家经验和知识了。

  既然数据如此重要,那么我们需要什么样的数据呢?传统的运维自动化系统都仅仅采集用于告警的数据,当告警发生后,再去补充分析其他数据。这种模式在智能化运维时代已经越来越不适合了。要想实现自动化的智能分析,必须拥有较为完整的数据,利用这些数据,可以在故障现象发生时第一时间被捕捉到,并被分析与分类,告知运维人员的同时已经把大体的问题分类一并告知了。这样的告警可以加速故障定位,缩短消缺时间。

  我临时画了一张草图,并不完整,如果对数据库需要采集哪些数据有兴趣的朋友,可以安装一套D-SMART社区版,在监控信息里可以看到D-SMART使用的监控信息,在基本信息里可以看到配置相关的信息。在集群拓扑里可以看到相关的关联信息。这些数据有些是可以自动化采集到的,不过有些是无法采集的,需要在配置的时候人工输入。

  有道是书到用时方恨少,实际上数据只有到了要分析问题的时候才会发现是不够的。昨天网上有个朋友发了一个AWR报告,让人帮助看看,我正好有空,就下载下来看了看。这个案例挺有意思的,初一看,系统的问题有好几条线索。

  从AWR上看,DB TIME确实很高,和Load Profile完全对不上,从上面的数据可以看出,系统的负载极小,每秒的执行数仅为153。不过负载不高有两种可能性,一种是从上游来的SQL并发量就很小,还有一种可能性是当时系统出现问题,形成了一定的阻塞,因此并发量下降了。

  从TOP等待事件上看,排在第一位的是lru链的闩锁等待,这种等待并不常见,我们见得比较多的是CBC闩锁等待。这个闩锁等待一般来说是DB CACHE不够用的时候才会出现的。在如此小的并发访问下出现此类等待确实是十分罕见的。不过看到排在第三位的free buffer waits以及后面的write complete waits等待心里就有点数了,从这里可以看出是因为DBWR写脏块太慢才导致了free buffer wais,从而引发了LRU链闩锁等待。

  原本想着只要确认了写IO存在性能问题,就基本上可以定位问题在哪了。于是立即查看后台进程的写IO相关的指标。

  没想到写IO的性能指标并无大碍,文件写平均延时3毫秒,日志写平均延时不到1毫秒,按理说这样的写IO性能不会产生如此大的影响。不过从后台进程等待中我们也发现了一些特殊的东西,比如发现当时存在备份相关的等待。因为无法直接得出结论,所以必须继续查看更多的信息。

  从IO情况分析看,确实读写IO都不大,表空间的读写延时也看不出什么问题。

  不过从文件IO情况的汇总信息上还是能看出一些特殊的东西来。

  这套RAC系统居然把数据文件存放在ACFS上了,在11.2.0.4上使用ACFS还是有很多坑的。从这里我们又发现了一条新的线索,是不是因为ACFS的BUG导致了IO性能问题,进而引发了这个问题呢?这就需要日志和TRACE的信息了,在AWR报告里我们是找不到答案的。

  从参数小节里,我们也发现了一些异常,很多配置是来自于Oracle ODA一体机的配置模板,难道这是一台Oracle一体机?另外cpu_count=8也是有些异常的,因为从OS信息可以看出这是一台两路服务器,36核的。难道说这台服务器上还有其他数据库实例?

  这些问题从AWR报告里都是没有的。必须和运维人员沟通才能获得到相关的信息。对于这些问题的不同回答,很可能问题分析的方向也会发生变化。如果这个数据库不是跑在Oracle一体机上的,那么很多参数设置就值得商榷了。如果说这台服务器只有一个实例使用,CPU_COUNT=8就是一个容易引发闩锁问题的设置,而且刚才我们看到的IO负载很小的结论也不存在了。因为我们必须看整个服务器上所有实例的IO负载,才能了解到IO是否存在负载过高的问题,这就需要OSW的数据作为分析的补充了。

  传统的以人为中心的分析往往都是一点点的去采集数据的,而需要实现自动化或者智能化分析,这些数据采集必须能够自动的、高质量的进行,才能让整个分析过程能够顺利的自动化完成。甚至有些数据很可能都无法实现自动化的采集,必须由运维人员手工输入。比如redo是放在SSD上的吗?从REDO的写IO延时上似乎能看到这样的意思。数据文件是存放在SATA HDD还是NVME SSD上的呢?如果是存放在SATA SSD上,那么3毫秒的写延时虽然有点慢,但是还可以接受,如果是NVME SSD,那就说明IO性能下降的很厉害了。

  通过这个案例,我们也可以看出完整的数据对智能化运维的意义。实际上这也是最难说服领导的地方,我曾经和一个客户沟通过建设智能化运维诊断系统。但是客户就不愿意花钱去改造运行指标采集模块,他觉得他们已经用了好几年ZABBIX了,基于ZABBIX采集的数据去做上面的分析应用不就够了,为啥还要再花钱呢?​

  来源: 白鳝的洞穴

  >>>>>>点击进入系统运维专题

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

数据是自动化与智能化的基础

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

数据是自动化与智能化的基础

传统的以人为中心的分析往往都是一点点的去采集数据的,而需要实现自动化或者智能化分析,这些数据采集必须能够自动的、高质量的进行,才能让整个分析过程能够顺利的自动化完成。
数据是自动化与智能化的基础
2024-04-23

SaaS 服务器的未来:智能化与自动化

SaaS 服务器的未来:迈向智能化与自动化
SaaS 服务器的未来:智能化与自动化
2024-02-18

大数据Atlas的自动化和智能化程度如何

大数据Atlas在自动化和智能化方面有很高的程度。它使用先进的技术和算法来自动化数据处理、分析和管理过程,从而提高工作效率和准确性。同时,Atlas还具有智能化的功能,能够根据用户的需求和行为进行智能推荐、优化和预测,帮助用户更好地利用大数
大数据Atlas的自动化和智能化程度如何
2024-03-08

MySQL触发器自动智能化的数据维护

目录触发器介绍触发器的特性触发器语法数据准备创建触发器触发器——执行多个触发语句New Old 操作查看触发器删除触发器总结触发器介绍触发器,就是一种特殊的存储过程。触发器和存储过程一样是一个能够完成特定功能、存储
2022-07-11

golang函数性能优化与自动化

优化 go 函数性能至关重要,本文提供几种有效技术:使用缓存存储重复计算结果使用 goroutine 并发执行独立任务避免不必要的内存分配通过使用 pprof 工具分析并优化函数性能,可以提高应用程序的响应速度和可扩展性。Go 函数性能优化
golang函数性能优化与自动化
2024-04-27

数据库同步的未来趋势:自动化、智能化和预测性分析

数据库同步正在经历一场转型,自动化、智能化和预测性分析等趋势正在重塑这一关键流程,以满足现代应用程序的需求。
数据库同步的未来趋势:自动化、智能化和预测性分析
2024-02-29

人工智能自动化的十大好处

编程学习网:机器人流程自动化(RPA)的核心好处是可以自动执行许多关键业务,从而使企业员工腾出时间专注于需要人工判断的高价值任务。
人工智能自动化的十大好处
2024-04-23

人工智能自动化的发展展望

编程学习网:随着企业致力于提高效率,通常认为采用新技术就可以解决所有问题。但是,不应低估人员与技术之间的相互依赖性。企业必须在两者之间取得适当的平衡。
人工智能自动化的发展展望
2024-04-23

财务数字化与智能化的主要区别是什么

随着科技的发展,财务领域也在逐渐走向数字化和智能化。然而,许多人对于这两个概念的区别不太清楚。本文将详细探讨财务数字化与智能化的主要区别。财务数字化是指将传统财务业务流程通过数字技术进行改造和升级,以实现数据的自动化处理和智能化分析。这包括了财务信息的采集、存储、处理、分析、决策等各个环节。财务数字化的目标是通过
财务数字化与智能化的主要区别是什么
2023-11-09

人工智能将数据转化为行动

编程学习网:医疗保健可能是人工智能对我们日常生活影响最大的领域之一。尽管如此,我们才刚刚开始了解人工智能在医疗服务方面的作用。
人工智能将数据转化为行动
2024-04-23

Win8窗口智能化缩放就是让半自动化的窗口缩放

不少朋友知道Win7有一项有趣的功能,就是可以让半自动化的窗口缩放。Win8继承了这项功能,不过由于大部分朋友使用触屏操作,并没有发现。下面为大家简单说说Win8窗口智能化缩放。 我们在打开一个窗口之后,用户只要把窗口拖到屏幕最上方,窗口就
2023-06-06

MySQL插入锁与数据库性能调优的自动化

MySQL插入锁是一种锁机制,用于在执行INSERT操作时保护数据的完整性。在MySQL中,插入锁会锁定整个表,以确保在插入数据时不会发生并发冲突。对于数据库性能调优的自动化,可以通过使用MySQL的性能调优工具和脚本来实现。这些工具和脚
MySQL插入锁与数据库性能调优的自动化
2024-08-14

PHP学习笔记:智能机器人与自动化控制

引言:在现代科技日益发达的时代,智能机器人的应用越来越广泛。PHP作为一种功能强大的脚本语言,也可以用于开发智能机器人系统。本篇文章将详细介绍如何使用PHP实现智能机器人的自动化控制。我们将提供具体的代码示例,帮助读者更好地理解和应用这一技
2023-10-21

智能财务基础迈向高效、智能化的财务管理和控制

随着科技的发展,人工智能技术已经渗透到了各个行业,其中,智能财务基础就是其中一个重要的领域。智能财务基础的出现,不仅可以提高财务管理和控制的效率,还可以让财务决策更加科学和准确。本文将从智能财务基础的定义、应用和未来发展方向三个方面,深入探讨这个话题。智能财务基础的定义:智能财务基础,又被称为智能财务管理,是指通
智能财务基础迈向高效、智能化的财务管理和控制
2023-11-17

Spark性能优化的基础是什么

Spark性能优化的基础是什么,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。前言在大数据计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功
2023-06-03

编程热搜

  • 人工智能你要知道的那些事
    编程学习网:早在1g时代我们只能接打电话。2g时代可以打电话发短信,玩早期的qq,但网络十分不稳定。3g时代带给我们很大的改变就是宽带上网,视频通话,看视频,听歌玩游戏。那时的人们认为4g无用,认为不会有什么改变,但当4g出来时我们才发现这是一次质的飞跃。
    人工智能你要知道的那些事
  • 人工智能无人机管制到底有多难?
    编程学习网:近日,一段“重庆网红列车遭无人机撞击逼停”的视频,在网络热传。
    人工智能无人机管制到底有多难?
  • 人工智能与人类
    欢迎各位阅读本篇,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本篇文章讲述了人工智能与人类,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
    人工智能与人类
  • 两小时 Elasticsearch 性能优化,直接把慢查询干团灭了……
    公共集群的机器负载分布不均衡的问题,业务的查询和流量不可控等各种各样的问题,要节省机器资源就一定会面对这种各种各样的问题,除非土豪式做法,每个业务都拥有自己的机器资源,这里面有很多很多颇具技术挑战的事情。
    两小时 Elasticsearch 性能优化,直接把慢查询干团灭了……
  • 关于OpenStack的架构详细讲解
    欢迎各位阅读本篇文章,OpenStack是一个开源的云计算管理平台项目,由几个主要的组件组合起来完成具体工作。本篇文章讲述了关于OpenStack的架构详细讲解,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
    关于OpenStack的架构详细讲解
  • AI &神经网络
    欢迎各位阅读本篇,本篇文章讲述了AI &神经网络,人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。神经网络内容丰富,反映了当前国内外该领域的最新研究成果和动向,编程学习网教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦!
    AI &神经网络
  • 人工智能对于网络安全的优缺点
    编程学习网:如今,产生的数据比以往任何时候都要多。由于数据分析工具的发展,各行各业的组织都更加重视大数据的收集和存储。
    人工智能对于网络安全的优缺点
  • Bash 初学者系列 7:bash 中的条件语句(if else)
    今天我们介绍一下如何在 bash 中使用条件语句。
    Bash 初学者系列 7:bash 中的条件语句(if else)
  • 人工智能机器学习的重要趋势是什么?
    编程学习网:在竞争日益激烈的技术市场中,从高科技初创公司到全球跨国公司都将人工智能视为关键竞争优势。但是,人工智能行业发展如此之快,以至于很难跟踪最新的研究突破和成就,甚至很难应用科学成果来实现业务成果。
    人工智能机器学习的重要趋势是什么?
  • 人工智能为什么会觉得Matplotlib用起来困难?
    编程学习网:Matplotlib是一个流行的Python库,可以很容易地用于创建数据可视化。
    人工智能为什么会觉得Matplotlib用起来困难?

目录