linux服务监控及运维
目录
- 一, 安装psutil 包
- 二,找到操作系统中所有的服务的name和pid
- 三,找到需要监控但没有启动的服务
- 四,监控服务,如果没有开启则自动开启,[并发邮件通知工作人员]
一, 安装psutil 包
1.1、安装压缩包:以root身份登陆CentOS依次 执行以下命令:
wget https://pypi.python.org/packages/source/p/psutil/psutil-2.1.3.tar.gz
如果wget 下不下来,则直接在浏览器中复制 粘贴链接https://pypi.python.org/packages/source/p/psutil/psutil-2.1.3.tar.gz 下载下来,用ftp传输工具传输到linux上,然后再进行下面的操作
1.2 解压: tar zxvf psutil-2.1.3.tar.gz
1.3 进入解压完的目录:cd psutil-2.1.3/
1.4 启动安装: python3 setup.py install
1.5 验证: 在命令窗口输入 python3,然后 输入 :
import psutil 不报错,则证明安装 成功
接着输入:
res = psutil.process_iter()
for var in res:
print(var)
则会显示一堆信息
二,找到操作系统中所有的服务的name和pid
import psutil
proc_dict = {}
#ID:进程名
proc_name = set()
#关于进程的集合,集合去重
for p in psutil.process_iter():
proc_dict[p.pid] = p.name()
proc_name.add(p.name())
print(proc_dict)
print('\n\n--------------------------\n')
print(proc_name)
三,找到需要监控但没有启动的服务
proc_stop = monitor_name - proc_name
即:需要监控的服务name 减去 操作系统中所有服务的name
四,监控服务,如果没有开启则自动开启,[并发邮件通知工作人员]
1.使用os.system(命令)启用 服务。
完整代码如下:
import psutil
import os
#如果需要发邮件给通知管理人员可能需要使用 request 和 json
#import request
#import json
import time
time_now = time.strftime('%Y-%m-%d %H:%M:%S',time.localtime())
#要监控的服务
monitor_name = {'nginx'}
#启动命令
monitor_map = {'nginx':'service nginx start'}
while True:
#操作系统中所有进程的字典
proc_dict = {}
#操作系统中所有的进程名集合
proc_name = set()
#psutil.process_iter()会返回操作系统下所有进程名及进程ID
for p in psutil.process_iter():
proc_dict[p.pid] = p.name()
proc_name.add(p.name())
print(proc_dict)
print('\n\n--------------------------\n')
print(proc_name)
# monitor_name - proc_name == died process name
#提取到那个监控进程没有启动
proc_stop = monitor_name - proc_name
print(proc_stop)
if proc_stop:
for p in proc_stop:
p_status = '停止'
p_name = p
data ={p_status,p_name,time_now}
headers = {'Content-Type':'application/json;charset=utf-8'}
#send_data = json.dumps(data).encode('utf-8')
#发邮件给管理人员
#request.post(url=url,data=send_data,headers=headers)
os.system(monitor_map[p])
proc_name = set()
for p2 in psutil.process_iter():
proc_name.add(p2.name())
if p in proc_name:
print("重启成UtrSAIk功")
else:
print("重启失败")
time.sleep(2000)
运行之后的效果:
到此这篇关于linux服务监控及运维的文章就介绍到这了,更多相关linux服务内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341