我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Greenplum--FTS故障检测原理

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Greenplum--FTS故障检测原理

前言

FTS(Fault Tolerance Serve)是GreenPlum中的故障检测服务,是保证GP高可用的核心功能。GreenPlum的Segment的健康检测及HA是由GP Master实现的,GP Master上面有个专门的进程–FTS进程,它可以快速检测到Primary或者Mirror是否挂掉,并及时作出Primary/Mirror 故障切换。

一、FTS架构

GreenPlum的Segment的健康检测及HA是由GP Master实现的,GP Master上面有个专门的进程–FTS进程,它可以快速检测到Primary或者Mirror是否挂掉,并及时作出Primary/Mirror 故障切换。如果FTS挂掉了,Master将会重新fork出来一个FTS进程。
Greenplum--FTS故障检测原理

二、FTS实现原理

GP Master上面的FTS进程每隔60s(时间可以配置)向Primary或者Mirror发送心跳包,Primary和Mirror收到心跳包后返回它们的当前状态,FTS进程心跳包的发送状态和Segment返回状态更新元信息和作出故障切换。因为Segment可能很多,为了加快检测速度,FTS是多线程的,默认16个线程。
Greenplum--FTS故障检测原理

三、Segment检测及故障切换

GP Master首先会检测Primary状态,如果Primary不可连通,那么将会检测Mirror状态,Primary/Mirror状态总共有4种:
Primary活着,Mirror活着。GP Master探测Primary成功之后直接返回,进行下一个Segment检测;
Primary活着,Mirror挂了。GP Master探测Primary成功之后,通过Primary返回的状态得知Mirror挂掉了(Mirror挂掉之后,Primary将会探测到,将自己变成ChangeTracking模式),这时候更新Master元信息,进行下一个Segment检测;
Primary挂了,Mirror活着。GP Master探测Primary失败之后探测Mirror,发现Mirror是活着,这时候更新Master上面的元信息,同时使Mirror接管Primary(故障切换),进行下一个Segment检测;
Primary挂了,Mirror挂了。GP Master探测Primary失败之后探测Mirror,Mirror也是挂了,直到重试最大值,结束这个Segment的探测,也不更新Master元信息了,进行下一个Segment检测。
Greenplum--FTS故障检测原理

四、参数配置

4.1、gp_fts_probe_threadcount

用来故障检测的线程数量,默认为16。

4.2、gp_fts_probe_interval

两次检测的时间间隔,默认为60s。如果一次检测时间使用10s,那么剩余50s将会sleep;如果超过60s,将会直接进入下一次检测。

4.3、gp_fts_probe_timeout

检测Segment超时时间,默认值: 20。

4.4、gp_fts_probe_retries

检测Segment失败重试次数,如果超过这个次数,将会认为当前节点挂掉,默认值: 5。

4.5、gp_segment_connect_timeout

Prmary和Mirror文件同步允许连接Mirror最大超时时间,如果达到这个超时时间,Primary将会认为Mirror挂掉了,默认值: 180s。

五、总结

通过GreenPlum FTS机制学习,可以了解部分MPP架构高可用原理。同时根据自身的业务,合理地配置FTS参数,保障GP高可用。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Greenplum--FTS故障检测原理

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Cassandra中怎么进行故障检测和恢复

Cassandra中的故障检测和恢复是由系统自动处理的,主要通过以下方式进行:Gossip协议:Cassandra使用Gossip协议来维护节点之间的通信和协调。节点会周期性地向其他节点发送心跳信息,以确保它们之间的连接正常。如果节点发现某
Cassandra中怎么进行故障检测和恢复
2024-04-09

Python图像处理之边缘检测原理详解

边缘检测是图像处理和计算机视觉当中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点。本文将通过示例和大家介绍一下边缘检测的原理,希望对大家有所帮助
2022-12-08

微信域名检测原理 批量检测域名是否被微信拦截

本文章由猴子数据专业微信域名检测编写。微信为了维护微信自身的生态环境,通常会做一系列的检测,检测有没有涉及不法产品,有没有诱导分享,检测违规的两个手段:1、系统的自动检测,微信后台自动检测(检测页面内容、关键词、描述和图片,URL、IP、友
2023-06-04

Android LeakCanary检测内存泄露原理是什么

小编给大家分享一下Android LeakCanary检测内存泄露原理是什么,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!以LeakCanary2.6源码分析Le
2023-06-14

微信域名检测原理及防封方案

微信域名检测原理及防封方案最近因为业务需要,在研究微信跳转,域名防封检测等东西,网上搜集了很多很多资料,发现居然这么简单的一点东西 居然有人专门做成系统拿去卖钱.. 系统功能就只是个微信跳转而已,微信跳外部浏览器 或者浏览器跳到微信内..
2023-06-02

Android检测Cursor泄漏的原理以及使用方法

简介: 本文介绍如何在 Android 检测 Cursor 泄漏的原理以及使用方法,还指出几种常见的出错示例。有一些泄漏在代码中难以察觉,但程序长时间运行后必然会出现异常。同时该方法同样适合于其他需要检测资源泄露的情况。最近发现某蔬菜手机连
2022-06-06

win7检测不到网络代理的原因有哪些

有以下几个可能的原因导致Windows 7无法检测到网络代理:1. 代理服务器配置错误:确保代理服务器的地址和端口号正确配置,并且与网络设置匹配。2. 防火墙设置:防火墙可能阻止Windows 7与代理服务器之间的通信。检查防火墙设置,确保
2023-09-07

Kafka3.0.0版本——Follower故障处理细节原理

目录 一、服务器信息二、服务器基本信息及相关概念2.1、服务器基本信息2.2、LEO的概念2.3、HW的概念 三、Follower故障处理细节 一、服务器信息 三台服务器 原始服务器名称原始服务器ip节点cento
2023-08-30

人工智能数据机器学习在故障检测中的应用

编程学习网:本文将简要介绍几种在故障诊断领域广泛应用的机器学习技术及其各自的应用方向,并对每种技术的优缺点进行简单分析。包括:贝叶斯网络(BN),人工神经网络(ANN),支持向量机(SVM)和隐马尔可夫模型(HMM)技术。
人工智能数据机器学习在故障检测中的应用
2024-04-23

高并发微信域名拦截检测接口实现原理

背景出现以下几点,就说明你的域名已经被微信拦截了:1、链接报红:提示已停止访问该网页2、安全提示:提示非官方网页3、安全提示:提示网址包含过多重定向4、拦截提示:请长按复制链接使用浏览器访问微信域名拦截检测技术主要源于域名经常被微信拦截,哪
2023-06-04

编程热搜

目录