我的编程空间,编程开发者的网络收藏夹
学习永远不晚

更新应用时如何实现K8s中断滚动更新

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

更新应用时如何实现K8s中断滚动更新

本篇文章给大家分享的是有关更新应用时如何实现K8s中断滚动更新,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

Kubernetes 集群中,业务通常采用 Deployment + LoadBalancer 类型 Service 的方式对外提供服务,其典型部署架构如图 1 所示。这种架构部署和运维都十分简单方便,但是在应用更新或者升级时可能会存在服务中断,引发线上问题。今天我们来详细分析下这种架构为何在更新应用时会发生服务中断以及如何避免服务中断。

更新应用时如何实现K8s中断滚动更新
图1 业务部署图

为何会发生服务中断

Deployment 滚动更新时会先创建新 pod,等待新 pod running 后再删除旧 pod。

新建 Pod

更新应用时如何实现K8s中断滚动更新
图 2 服务中断示意图

中断原因:Pod running 后被加入到 Endpoint 后端,容器服务监控到 Endpoint 变更后将 Node 加入到 SLB 后端。此时请求从 SLB 转发到 Pod 中,但是 Pod 业务代码还未初始化完毕,无法处理请求,导致服务中断,如图 2 所示。
解决方法:为 pod 配置就绪检测,等待业务代码初始化完毕后后再将 node 加入到 SLB 后端。

删除 Pod

在删除旧 pod 过程中需要对多个对象(如 Endpoint、ipvs/iptables、SLB)进行状态同步,并且这些同步操作是异步执行的,整体同步流程如图 3 所示。

更新应用时如何实现K8s中断滚动更新
图 3 Deployment 更新时序图

Pod

  1. pod 状态变更:将 Pod 设置为 Terminating 状态,并从所有 Service 的 Endpoints 列表中删除。此时,Pod 停止获得新的流量,但在 Pod 中运行的容器不会受到影响;

  2. 执行 preStop Hook:Pod 删除时会触发 preStop Hook,preStop Hook 支持 bash 脚本、TCP 或 HTTP 请求;

  3. 发送 SIGTERM 信号:向 Pod 中的容器发送 SIGTERM 信号;

  4. 等待指定的时间:terminationGracePeriodSeconds 字段用于控制等待时间,默认值为 30 秒。该步骤与 preStop Hook 同时执行,因此 terminationGracePeriodSeconds 需要大于 preStop 的时间,否则会出现 preStop 未执行完毕,pod 就被 kill 的情况;

  5. 发送 SIGKILL 信号:等待指定时间后,向 pod 中的容器发送 SIGKILL 信号,删除 pod。

中断原因:上述 1、2、3、4步骤同时进行,因此有可能存在 Pod 收到 SIGTERM 信号并且停止工作后,还未从 Endpoints 中移除的情况。此时,请求从 slb 转发到 pod 中,而 Pod 已经停止工作,因此会出现服务中断,如图 4 所示。

更新应用时如何实现K8s中断滚动更新
图 4 服务中断示意图

解决方法:为 pod 配置 preStop Hook,使 Pod 收到 SIGTERM 时 sleep 一段时间而不是立刻停止工作,从而确保从 SLB 转发的流量还可以继续被 Pod 处理。

iptables/ipvs

中断原因:当 pod 变为 termintaing 状态时,会从所有 service 的 endpoint 中移除该 pod。kube-proxy 会清理对应的 iptables/ipvs 条目。而容器服务 watch 到 endpoint 变化后,会调用 slb openapi 移除后端,此操作会耗费几秒。由于这两个操作是同时进行,因此有可能存在节点上的 iptables/ipvs 条目已经被清理,但是节点还未从 slb 移除的情况。此时,流量从 slb 流入,而节点上已经没有对应的 iptables/ipvs 规则导致服务中断,如图 5 所示。

更新应用时如何实现K8s中断滚动更新
图 5 服务中断示意图

解决方法

  • Cluster 模式:Cluster 模式下 kube-proxy 会把所有业务 Pod 写入 Node 的 iptables/ipvs 中,如果当前 Node 没有业务 pod,则该请求会被转发给其他 Node,因此不会存在服务中断,如 6 所示;

更新应用时如何实现K8s中断滚动更新
图 6 Cluster 模式请求转发示意图

  • Local 模式:Local 模式下,kube-proxy 仅会把 Node 上的 pod 写入 iptables/ipvs。当 Node 上只有一个 pod 且状态变为 terminating 时,iptables/ipvs 会将该 pod 记录移除。此时请求转发到这个 node 时,无对应的 iptables/ipvs 记录,导致请求失败。这个问题可以通过原地升级来避免,即保证更新过程中 Node 上至少有一个 Running Pod。原地升级可以保障 Node 的 iptables/ipvs 中总会有一条业务 pod 记录,因此不会产生服务中断,如图 7 所示;

更新应用时如何实现K8s中断滚动更新
图 7 Local 模式原地升级时请求转发示意图

  • ENI 模式 Service:ENI 模式绕过 kube-proxy,将 Pod 直接挂载到 SLB 后端,因此不存在因为 iptables/ipvs 导致的服务中断。

更新应用时如何实现K8s中断滚动更新
图 8  ENI 模式请求转发示意图

SLB

更新应用时如何实现K8s中断滚动更新
图 9  服务中断示意图

中断原因:容器服务监控到 Endpoints 变化后,会将 Node 从 slb 后端移除。当节点从 slb 后端移除后,SLB 对于继续发往该节点的长连接会直接断开,导致服务中断。
解决方法:为 SLB 设置长链接优雅中断(依赖具体云厂商)。

如何避免服务中断

避免服务中断可以从 Pod 和 Service 两类资源入手,接下来将针对上述中断原因介绍相应的配置方法。

Pod 配置

apiVersion: v1kind: Podmetadata:  name: nginx  namespace: defaultspec:  containers:  - name: nginx    image: nginx    # 存活检测    livenessProbe:      failureThreshold: 3      initialDelaySeconds: 30      periodSeconds: 30      successThreshold: 1      tcpSocket:        port: 5084      timeoutSeconds: 1    # 就绪检测    readinessProbe:      failureThreshold: 3      initialDelaySeconds: 30      periodSeconds: 30      successThreshold: 1      tcpSocket:        port: 5084      timeoutSeconds: 1    # 优雅退出    lifecycle:       preStop:         exec:           command:           - sleep          - 30  terminationGracePeriodSeconds: 60

注意:需要合理设置就绪检测(readinessProbe)的探测频率、延时时间、不健康阈值等数据,部分应用启动时间本身较长,如果设置的时间过短,会导致 POD 反复重启。

  • livenessProbe 为存活检测,如果失败次数到达阈值(failureThreshold)后,pod 会重启,具体配置见官方文档;

  • readinessProbe 为就绪检查,只有就绪检查通过后,pod 才会被加入到 Endpoint 中。容器服务监控到 Endpoint 变化后才会将 node 挂载到 slb 后端;

  • preStop 时间建议设置为业务处理完所有剩余请求所需的时间,terminationGracePeriodSeconds 时间建议设置为 preStop 的时间再加 30 秒以上。

Service 配置

Cluster 模式(externalTrafficPolicy: Cluster)

apiVersion: v1kind: Servicemetadata:  name: nginx  namespace: defaultspec:  externalTrafficPolicy: Cluster  ports:  - port: 80    protocol: TCP    targetPort: 80  selector:    run: nginx  type: LoadBalancer

容器服务会将集群中所有节点挂载到 SLB 的后端(使用 BackendLabel 标签配置后端的除外),因此会快速消耗 SLB quota。SLB 限制了每个 ECS 上能够挂载的 SLB 的个数,默认值为 50,当 quota 消耗完后会导致无法创建新的监听及 SLB。

Cluster 模式下,如果当前节点没有业务 pod 会将请求转发给其他 Node。在跨节点转发时需要做 NAT,因此会丢失源 IP。

Local 模式(externalTrafficPolicy: Local)

apiVersion: v1kind: Servicemetadata:  name: nginx  namespace: defaultspec:  externalTrafficPolicy: Local  ports:  - port: 80    protocol: TCP    targetPort: 80  selector:    run: nginx  type: LoadBalancer# 需要尽可能的让每个节点在更新的过程中有至少一个的Running的Pod# 通过修改UpdateStrategy和利用nodeAffinity尽可能的保证在原地rolling update# * UpdateStrategy可以设置Max Unavailable为0,保证有新的Pod启动后才停止之前的pod# * 先对固定的几个节点打上label用来调度# * 使用nodeAffinity+和超过相关node数量的replicas数量保证尽可能在原地建新的Pod# 例如:apiVersion: apps/v1kind: Deployment......strategy:  rollingUpdate:    maxSurge: 50%    maxUnavailable: 0%  type: RollingUpdate......    affinity:      nodeAffinity:          preferredDuringSchedulingIgnoredDuringExecution:        - weight: 1          preference:              matchExpressions:            - key: deploy              operator: In              values:              - nginx

容器服务默认会将 Service 对应的 Pod 所在的节点加入到 SLB 后端,因此 SLB quota 消耗较慢。Local 模式下请求直接转发到 pod 所在 node,不存在跨节点转发,因此可以保留源 IP 地址。Local 模式下可以通过原地升级的方式避免服务中断,yaml 文件如上。

ENI 模式(阿里云特有模式)

apiVersion: v1kind: Servicemetadata:  annotations:    service.beta.kubernetes.io/backend-type: "eni"  name: nginxspec:  ports:  - name: http    port: 30080    protocol: TCP    targetPort: 80  selector:    app: nginx  type: LoadBalancer

Terway 网络模式下,通过设置 service.beta.kubernetes.io/backend-type:
“eni” annotation 可以创建 ENI 模式的 SLB。ENI 模式下,pod会直接挂载到 SLB 后端,不经过 kube-proxy,因此不存在服务中断的问题。请求直接转发到 pod,因此可以保留源 IP 地址。

三种 svc 模式对比如下表所示。

更新应用时如何实现K8s中断滚动更新
图 10 Service 对比

结论

Terway 网络模式 (推荐方式)

选用 ENI 模式的 svc + 设定 Pod 优雅终止 + 就绪检测。

Flannel 网络模式  

  • 如果集群中 slb 数量不多且不需要保留源 ip:选用 cluster 模式 + 设定 Pod 优雅终止 + 就绪检测;

  • 如果集群中 slb 数量较多或需要保留源 ip:选用 local 模式 + 设定 Pod 优雅终止 + 就绪检测 + 原地升级(保证更新过程中每个节点上至少有一个 Running Pod)。

以上就是更新应用时如何实现K8s中断滚动更新,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注编程网行业资讯频道。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

更新应用时如何实现K8s中断滚动更新

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

更新应用时如何实现K8s中断滚动更新

本篇文章给大家分享的是有关更新应用时如何实现K8s中断滚动更新,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。Kubernetes 集群中,业务通常采用 Deployment +
2023-06-04

ElasticSearch的滚动更新在Python中如何实现?(Python环境下,ElasticSearch滚动更新的实现步骤?)

Elasticsearch滚动更新允许在不中断服务的情况下更新集群。在Python中实现滚动更新的步骤包括:初始化Elasticsearch客户端。创建索引模板,定义新索引的设置和映射。创建新索引,使用模板中的设置和映射。重新索引数据,将数据从旧索引转移到新索引。交换别名,使应用程序使用新索引。删除旧索引。重复步骤3-6更新其他索引分片。注意:在重新索引期间,确保源索引和目标索引的映射兼容,并监控滚动更新过程,以确保顺利进行。
ElasticSearch的滚动更新在Python中如何实现?(Python环境下,ElasticSearch滚动更新的实现步骤?)
2024-04-02

Uniapp应用程序中如何实现自动更新

随着移动应用的快速发展,每天都有数百万的应用程序从各种应用商店推出。由于安全问题和漏洞,无法保障应用的运行稳定性。为了解决这些问题,开发人员必须经常更新他们的应用程序。这就是为什么我们要实现自动更新的原因之一。Uniapp是个多端的开发框架,开发者只需要编写一次代码,其就可以同时在多个平台上运行。这种跨平台的开发框架对开发者来说是相当有价值的。然而,当我们使用Uniapp开发应
2023-05-14

Sphinx搜索的滚动索引更新与重建(Sphinx如何实现索引的滚动更新和重建?)

Sphinx搜索支持滚动索引更新,可逐步更新索引而不中断实时搜索。它通过使用主索引和增量索引实现,可以在不重建整个索引的情况下添加或删除文档。滚动更新有利于节省资源并避免中断,但可能导致碎片化。重建索引涉及创建新索引,重新索引所有文档,提高查询性能并修复损坏。缺点是耗时且会中断搜索。滚动更新和重建各有权衡,可根据应用程序要求选择最合适的更新策略。
Sphinx搜索的滚动索引更新与重建(Sphinx如何实现索引的滚动更新和重建?)
2024-04-02

PostgreSQL如何实现自动更新时间戳

这篇文章主要介绍PostgreSQL如何实现自动更新时间戳,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!什么是PostgreSQL时间戳数据类型?在PostgreSQL中,下一个数据类型是 TIMESTAMP ,它可
2023-06-21

ASP.NET中怎么实现静态网站滚动更新

这期内容当中小编将会给大家带来有关ASP.NET中怎么实现静态网站滚动更新,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。Intro最近我们老板想让我实现一个静态网站“滚动更新”的功能,其实就是希望网站部署
2023-06-20

Linux系统如何实现自动更新时间

这篇文章主要介绍“Linux系统如何实现自动更新时间”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Linux系统如何实现自动更新时间”文章能帮助大家解决问题。安装NTP客户端 yum -y inst
2023-06-28

MySQL中创建时间和更新时间的自动更新的实现示例

目录一、需求二、方案创建时间(创建日期)、修改时间(修改日期)设置为自动生成创建日期的自动生成更新日期的自动生成一、需求当新增记录的时候,mysql自动将系统的当前时间 set 到创建时间和更新时间这两个字段中。当更新记录的时候,MyS
2022-07-14

Android如何实现APP自动更新

先来看看要实现的效果图:对于安卓用户来说,手机应用市场说满天飞可是一点都不夸张,比如小米,魅族,百度,360,机锋,应用宝等等,当我们想上线一款新版本APP时,先不说渠道打包的麻烦,单纯指上传APP到各大应用市场的工作量就已经很大了,好不容
2022-06-06

jquery php如何实现实时数据更新

jquery php实现实时数据更新的方法:1、创建数据表;2、通过创建服务器文件“demo.php”连接数据库并进行相关操作;3、创建显示数据的“fresh.html”网页即可。
2019-01-12

Elasticsearch分布式搜索中的滚动更新与索引重建(Elasticsearch如何进行滚动更新和索引重建?)

滚动更新和索引重建是Elasticsearch管理分布式搜索集群中的索引更改的两种策略。滚动更新涉及逐步更新索引分片,在更新过程中保持集群可用。它适用于需要无停机时间、可扩展性和可靠性的场景。索引重建涉及一次性创建和重建新索引。它更简单、更快,并确保数据一致性。但是,它会导致停机时间和数据丢失风险。选择最合适的策略取决于特定用例的需求,例如停机时间、可扩展性、可靠性、简单性、性能和数据一致性。
Elasticsearch分布式搜索中的滚动更新与索引重建(Elasticsearch如何进行滚动更新和索引重建?)
2024-04-02

如何关闭Windows 8.1应用自动更新

Windows 8.1系统支持应用自动更新,不过有些朋友也许并不需要每个应用都被Windows 8.1自作主张的自动更新。其实我们可以轻松将Windows 8.1系统中的自动应用更新状态设置为关闭,回到应用手动更新状态,这样可以更加自主灵活
2022-06-04

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录