我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Kubernetes中Nginx服务启动失败如何排查

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Kubernetes中Nginx服务启动失败如何排查

这篇文章主要介绍“Kubernetes中Nginx服务启动失败如何排查”,在日常操作中,相信很多人在Kubernetes中Nginx服务启动失败如何排查问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Kubernetes中Nginx服务启动失败如何排查”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

❌pod节点启动失败,nginx服务无法正常访问,服务状态显示为ImagePullBackOff

[root@m1 ~]# kubectl get podsNAME                    READY   STATUS             RESTARTS   AGEnginx-f89759699-cgjgp   0/1     ImagePullBackOff   0          103m

查看nginx服务的Pod节点详细信息。

[root@m1 ~]# kubectl describe pod nginx-f89759699-cgjgpName:             nginx-f89759699-cgjgpNamespace:        defaultPriority:         0Service Account:  defaultNode:             n1/192.168.200.84Start Time:       Fri, 10 Mar 2023 08:40:33 +0800Labels:           app=nginx                  pod-template-hash=f89759699Annotations:      <none>Status:           PendingIP:               10.244.3.20IPs:  IP:           10.244.3.20Controlled By:  ReplicaSet/nginx-f89759699Containers:  nginx:    Container ID:       Image:          nginx    Image ID:           Port:           <none>    Host Port:      <none>    State:          Waiting      Reason:       ImagePullBackOff    Ready:          False    Restart Count:  0    Environment:    <none>    Mounts:      /var/run/secrets/kubernetes.io/serviceaccount from default-token-zk8sj (ro)Conditions:  Type              Status  Initialized       True   Ready             False   ContainersReady   False   PodScheduled      True Volumes:  default-token-zk8sj:    Type:        Secret (a volume populated by a Secret)    SecretName:  default-token-zk8sj    Optional:    falseQoS Class:       BestEffortNode-Selectors:  <none>Tolerations:     node.kubernetes.io/not-ready:NoExecute op=Exists for 300s                 node.kubernetes.io/unreachable:NoExecute op=Exists for 300sEvents:  Type     Reason   Age                     From     Message  ----     ------   ----                    ----     -------  Normal   BackOff  57m (x179 over 100m)    kubelet  Back-off pulling image "nginx"  Normal   Pulling  7m33s (x22 over 100m)   kubelet  Pulling image "nginx"  Warning  Failed   2m30s (x417 over 100m)  kubelet  Error: ImagePullBackOff

发现,获取nginx镜像失败。可能是由于Docker服务引起的。

于是,检查Docker是否正常启动

systemctl status docker

发现,docker服务启动失败????,手动尝试重新启动。

systemctl restart docker

但是,重启docker服务失败,出现如下报错信息。

[root@m1 ~]# systemctl restart dockerJob for docker.service failed because the control process exited with error code.See "systemctl status docker.service" and "journalctl -xe" for details.

执行systemctl restart docker命令失效。

接着,当执行docker version命令时,发现未能连接到Docker daemon

[root@m1 ~]# docker versionClient: Docker Engine - Community Version:           20.10.17 API version:       1.41 Go version:        go1.17.11 Git commit:        100c701 Built:             Mon Jun  6 23:03:11 2022 OS/Arch:           linux/amd64 Context:           default Experimental:      trueCannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?

于是,再次通过执行systemctl status docker命令,查看docker服务未能启动,阅读输出报错信息,如下所示。

[root@m1 ~]# systemctl status docker● docker.service - Docker Application Container Engine   Loaded: loaded (/usr/lib/systemd/system/docker.service; enabled; vendor preset: disabled)   Active: failed (Result: exit-code) since Fri 2023-03-10 10:28:16 CST; 4min 35s ago     Docs: https://docs.docker.com Main PID: 2221 (code=exited, status=1/FAILURE)Mar 10 10:28:13 m1 systemd[1]: docker.service: Main process exited, code=exited, status=1/FAILUREMar 10 10:28:13 m1 systemd[1]: docker.service: Failed with result 'exit-code'.Mar 10 10:28:13 m1 systemd[1]: Failed to start Docker Application Container Engine.Mar 10 10:28:16 m1 systemd[1]: docker.service: Service RestartSec=2s expired, scheduling restart.Mar 10 10:28:16 m1 systemd[1]: docker.service: Scheduled restart job, restart counter is at 3.Mar 10 10:28:16 m1 systemd[1]: Stopped Docker Application Container Engine.Mar 10 10:28:16 m1 systemd[1]: docker.service: Start request repeated too quickly.Mar 10 10:28:16 m1 systemd[1]: docker.service: Failed with result 'exit-code'.Mar 10 10:28:16 m1 systemd[1]: Failed to start Docker Application Container Engine.[root@m1 ~]#

通过上述输出显示,Docker 服务进程的启动失败,状态为 1/FAILURE

✅接下来,尝试通过以下步骤来排查和解决问题:

1️⃣查看 Docker 服务日志:使用以下命令查看 Docker 服务日志,以便更详细地了解失败原因。

sudo journalctl -u docker.service

Kubernetes中Nginx服务启动失败如何排查

2️⃣ 通过输出Ddocker日志分析,提取到了相关报错信息片段,发现是配置daemon中的/etc/docker/daemon.json配置文件出错导致的。

Mar 10 10:20:17 m1 systemd[1]: Starting Docker Application Container Engine...Mar 10 10:20:17 m1 dockerd[1572]: unable to configure the Docker daemon with file /etc/docker/daemon.json: invalid character '"' after object key:value pairMar 10 10:20:17 m1 systemd[1]: docker.service: Main process exited, code=exited, status=1/FAILUREMar 10 10:20:17 m1 systemd[1]: docker.service: Failed with result 'exit-code'.Mar 10 10:20:17 m1 systemd[1]: Failed to start Docker Application Container Engine.Mar 10 10:20:19 m1 systemd[1]: docker.service: Service RestartSec=2s expired, scheduling restart.Mar 10 10:20:19 m1 systemd[1]: docker.service: Scheduled restart job, restart counter is at 2.Mar 10 10:20:19 m1 systemd[1]: Stopped Docker Application Container Engine.

3️⃣此时,查看daemon配置文件/etc/docker/daemon.json是否配置正确。

[root@m1 ~]# cat /etc/docker/daemon.json{  # 设置 Docker 镜像的注册表镜像源为阿里云镜像源。  "registry-mirrors": ["https://w2kavmmf.mirror.aliyuncs.com"]  # 指定 Docker 守护进程使用 systemd 作为 cgroup driver。  "exec-opts": ["native.cgroupdriver=systemd"]}

咋一看,配置信息没有什么问题,都是正确的,但仔细一看,就会发现应该在"registry-mirrors"选项的结尾添加逗号。犯了缺少逗号(,)导致的语法错误,终于找到了问题根源。

修改后:

[root@m1 ~]# cat /etc/docker/daemon.json{  "registry-mirrors": ["https://w2kavmmf.mirror.aliyuncs.com"],  "exec-opts": ["native.cgroupdriver=systemd"]}[root@m1 ~]# cat /etc/docker/daemon.json{  "registry-mirrors": ["https://w2kavmmf.mirror.aliyuncs.com"],  "exec-opts": ["native.cgroupdriver=systemd"]}

按下:wq报错退出。

4️⃣ 重新加载系统并重新启动Docker服务

systemctl daemon-reloadsystemctl restart dockersystemctl status docker

5️⃣检查docker版本信息是否输出正常

[root@m1 ~]# docket version-bash: docket: command not found[root@m1 ~]# docker versionClient: Docker Engine - Community Version:           20.10.17 API version:       1.41 Go version:        go1.17.11 Git commit:        100c701 Built:             Mon Jun  6 23:03:11 2022 OS/Arch:           linux/amd64 Context:           default Experimental:      trueServer: Docker Engine - Community Engine:  Version:          20.10.17  API version:      1.41 (minimum version 1.12)  Go version:       go1.17.11  Git commit:       a89b842  Built:            Mon Jun  6 23:01:29 2022  OS/Arch:          linux/amd64  Experimental:     false containerd:  Version:          1.6.6  GitCommit:        10c12954828e7c7c9b6e0ea9b0c02b01407d3ae1 runc:  Version:          1.1.2  GitCommit:        v1.1.2-0-ga916309 docker-init:  Version:          0.19.0  GitCommit:        de40ad0
[root@m1 ~]# docker infoClient: Context:    default Debug Mode: false Plugins:  app: Docker App (Docker Inc., v0.9.1-beta3)  buildx: Docker Buildx (Docker Inc., v0.8.2-docker)  scan: Docker Scan (Docker Inc., v0.17.0)Server: Containers: 20  Running: 8  Paused: 0  Stopped: 12 Images: 20 Server Version: 20.10.17 Storage Driver: overlay2  Backing Filesystem: xfs  Supports d_type: true  Native Overlay Diff: true  userxattr: false Logging Driver: json-file Cgroup Driver: systemd Cgroup Version: 1 Plugins:  Volume: local  Network: bridge host ipvlan macvlan null overlay  Log: awslogs fluentd gcplogs gelf journald json-file local logentries splunk syslog Swarm: inactive Runtimes: io.containerd.runc.v2 io.containerd.runtime.v1.linux runc Default Runtime: runc Init Binary: docker-init containerd version: 10c12954828e7c7c9b6e0ea9b0c02b01407d3ae1 runc version: v1.1.2-0-ga916309 init version: de40ad0 Security Options:  seccomp   Profile: default Kernel Version: 4.18.0-372.9.1.el8.x86_64 Operating System: Rocky Linux 8.6 (Green Obsidian) OSType: linux Architecture: x86_64 CPUs: 2 Total Memory: 9.711GiB Name: m1 ID: 4YIS:FHSB:YXRI:CED5:PJSJ:EAS2:BCR3:GJJF:FDPK:EDJH:DVKU:AIYJ Docker Root Dir: /var/lib/docker Debug Mode: false Registry: https://index.docker.io/v1/ Labels: Experimental: false Insecure Registries:  127.0.0.0/8 Registry Mirrors:  https://w2kavmmf.mirror.aliyuncs.com/ Live Restore Enabled: false

至此,Docker服务重启成功,pod节点恢复正常,Nginx服务能够正常访问。

[root@m1 ~]# kubectl get podsNAME                    READY   STATUS    RESTARTS   AGEnginx-f89759699-cgjgp   1/1     Running   0          174m

查看pod详细信息,显示正常。

[root@m1 ~]# kubectl describe pod nginx-f89759699-cgjgpName:             nginx-f89759699-cgjgpNamespace:        defaultPriority:         0Service Account:  defaultNode:             n1/192.168.200.84Start Time:       Fri, 10 Mar 2023 08:40:33 +0800Labels:           app=nginx                  pod-template-hash=f89759699Annotations:      <none>Status:           RunningIP:               10.244.3.20IPs:  IP:           10.244.3.20Controlled By:  ReplicaSet/nginx-f89759699Containers:  nginx:    Container ID:   docker://88bdc2bfa592f60bf99bac2125b0adae005118ae8f2f271225245f20b7cfb3c8    Image:          nginx    Image ID:       docker-pullable://nginx@sha256:aa0afebbb3cfa473099a62c4b32e9b3fb73ed23f2a75a65ce1d4b4f55a5c2ef2    Port:           <none>    Host Port:      <none>    State:          Running      Started:      Fri, 10 Mar 2023 10:37:42 +0800    Ready:          True    Restart Count:  0    Environment:    <none>    Mounts:      /var/run/secrets/kubernetes.io/serviceaccount from default-token-zk8sj (ro)Conditions:  Type              Status  Initialized       True   Ready             True   ContainersReady   True   PodScheduled      True Volumes:  default-token-zk8sj:    Type:        Secret (a volume populated by a Secret)    SecretName:  default-token-zk8sj    Optional:    falseQoS Class:       BestEffortNode-Selectors:  <none>Tolerations:     node.kubernetes.io/not-ready:NoExecute op=Exists for 300s                 node.kubernetes.io/unreachable:NoExecute op=Exists for 300sEvents:  Type    Reason   Age                   From     Message  ----    ------   ----                  ----     -------  Normal  BackOff  58m (x480 over 171m)  kubelet  Back-off pulling image "nginx"[root@m1 ~]#

Kubernetes中Nginx服务启动失败如何排查

到此,关于“Kubernetes中Nginx服务启动失败如何排查”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Kubernetes中Nginx服务启动失败如何排查

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Kubernetes中Nginx服务启动失败如何排查

这篇文章主要介绍“Kubernetes中Nginx服务启动失败如何排查”,在日常操作中,相信很多人在Kubernetes中Nginx服务启动失败如何排查问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Kuber
2023-07-05

Kubernetes中Nginx服务启动失败排查流程分析(Error: ImagePullBackOff)

这篇文章主要介绍了Kubernetes中Nginx服务启动失败排查流程(Error: ImagePullBackOff),本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2023-03-14

nginx启动失败如何解决

这篇文章主要介绍了nginx启动失败如何解决的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇nginx启动失败如何解决文章都会有所收获,下面我们一起来看看吧。操作首先nginx不是自己部署,要先启动一下docke
2023-06-29

mysql服务启动失败如何解决

当MySQL服务启动失败时,可能有多种原因。以下是一些常见的解决方法:检查MySQL的错误日志,通常位于MySQL安装目录的data文件夹下。查看错误日志可以帮助确定问题的具体原因。确保MySQL的配置文件正确配置。检查my.cnf或my.
mysql服务启动失败如何解决
2024-04-09

mysql服务启动失败1067如何解决

MySQL服务启动失败1067错误通常是由于MySQL配置文件中的错误或者MySQL安装文件损坏导致的。以下是一些解决方法:检查MySQL配置文件:确保MySQL配置文件(通常是my.ini或my.cnf)中的参数设置正确。特别是检查dat
mysql服务启动失败1067如何解决
2024-05-06

启动SQL服务器失败如何解决

启动 SQL 服务器失败可能有多种原因,您可以尝试以下方法来解决问题:检查 SQL 服务器的日志文件,查看是否有任何错误消息或警告信息,以确定问题的具体原因。确保 SQL 服务器的服务已经正确安装并且正在运行。您可以通过服务管理器或者命令行
启动SQL服务器失败如何解决
2024-04-28

win7启动ICS服务失败如何解决

如果您在Windows 7上启动ICS(Internet Connection Sharing)服务失败,可以尝试以下方法来解决问题:1. 检查服务是否已启用:按下Win + R键,输入"services.msc"并按Enter键打开"Se
2023-08-26

pm2启动node服务失败如何解决

这篇文章主要介绍“pm2启动node服务失败如何解决”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“pm2启动node服务失败如何解决”文章能帮助大家解决问题。pm2启动node服务失败的解决办法:1
2023-07-04

docker容器启动失败如何查看日志

这篇文章主要介绍了docker容器启动失败如何查看日志问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
2023-05-20

Centos6中Varnish启动失败如何解决

这篇文章将为大家详细讲解有关Centos6中Varnish启动失败如何解决,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。Varnish是一款高性能的Web加速器,缓存性能非常好,于是我也学学
2023-06-10

linux中配置vsftpd服务后启动失败如何解决

linux中配置vsftpd服务后启动失败如何解决,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。1、检查vsftpdf服务是否安装成功:rpm -qa|gerp vsft2
2023-06-12

linux如何启动nginx服务

要启动Nginx服务,可以按照以下步骤进行操作:1. 打开终端(Terminal)。2. 使用root权限登录或者切换到root用户。3. 输入以下命令来启动Nginx服务:```systemctl start nginx```或者```s
2023-08-24

在Centos6中启动Varnish失败如何解决

这篇文章给大家介绍在Centos6中启动Varnish失败如何解决,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。代码如下:rpm –nosignature -i https://repo.varnish-c
2023-06-10

服务器上weblogic启动失败异常如何解决

遇到weblogic启动失败的异常,一般可以通过以下几种方式来解决:检查日志:首先查看weblogic的启动日志,看看具体的错误信息是什么,从而确定问题的根本原因。检查配置文件:检查weblogic的配置文件,包括domain配置文件、启动
服务器上weblogic启动失败异常如何解决
2024-04-29

linux开启ssh服务失败如何解决

如果在Linux上开启SSH服务失败,你可以尝试以下解决方法:1. 确认SSH服务是否已经安装:使用命令`sudo apt-get install openssh-server`或者`sudo yum install openssh-ser
2023-08-29

服务器自动重启的原因及如何排查

服务器自动重启的原因可能包括以下几种:硬件问题:可能是服务器硬件出现故障,导致服务器自动重启。软件问题:可能是服务器上的某些软件或驱动程序出现了问题,导致系统崩溃并自动重启。系统更新:有些系统更新可能需要重启服务器来生效。电源问题:可
服务器自动重启的原因及如何排查
2024-04-20

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录