K8S运维必备排查方式-node相关问题及排查
  fDBNhYMB4RoJ 2023年11月13日 24 0

排查 Kubernetes 问题需要有一定的经验和技巧。在实际使用过程中,可以通过学习和实践来积累经验,并结合官方文档和社区资源进行学习和交流。同时,也可以考虑采用监控和日志系统等第三方工具来帮助进行排查和预警。这样可以更好地保障应用程序的稳定性和可靠性,为业务的顺利运行提供有力保障。

1、Node 状态异常,如何排查?

(1)使用 kubectl get nodes命令查看集群中所有节点的状态和信息,判断是否存在故障。
(2)使用 kubectl describe node [node_name] 命令查看目标节点的详细信息,包括 CPU、内存、磁盘等硬件资源的使用情况,判断是否存在性能瓶颈。
(3)使用 kubectl get pods -o wide --all-namespaces 命令查看集群中所有 Pod 的状态信息,判断是否有 Pod 运行在目标节点上导致资源紧张。

2、Node 上运行的 Pod 无法访问网络,如何排查?

(1)使用 kubectl describe node [node_name] 命令查看目标节点的信息,检查节点是否正常连接到网络。
(2)使用 kubectl describe pod [pod_name] -n [namespace_name] 命令查看 Pod 所运行的节点信息,判断是否因为节点状态异常导致网络访问失败。
(3)使用 kubectl logs [pod_name] -n [namespace_name] 命令查看 Pod 容器的日志信息,寻找可能的错误或异常信息。

3、Node 上的 Pod 无法访问存储,如何排查?

(1)使用 kubectl describe pod [pod_name] -n [namespace_name] 命令检查 Pod 的 volumes 配置信息,判断是否存在存储挂载失败的情况。

(2)使用 kubectl exec -it [pod_name] -n [namespace_name] -- /bin/bash 命令进入 Pod 所在的容器,尝试使用 ls 和 cat 等命令访问挂载的文件系统,判断是否存在读写错误。
(3)使用kubectl describe persistentvolumeclaim [pvc_name] -n [namespace_name] 命令查看相关 PVC 配置和状态信息,判断是否存在故障。

4、存储卷挂载失败,如何处理?

(1)使用 kubectl describe pod [pod_name] -n [namespace_name] 命令检查 Pod 的 volumes 配置信息,判断是否存在存储卷定义错误。
(2)使用 kubectl describe persistentvolumeclaim [pvc_name] -n [namespace_name] 命令检查 PVC 的状态和信息,判断是否存在存储配额不足或存储资源故障等原因。
(3)如果是 NFS 或 Ceph 等网络存储,需要确认网络连接是否正常,以及存储服务器的服务是否正常。

5、Node 节点加入 Kubernetes 集群后无法被调度,怎么办?

(1)检查该节点的 taints 和 tolerations 是否与 Pod 的 selector 匹配
(2)检查该节点的资源使用情况是否满足 Pod 的调度要求
(3)确保该节点与 Kubernetes API server 的连接正常

6、Kubernetes 集群中的 PersistentVolume 挂载失败,怎么办?

(1)检查 PersistentVolume 和 Pod 之间的匹配关系是否正确
(2)检查 PersistentVolumeClaim 中的 storageClassName 是否与 PersistentVolume 的 storageClassName 匹配
(3)检查节点存储配置和 PersistentVolume 的定义是否正确
(4)自动供给层面的权限是否已经给到位
【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月13日 0

暂无评论

推荐阅读
  uvM09mQNI0hF   2023年11月19日   19   0   0 promtaillokik8s
  cO5zyEmh8RH6   2023年12月09日   17   0   0 k8s证书