k8s 集群 1.29.8 3master 节点,因为不留神执行了影响 IP 地址的命令,导致控制面雪崩。利用其中一个节点全新重建集群,能否用已有的 etcd 数据库还原之前的资源 pod deployment 等等。
控制平面崩一般是 etcd 问题,不考虑数据丢失的话,原主节点上强制单节点 etcd 启动,集群应该可以恢复。然后删掉不用的主节点,重新加入新的主节点。
我也这样做了,并且单节点上 etcd APIserver 坚持了 10 分钟以上,以为稳了,加入新节点,很快又崩了。搞两天了,学习实验。Ubuntu22.04 用了 netplan 把网搞坏了,然后 cloud init 恢复,接下来就是控制面静态 pod 反复重启。
登录后可发帖和回复
控制平面崩一般是 etcd 问题,不考虑数据丢失的话,原主节点上强制单节点 etcd 启动,集群应该可以恢复。然后删掉不用的主节点,重新加入新的主节点。