首页 > 运维 > Linux > etcd问题解决(机房断电后引起)
2024
07-02

etcd问题解决(机房断电后引起)

ETCD参数说明

1、从快照对数据进行恢复

2、通过db文件进行恢复

3、以上数据恢复失败,重新组织新的etcd集群,如下

直接删除数据重新拉起etcd集群(注意集群数据被清理)

启动失败,id已存在

启动etcd

4、查看数据

etcd集群删除与添加成员(适用集群更换或者添加新的节点)

更新一个节点

如果你想更新一个节点的 IP(peerURLS),首先你需要知道那个节点的 ID。你可以列出所有节点,找出对应节点的 ID

在本例中,我们假设要更新 ID 为 a8266ecf031671f3 的节点的 peerURLs 为:http://10.0.1.10:2380

删除一个节点( 假设我们要删除 ID 为 a8266ecf031671f3 的节点 )

执行完后,目标节点会自动停止服务,并且打印一行日志:

如果删除的是 leader 节点,则需要耗费额外的时间重新选举 leader。

增加一个新的节点

增加一个新的节点分为两步:

  • 通过 etcdctl 或对应的 API 注册新节点
  • 使用恰当的参数启动新节点

第一步,假设我们要新加的节点取名为 k8s-master-2, peerURLs 是 http://172.16.10.231:2380

etcdctl 在注册完新节点后,会返回一段提示,包含3个环境变量。然后在第二部启动新节点的时候,带上这3个环境变量即可。

这样,新节点就会运行起来并且加入到已有的集群中了。

错误1【原节点损坏】

错误2 【集群成员被移除】

member add xxxx

错误3 【证书问题】

首先查看总证书和子证书中ip是否都正确

确认证书没问题后看下启动语句是否完全【https基本上证书该有的都要有】

最后编辑:
作者:shooter
这个作者貌似有点懒,什么都没有留下。