GBase8a V862版本节点替换前的准备工作和注意事项

GBase 8a数据库集群在某台服务器彻底故障时,需要通过节点替换操作进行恢复。对新机器的操作系统,配置,当前集群状态等有些要求可以提前准备。

1、新机器的操作系统,特别是数据目录准备好,文件系统做好。

2、集群的event如果很多,要提前清理,因为替换时会清理event,但占用了申请的操作时间。

3、新机器的root密码等,保持和老的集群一致,如果不同,请先修改。 替换完成后再还原。

4、如果系统有长时间运行的DDL语句,请提前结束。避免占用了节点替换的操作时间。

5、在节点替换过程中,如果出现 replace.py 命令故障,比如屏幕被关了,机器断电等,集群如果处于 READONLY 状态,可以使用 gcadmin switchmode normal 恢复集群状态。 故障节点的状态是replace状态,不用管它,可以再次执行 replace.py 命令的。

6、如果节点操作系统都重做了,且使用的是8.6.2Build20 系列老版本,那么请提前在新节点手工建好gbase操作系统用户,因为一些老版本有BUG,会用gbase用户ssh连接来检查磁盘可用空间,而不是root。 8.6.2Build43版本无这个问题。

7、所有调度节点 information_schema.tables表数量必须相同,否则在替换完成最后一步会因为这个原因报错而失败。 select count(*) from information_schema.tables

节点替换过程,请参考

GBase8a MPP Cluster 强制节点离线和节点替换setnodestate

发表评论

您的电子邮箱地址不会被公开。