南大通用GBase 8a集群扩容注意事项

1、新节点要关闭安全加固,恢复最原始的操作系统状态;关闭防火墙和selinux等安全配置;root密码和老系统保持一致;

2、老集群的操作系统root密码如果非常复杂,或者每个节点不同,建议临时改成统一简单的密码,当然也包括新节点。 扩容完成后,再还原回去;

3、老集群操作系统gbase用户密码,如果安装后做过变动,则需要恢复到最原始安装时的密码。 如果忘记了,可以通过如下的环境变量获得:
/home/gbase/.gbase_profile 文件中 SSH_GBASE_PASSWD的部分,是一个长串的数字,可以通过如下的加密算法进行加密和解密。

[gbase@node1 ~]$ python
Python 2.6.6 (r266:84292, Sep 12 2011, 14:03:14) 
[GCC 4.4.5 20110214 (Red Hat 4.4.5-6)] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import base64
>>> base64.b16encode("gbase")
'6762617365'
>>> base64.b16decode('6762617365');
'gbase'
>>>

对应的b16decode是解密。 如果要改密码,请将新密码加密后,修改【每个】管理节点的如上/home/gbase/.gbase_profile文件中的SSH_GBASE_PASSWD的部分。确保所有节点gbase操作系统用户的密码一致,且和环境变量里的参数一致。

4 、数据库gcluster和gnode的各自gbase数据库下的文件,一般对应
/opt/gcluster/userdata/gcluster/gbase
/opt/gnode/userdata/gbase/gbase
这2个目录的文件总量,如果超过百兆,请确认各个表的数据是否正确,特别是一些日志文件,比如audit_log,generl_log等,提前进行清理。 避免在扩容操作时,如果发生【备份】操作,而导致操作时间极大延长。

5、扩容管理节点时,因为要复制完整的元数据到新节点,其耗时将根据/opt/gcluster/userdata/gcluster/所有文件的大小决定。在某些存在几十万,几百外表的时候,其复制时间可能在几个小时或者更多。

所以,如果你的管理节点已经超过7个,或者你判断已经可以接受的数量,那么建议【只扩容数据节点】。

6、【严重警告】扩容操作时的老集群管理节点,请注意其timeout时间,避免在扩容操作过程中连接断开了。

7、如果扩容过程中发生了意外,比如死机,断电。需要清理或还原环境时,请注意各个节点是否存在正在跑的一些进程。 包括 tar打包, gcadmin cp_coorXXXX.py 调度等。这些进程需要手工kill掉。最终可以用如下的命令检测
ps -ef|grep gc
ps -ef|grep gb
查看存在的进程是否正常,如有扩容有关的打包,备份等等,都手工终止掉。

扩容的详细步骤样例请参考 GBase 8a 扩容操作详细实例