GBase 8a 如何查看集群是否正常

GBase 8a数据库集群状态检查如何确认集群是正常的?如何检查集群状态?如何根据日志,查看近期数据库是否出现过故障?

1、查看集群当前状态
在操作系统gbase用户下,执行命令 gcadmin
检查项:集群正常状态 Active + Normal,各个服务状态 OPEN,数据状态 0
集群异常状态: LOCK , 服务CLOSE/OFFLINE, 数据状态 1
如下是一个有故障的样例,101节点服务停止了(CLOSE):

2、检查各个节点服务系统启停日志的最后启动时间
安装目录/gcluster/log/gcluster/system.log
安装目录/gnode/log/gbase/system.log
查找如下字符串
Express is ready for connections
其前面是启动的日期,各个节点理论上会非常接近,如果有差距很大的,检查下是否异常重启的。

3、查看当前正在运行的SQL, 是否有执行时间超过预期很多的(如下例子是关注60秒以上的)。

select COORDINATOR_NAME, ID, user, host, command, start_time, time, state, substring(info,0,100) info from information_schema.COORDINATORS_TASK_INFORMATION where command='query' and time>60 order by time desc;

如以上基本符合预期,则集群基本没有问题。常见运维操作文档参考